O Oracle Cloud Infrastructure (OCI) Stack Monitoring fornece monitoramento essencial e gerenciamento de alarmes para aplicações e infraestrutura, como hosts, GPUs, bancos de dados e servidores de aplicações.
Elimine silos e obtenha visibilidade completa da integridade dos seus sistemas Oracle E-Business Suite, PeopleSoft e GoldenGate, bem como da infraestrutura, como hosts, GPUs, bancos de dados e servidores de aplicações em execução on-premises ou na nuvem. Amplie o monitoramento para qualquer infraestrutura com integração com Prometheus, collectd ou Telegraf. Monitore qualquer condição particular com métricas personalizadas.
Use modelos de monitoramento para gerenciar todas as condições de alarme para suas aplicações E-Business Suite ou PeopleSoft, sistemas de banco de dados, servidores de aplicações e frota de hosts, incluindo infraestrutura de GPU. As configurações de alarme são aplicadas automaticamente conforme seu ambiente cresce. Durante a aplicação de patches durante as janelas, você pode suprimir alarmes facilmente usando janelas de manutenção com reconhecimento de topologia.
Com o monitoramento pronto para uso da infraestrutura de GPU, use a visualização Enterprise Health and Alarms para monitorar interativamente toda a frota de GPU. Faça a triagem de alarmes abertos, avalie a atividade em todas as GPUs, monitore a utilização delas, acompanhe as temperaturas da e identifique GPUs subutilizadas e erros. Monitore os processos de carga de trabalho e correlacione-os com a infraestrutura subjacente.
O OCI Stack Monitoring fornece monitoramento de pilha completa e gerenciamento de alarmes de aplicações e recursos de infraestrutura executados on-premises ou na nuvem. A lógica específica de aplicação do Stack Monitoring é agrupada como um plug-in para o agente que, por sua vez, é usado para descobrir recursos e coletar métricas que são então enviadas à OCI. O Stack Monitoring cria recursos e topologias de aplicações a partir de resultados de descoberta. O status e os principais dados de desempenho são exibidos na interface de usuário (IU) do Enterprise Health and Alarms, nas páginas iniciais dos recursos e nos painéis da frota e da aplicação. A criação de alarmes é simplificada usando modelos de monitoramento que criam alarmes no OCI Monitoring e são automaticamente exibidos e resumidos na IU do Stack Monitoring. Usando machine learning, as linhas de base para métricas-chave de desempenho são calculadas automaticamente e as anomalias são destacadas em gráficos de desempenho.
Descubra e monitore todos os componentes da implementação da sua aplicação E-Business Suite, incluindo o Concurrent Manager, o Workflow Background Engine, o Notification Mailer e os servidores WebLogic, bancos de dados Oracle e hosts dependentes. Use a página inicial do E-Business Suite para verificar o status de todos os componentes e abrir alarmes. Com o Stack View, você pode verificar rapidamente sinais na pilha, incluindo programas de longa execução do E-Business Suite, status de solicitações do Concurrent Manager, utilização de memória e status do pool de threads do WebLogic, tempos de espera do Oracle Database, CPU do host e memória.
Usando fluxos de trabalho semelhantes, você pode descobrir e monitorar o PeopleSoft e seus componentes, incluindo o Application Server Domain, a PeopleSoft Internet Architecture (PIA), o Process Scheduler e o WebLogic Server, o Oracle Database e os hosts dependentes. Use a página inicial do PeopleSoft para verificar o status de todos os componentes e abrir alarmes. Use o PeopleSoft Stack View para avaliar o status e a carga dos domínios do servidor de aplicações e do agendador de processos e PIA, uso de recursos do WebLogic e threads travados, tempos de espera do Oracle Database, CPU do host e memória.
Obtenha mais detalhes sobre o monitoramento de Oracle Applications
Comece a monitorar hosts na nuvem ou on-premises assim que um agente for implementado nele ou assim que uma instância de computação da OCI for provisionada. Monitore status, alarmes, uso de recursos (CPU, memória, swap e uso do sistema de arquivos) e carga (atividade de disco e de paginação) em todos os hosts na nuvem e on-premises em uma única visualização. Investigue hosts com alto uso de CPU para determinar quais aplicações consomem mais esse tipo de recurso. Use anomalias mostradas em gráficos de desempenho para entender se o alto uso de recursos está dentro das linhas de base esperadas. Se necessário, monitore condições específicas do seu ambiente usando extensões métricas.
Obtenha mais detalhes sobre o monitoramento de hosts on-premises e na nuvem
Descubra e monitore bancos de dados e middleware em um só lugar. Monitore sistemas completos do Oracle Database (incluindo PDBs, Listener, Automatic Storage Management e Cluster), GoldenGate e bancos de dados SQL Server. Monitore middlewares como WebLogic Servers, Managed File Transfer, SOA e Oracle HTTP Server, bem como Tomcat, Apache HTTP Server, JBoss, servidores JVM, Oracle Identity Manager e Oracle Unified Directory.
Use o Enterprise Health and Alarms para selecionar alarmes abertos e entender desempenho lento, alto uso de recursos, erros no banco de dados e camadas de middleware. Use seus gráficos interativos para correlacionar dinamicamente quaisquer 2 métricas de resposta e carga. Analise detalhadamente qualquer métrica de desempenho para visualizar tendências históricas e identificar anomalias.
Obtenha mais detalhes sobre o monitoramento de bancos de dados e middleware
Monitore condições exclusivas do seu ambiente usando extensões métricas. Siga o fluxo de trabalho guiado para definir o nome e o tipo da métrica, scripts personalizados ou consultas SQL. Teste a métrica de maneira iterativa; experimente-a em recursos de teste, revise os dados e edite a métrica conforme necessário. Depois de testada, publique e ative a extensão de métrica em seus recursos. Monitore os dados das extensões de métricas de qualquer interface de usuário do Stack Monitoring: páginas iniciais, Enterprise Health and Alarms ou painéis. Habilite a detecção de anomalias para aprender automaticamente linhas de base e identificar anomalias em gráficos de desempenho. Configure regras em extensões de métricas para gerar alarmes quando os valores ultrapassarem os limites de desempenho.
Monitore a integridade geral da sua frota de infraestrutura de GPU a partir de uma única visualização do Enterprise Health and Alarms. Interaja com essa visualização para selecionar alarmes abertos em hosts e GPUs, rastrear a utilização da CPU e da memória em todos os hosts, avaliar a atividade da GPU, a utilização da memória, a energia, a temperatura e a latência em todas as GPUs. Identifique problemas de disponibilidade do host ou pontos de acesso, como GPUs próximas às temperaturas máximas. Rastreie erros e GPUs subutilizadas. Faça uma busca detalhada da visão empresarial até uma visão específica da rede de cluster. Continue solucionando problemas usando as visualizações de topologia integradas para detalhar de uma rede de cluster até hosts e GPUs dentro de blocos de rede ou blocos locais na rede de cluster.
Obtenha mais detalhes sobre o monitoramento da infraestrutura de GPU
Simplifique o gerenciamento de alarmes para aplicações, sistemas e frota de infraestrutura usando modelos de monitoramento. Os modelos de monitoramento fornecem uma maneira centrada em recursos para definir e gerenciar todas as condições de alarme para uma aplicação E-Business Suite ou PeopleSoft, sistema de banco de dados ou uma frota de servidores de aplicações e hosts. Durante os períodos de aplicação de patches, use as janelas de manutenção para fornecer uma maneira centrada em recursos para silenciar alarmes para uma frota de hosts ou servidores de aplicações ou para aplicações como o E-Business Suite e o PeopleSoft.
Descoberta da topologia da infraestrutura de GPU.
Monitoramento de alarmes e integridade empresarial de cima para baixo.
Descoberta com um clique para aplicações como Oracle E-Business Suite e PeopleSoft, bem como tecnologias de pilha de aplicações.
Criação automática de topologia de aplicação que associa aplicações a servidores e bancos de dados para permitir a solução de problemas em todo o conjunto.
Cada tipo de recurso é monitorado automaticamente em busca de sinais relevantes relacionados à sua disponibilidade, resposta, carga, erro e utilização, reduzindo a carga do DevOps de exigir conhecimento especializado no domínio para determinar o que é importante monitorar.
A detecção de anomalias permite a rápida identificação e resolução de problemas.
Os modelos de monitoramento fornecem uma maneira orientada a recursos para definir condições de regras de alarme para uma aplicação, um sistema ou conjunto de recursos.
As janelas de manutenção fornecem uma maneira orientada a recursos para suprimir alarmes para recursos passando por operações de manutenção.
Use o Enterprise Health and Alarms para obter visibilidade em toda a sua empresa e identificar rapidamente interrupções, alarmes abertos e pontos críticos de desempenho.
Tenha acesso ao status do recurso, às principais métricas de desempenho, aos alarmes e aos recursos associados.
As visualizações da pilha fornecem insights rápidos sobre os KPIs críticos para a aplicação e sua pilha de infraestrutura subjacente.
Unifique métricas, rastreamentos e logs em serviços de observabilidade e gerenciamento usando painéis.
Adicione métricas personalizadas para monitorar condições exclusivas do seu ambiente.
Amplie a topologia da sua aplicação associando recursos do Stack Monitoring a outras instâncias de serviço da OCI.
Monitore qualquer tipo de infraestrutura com integração com Prometheus, Telegraf, collectd e recursos personalizados baseados em processos.
Gostaria de mais sobre o Stack Monitoring? Deixe um de nossos especialistas ajudar.