Stack Monitoring

Oracle Cloud Infrastructure (OCI) Stack Monitoring proporciona una supervisión y gestión de alarmas esenciales para las aplicaciones y la infraestructura, como hosts, GPU, bases de datos y servidores de aplicaciones.

OCI Stack Monitoring: descripción general del servicio (9:23)
  • Controla las aplicaciones y la infraestructura desde un solo lugar

    Elimina los silos y obtén visibilidad de pila completa del estado de tus sistemas Oracle E-Business Suite, PeopleSoft y GoldenGate, así como de la infraestructura, como hosts, GPU, bases de datos y servidores de aplicaciones que se ejecutan en entornos locales o en la nube. Amplía la supervisión a cualquier infraestructura con la integración de Prometheus, Collectd o Telegraf. Controla cualquier condición única con métricas personalizadas.

  • Gestiona alarmas a escala

    Utiliza las plantillas de supervisión para gestionar todas las condiciones de alarma para las aplicaciones de E-Business Suite o PeopleSoft, los sistemas de base de datos, los servidores de aplicaciones y la flota de hosts, incluida la infraestructura de GPU. La configuración de alarma se aplica automáticamente a medida que crece el entorno. Durante los plazos de aplicación de parches, puedes suprimir alarmas fácilmente utilizando ventanas de mantenimiento sensible a la topología.

  • Supervisar la infraestructura y las cargas de trabajo de GPU

    Con la supervisión llave en mano de la infraestructura de GPU, utiliza la vista Enterprise Health and Alarms para controlar de forma interactiva toda la flota de GPU. Analiza las alarmas abiertas, evalúa la actividad en todos los GPUS, supervisa el uso de la GPU, realiza un seguimiento de las temperaturas de la GPU e identifica errores y GPU infrautilizadas. Supervisa los procesos de carga de trabajo y correlaciónalos con la infraestructura subyacente.

Cómo funciona Stack Monitoring

OCI Stack Monitoring proporciona supervisión de pila completa y gestión de alarmas de aplicaciones y recursos de infraestructura que se ejecutan en entornos locales o en la nube. La lógica específica de la aplicación de Stack Monitoring se incluye como un plugin para el agente que, a su vez, se utiliza para detectar recursos y recopilar métricas que luego se envían a Oracle Cloud Infrastructure. Stack Monitoring crea recursos y topologías de aplicaciones a partir de resultados de detección. Los datos de estado y rendimiento clave se muestran en la interfaz de usuario (IU) de Enterprise Health and Alarms, las páginas iniciales de recursos y los paneles de control de aplicaciones y conjuntos. La creación de alarmas se optimiza mediante plantillas de supervisión que crean alarmas en OCI Monitoring y se muestran y resumen automáticamente en la interfaz de usuario de Stack Monitoring. Mediante el aprendizaje automático, los puntos de referencia para los indicadores clave de rendimiento se calculan automáticamente y las anomalías se resaltan en los gráficos de rendimiento.

Historias de clientes de Stack Monitoring

Ver todos los casos de clientes

Casos de uso de Stack Monitoring

  • Supervisa Oracle Applications, incluidos E-Business Suite y PeopleSoft

    Detecta y supervisa todos los componentes del despliegue de la aplicación E-Business Suite, incluidos Concurrent Manager, Workflow Background Engine, Notification Mailer y los servidores WebLogic dependientes, las bases de datos Oracle y los hosts. Utiliza la página inicial de E-Business Suite para comprobar el estado de todos los componentes y las alarmas abiertas. Con Stack View, puede comprobar rápidamente las constantes vitales en toda la pila, incluidos los programas de larga ejecución de E-Business Suite, el estado de las solicitudes de Concurrent Manager, el uso de memoria WebLogic y el estado del pool de threads, los tiempos de espera de Oracle Database, la CPU del host y la memoria.


    Utilizando flujos de trabajo similares, puedes detectar y supervisar PeopleSoft y sus componentes, incluidos el dominio de Application Server, la arquitectura de Internet (PIA) PeopleSoft, el programador de procesos y el servidor WebLogic dependiente, Oracle Database y los hosts. Utiliza la página inicial PeopleSoft para comprobar el estado de todos los componentes y las alarmas abiertas. Utiliza PeopleSoft Stack View para evaluar el estado y la carga de los dominios del servidor de aplicaciones y del programador de procesos y PIA, el uso de recursos WebLogic y los threads de parada, los tiempos de espera de Oracle Database, la CPU del host y la memoria.


    Obtén más información sobre la supervisión de aplicaciones de Oracle

  • Control de hosts locales y en la nube

    Comienza a supervisar los hosts en la nube o locales tan pronto como se despliegue un agente en él o tan pronto como se aprovisione una instancia informática de Oracle Cloud Infrastructure. Supervisa el estado, las alarmas, el uso de recursos (CPU, memoria, intercambio y uso del sistema de archivos) y la carga (actividad del disco y actividad de paginación) en todos los hosts en la nube y locales en una sola vista. Investiga los hosts con una CPU alta para determinar las aplicaciones que consumen la CPU más alta. Utiliza las anomalías que se muestran en los gráficos de rendimiento para saber si los usos de recursos altos están dentro de las bases de referencias esperadas. Si es necesario, controla las condiciones específicas de tu entorno con Metric Extensions.


    Obtén más información sobre la supervisión de hosts locales y en la nube

  • Supervisa bases de datos y middleware

    Descubre y controla bases de datos y middleware en un solo lugar. Supervisa los sistemas de Oracle Database completos (incluidas las bases de datos PDB, el Listener, la gestión automática de almacenamiento y el clúster), GoldenGate y SQL Server. Supervisa el middleware, como servidores WebLogic, transferencia de archivos gestionados, SOA y Oracle HTTP Server, así como Tomcat, Apache HTTP Server, JBoss, servidores JVM, Oracle Identity Manager y Oracle Unified Directory.


    Utiliza Enterprise Health and Alarms para clasificar las alarmas abiertas y comprender el rendimiento lento, el alto uso de recursos, los errores en la base de datos y los niveles de middleware. Utiliza tus gráficos interactivos para correlacionar dinámicamente cualquier par de métricas de carga y respuesta. Profundiza en cualquier métrica de rendimiento para consultar las tendencias históricas e identificar anomalías.


    Obtén más información sobre la supervisión de bases de datos y middleware

  • Agrega métricas personalizadas

    Controla las condiciones que son exclusivas de tu entorno mediante extensiones de métricas. Sigue el flujo de trabajo guiado de Metric Extensions para definir el nombre y el tipo de métrica, los scripts personalizados o las consultas SQL. Prueba la métrica de forma iterativa; comprueba la métrica con recursos de ensayo, revisa los datos y edita la métrica según necesites. Una vez comprobado, publica y activa el elemento de Metric Extensions que necesites en tus recursos. Controla los datos de Metric Extensions desde cualquier interfaz de usuario de Stack Monitoring: páginas iniciales, Enterprise Health and Alarms o paneles de control. Activa la detección de anomalías para aprender automáticamente los puntos de referencia e identificar anomalías en los gráficos de rendimiento. Configura reglas de alarma en Metric Extensions para generar alarmas cuando los valores cruzan los umbrales de rendimiento.


    Obtén más información sobre las métricas personalizadas

  • Supervisar la infraestructura de GPU

    Controla el estado general de tu flota de infraestructura de GPU desde una única vista de Enterprise Health and Alarms. Interactúa con esta vista para clasificar las alarmas abiertas en hosts y GPU, realizar el seguimiento de la utilización de CPU y memoria en todos los hosts, evaluar la actividad de GPU, la utilización de memoria, la potencia, la temperatura y la latencia en todas las GPU. Identifica los problemas de disponibilidad del host o los puntos de acceso, como las GPU que se acercan a las temperaturas máximas. Seguimiento de errores y GPU infrautilizadas. Accede desde la vista de empresa a una vista específica de red de clústeres. Continúa con la solución de problemas utilizando las vistas de topología incorporadas para analizar en profundidad desde una red de clústeres hasta hosts y GPU dentro de bloques de red o bloques locales de la red de clústeres.


    Obtén más detalles sobre la supervisión de la infraestructura de GPU

  • Gestiona alarmas en toda la flota

    Simplifica la gestión de alarmas para aplicaciones, sistemas e infraestructura utilizando Monitoring Templates. Las plantillas de supervisión proporcionan una forma centrada en los recursos para definir y gestionar todas las condiciones de alarma de una aplicación E-Business Suite o PeopleSoft, un sistema de base de datos o una flota de servidores y hosts de aplicaciones. Durante los periodos de aplicación de parches, utiliza Maintenance Windows para proporcionar una forma enfocada en los recursos de silenciar alarmas para un conjunto de hosts o servidores de aplicaciones o para aplicaciones como E-Business Suite y PeopleSoft.


    Obtén más detalles sobre Monitoring Templates

Capacidades de supervisión de pila

Supervisión de cargas de trabajo e infraestructura de GPU

Supervisión de infraestructura de GPU

Detección de la topología de infraestructura de GPU.

  • Detecta la topología de red del clústeres, incluidos los bloques de red, los bloques locales, los hosts y las GPU.
  • Detecta las GPU asociadas a los hosts de la topología de red de clústeres.
  • Proporciona interfaces de usuario de topología incorporadas para navegar por la topología de red del clústeres.

Supervisa el estado y las cargas de trabajo de la infraestructura de GPU

Supervisión descendente del estado de la empresa y las alarmas.

  • Utiliza Enterprise Health and Alarms para ver la GPU del host a fin de supervisar toda la infraestructura de GPU de la flota.
  • La región de estado identifica los problemas de disponibilidad del host.
  • La región alarmas agrega alarmas en todos los hosts y GPU con un análisis más profundo para un triaje adicional.
  • Los gráficos de rendimiento del host agregan el uso de CPU y memoria en todos los hosts y ayudan a identificar valores atípicos.
  • El rendimiento de la GPU registra el rendimiento agregado en todas las GPU, incluida la actividad, el uso de memoria, el consumo de energía, la temperatura, las latencias y los errores de ECC. Ayuda a identificar áreas problemáticas, como altas temperaturas y errores o GPU no utilizadas para cargas de trabajo adicionales.
  • Las vistas interactivas profundizan en los datos históricos o en hosts o GPU específicos para la resolución de problemas adicionales.
  • Supervisa los procesos de carga de trabajo y correlaciona el rendimiento con los hosts y las GPU subyacentes.

Descubrimiento de aplicaciones e infraestructura de aplicaciones

Detección simplificada

Detección con un solo clic de aplicaciones como Oracle E-Business Suite y PeopleSoft, así como tecnologías de pila de aplicaciones.

  • Detecta todos los componentes de E-Business Suite, como el procesamiento simultáneo, el motor en segundo plano de flujos de trabajo y la aplicación de correos de notificación, así como los servidores WebLogic dependientes.
  • Detecta todos los elementos de PeopleSoft y sus componentes, como el dominio del servidor de aplicaciones, PIA, el programador de procesos y OpenSearch, así como los servidores WebLogic dependientes.
  • Identifica compatibilidad para bases de datos y recursos relacionados, como el sistema de Oracle Database (incluidas PDB, Listener, gestión automática de almacenamiento y clústeres), la base de datos SQL Server y GoldenGate.
  • Identifica compatibilidad para middleware, como servidores WebLogic, transferencia de archivos gestionados, SOA, Oracle HTTP Server, Tomcat, Apache HTTP Server, Oracle Identity Manager, Oracle Unified Directory, etc.
  • Detección automática y supervisión de hosts y recursos informáticos locales con el despliegue de agentes.

Topología de la aplicación

Creación automática de topología de aplicaciones que asocia aplicaciones a servidores y bases de datos de aplicaciones para facilitar la resolución de problemas en toda la pila.

  • La topología de la aplicación E-Business Suite asocia E-Business Suite a los servidores WebLogic dependientes y a Oracle Database.
  • La topología de aplicación PeopleSoft asocia PeopleSoft a los servidores WebLogic dependientes y a Oracle Database.
  • La topología de dominio WebLogic asocia sus clústeres WebLogic y servidores WebLogic.
  • La topología de sistemas de Oracle Database asocia Oracle Database, PDB, Listeners, Cluster y gestión automática de almacenamiento.
  • La topología GoldenGate asocia componentes como el despliegue GoldenGate, el servicio de administración, el servicio de distribuciones y la extracción y replicación.

Supervisión del estado de las aplicaciones e infraestructuras

Supervisión depurada

Cada tipo de recurso se supervisa automáticamente para detectar señales vitales clave relacionadas con su estado de disponibilidad, respuesta, carga, error y uso. De esta forma, alivia la pesada carga que supone para DevOps la necesidad de contar con experiencia específica para poder identificar qué es importante que se supervise.

  • La supervisión de E-Business Suite incluye el tiempo de ejecución del programa, así como el estado de Concurrent Manager y las solicitudes simultáneas de larga ejecución.
  • La supervisión de PeopleSoft incluye la carga y el estado del dominio del servidor de aplicaciones, la carga y el estado del dominio del programador de procesos, la carga y el estado de PIA, la consulta Elasticsearch/OpenSearch y las latencias de extracción.
  • La supervisión de WebLogic incluye uso de pila, threads de parada, ratio de solicitudes web y tiempo de procesamiento de solicitudes web.
  • La supervisión de Oracle Database incluye el uso de tablespaces, sesiones de bloqueo, tiempo de base de datos, uso de FRA y rendimiento de E/S.
  • La supervisión del host incluye el uso de CPU, memoria, intercambio y sistema de archivos.

Detección de anomalías basada en aprendizaje automático

La detección de anomalías permite una rápida identificación y resolución de problemas.

  • Proporciona una identificación visual rápida de los recursos cuyo rendimiento se desvía de los estándares históricos.
  • Utiliza el aprendizaje automático para calcular automáticamente puntos de referencia para indicadores clave de rendimiento.
  • Marca el comportamiento anómalo y proporciona gráficos y comparaciones útiles.

Gestión de alarmas a escala

Las plantillas de supervisión proporcionan una forma orientada a recursos de definir condiciones de reglas de alarma para una aplicación, un sistema o un conjunto de recursos.

  • Utiliza Monitoring Templates certificadas por Oracle para las reglas de alarma recomendadas para E-Business Suite, PeopleSoft, Oracle Database, WebLogic Server, hosts y otros tipos de recursos.
  • En lugar de gestionar reglas de alarma de métricas individuales, estas plantillas de supervisión proporcionan una forma orientada a recursos de especificar y gestionar un conjunto completo de condiciones de alarma y notificaciones para los recursos especificados en la plantilla.
  • Las reglas de alarma de OCI Monitoring se generan y actualizan automáticamente en función de la plantilla de supervisión.

Ventanas de mantenimiento

Las ventanas de mantenimiento proporcionan una forma centrada en los recursos de suprimir las alarmas de los recursos que se encuentran en operaciones de mantenimiento.

  • Especifica los recursos, como aplicaciones, sistemas de base de datos o hosts, en la ventana de mantenimiento y se suprimirán todas las alarmas asociadas.
  • En el caso de las aplicaciones basadas en topología, como E-Business Suite o PeopleSoft, las ventanas de mantenimiento incluirán automáticamente todos los miembros. Los hosts en mantenimiento incluirán automáticamente los recursos que se ejecutan en el host.
  • Se admiten ventanas de mantenimiento tanto ocasionales como recurrentes.

Interfaz de usuario especialmente organizada para la resolución interactiva de problemas

Un único panel entre el entorno local y la nube

Utiliza el estado y las alarmas empresariales para obtener visibilidad en toda la empresa e identificar rápidamente interrupciones, alarmas abiertas y puntos críticos de rendimiento.

  • La región de estado identifica las interrupciones.
  • La región de estado por tipo permite evaluar el estado de una pila o sistema de aplicaciones completo, como E-Business Suite, PeopleSoft, GoldenGate u Oracle Database.
  • La región de alarmas proporciona un resumen de las alarmas por gravedad, con detalles exhaustivos para profundizar en su investigación.
  • Las vistas por nivel para servidores de aplicaciones, bases de datos y hosts identifican recursos con la respuesta más lenta y la mayor grado de utilización.
  • Los gráficos interactivos permiten una evaluación rápida de las distintas métricas y profundizar en los datos históricos.

Páginas de inicio para una supervisión integral

Obtén acceso al estado del recurso, los indicadores clave de rendimiento, las alarmas y los recursos asociados.

  • Comprueba el estado del recurso y sus componentes relacionados.
  • Realiza el triaje de las alarmas abiertas.
  • Correlaciona la carga y el rendimiento entre diversos periodos de tiempo.
  • Permanece atento a los problemas de rendimiento pendientes con las anomalías que se muestran en los gráficos de rendimiento.
  • Comprende las dependencias de recursos para una supervisión integral y utiliza la topología de navegación para aumentar rápidamente el detalle de los recursos dependientes.

Stack Views para aplicaciones seleccionadas y organizadas

Stack Views proporcionan una visión rápida de los KPI fundamentales de la aplicación y su pila de infraestructura subyacente.

  • E-Business Suite Stack View: comprueba los tiempos de ejecución de los principales programas de E-Business Suite, verifica el estado de las solicitudes del gestor simultáneo, controla el uso de pila WebLogic, los tiempos de espera de Oracle Database, la CPU del host y el uso de memoria.
  • PeopleSoft Stack View: comprueba el estado y la carga del dominio del servidor de aplicaciones y verifique que los procesos del servidor se están ejecutando. Revisa el uso de memoria de WebLogic JVM y el estado del pool de threads, los tiempos de espera de Oracle Database, la CPU del host y el uso de memoria.

Paneles de control

Unifica métricas, rastreos y logs en los servicios de Observability and Management utilizando paneles de control.

  • Utiliza paneles de control listos para usar para el host, E-Business Suite, PeopleSoft y Oracle Unified Directory para supervisar una flota de infraestructuras y aplicaciones.
  • Clona cualquier panel de control listo para usar y amplíalo para incluir rastreo y logs de otros servicios de Observability and Management.

Amplía y personaliza la supervisión

Metric Extensions

Agrega métricas personalizadas para supervisar condiciones exclusivas de tu entorno.

  • El flujo de trabajo basado en la interfaz de usuario te guiará a lo largo del proceso de creación de definiciones de métricas, pruebas, publicación y activación en tus recursos.
  • Los datos de Metric Extensions aparecen automáticamente en las páginas iniciales de los recursos y se pueden agregar a las vistas de Enterprise Health and Alarms.
  • Incluye Metric Extensions en Monitoring Templates para generar alarmas cuando los valores superen los umbrales.
  • Activa la detección de anomalías en Metric Extensions para mostrar las anomalías de rendimiento en los gráficos de métricas.

Importación de instancias de servicio de Oracle Cloud Infrastructure

Amplía la topología de tu aplicación asociando recursos de Stack Monitoring a otras instancias de servicio de Oracle Cloud Infrastructure.

  • Importa los datos de métricas de un servicio de Oracle Cloud Infrastructure a Stack Monitoring para crear una nueva instancia de recurso para ese servicio en Stack Monitoring. Por ejemplo, puedes importar el equilibrador de carga de Oracle Cloud Infrastructure al clúster WebLogic de servicio.
  • Asocia el nuevo recurso de servicio de Oracle Cloud Infrastructure con otros recursos para enriquecer la topología de la aplicación y obtener una visibilidad de supervisión unificada en todos los recursos.

Integración con otras fuentes de datos

Supervisa cualquier tipo de infraestructura con integración con Prometheus, Telegraf, Collectd y recursos personalizados basados en procesos.

  • La integración de Prometheus crea nuevos recursos a partir de cualquier fuente externa que emita datos de Prometheus.
  • La integración de Telegraf y Collectd permite la supervisión de una amplia gama de infraestructuras y aplicaciones.
  • Supervisa cualquier aplicación que se ejecute en un host identificando los procesos que componen la aplicación. Se supervisará automáticamente para detectar el estado y el uso de CPU y memoria.

Empieza ahora a utilizar Stack Monitoring


Ponte en contacto con ventas

¿Te interesa obtener más información sobre Stack Monitoring? Permite que uno de nuestros expertos te ayude.