Oracle Cloud Infrastructure (OCI) Stack Monitoring proporciona una supervisión y gestión de alarmas esenciales para las aplicaciones y la infraestructura, como hosts, GPU, bases de datos y servidores de aplicaciones.
Elimina los silos y obtén visibilidad de pila completa del estado de tus sistemas Oracle E-Business Suite, PeopleSoft y GoldenGate, así como de la infraestructura, como hosts, GPU, bases de datos y servidores de aplicaciones que se ejecutan en entornos locales o en la nube. Amplía la supervisión a cualquier infraestructura con la integración de Prometheus, Collectd o Telegraf. Controla cualquier condición única con métricas personalizadas.
Utiliza las plantillas de supervisión para gestionar todas las condiciones de alarma para las aplicaciones de E-Business Suite o PeopleSoft, los sistemas de base de datos, los servidores de aplicaciones y la flota de hosts, incluida la infraestructura de GPU. La configuración de alarma se aplica automáticamente a medida que crece el entorno. Durante los plazos de aplicación de parches, puedes suprimir alarmas fácilmente utilizando ventanas de mantenimiento sensible a la topología.
Con la supervisión llave en mano de la infraestructura de GPU, utiliza la vista Enterprise Health and Alarms para controlar de forma interactiva toda la flota de GPU. Analiza las alarmas abiertas, evalúa la actividad en todos los GPUS, supervisa el uso de la GPU, realiza un seguimiento de las temperaturas de la GPU e identifica errores y GPU infrautilizadas. Supervisa los procesos de carga de trabajo y correlaciónalos con la infraestructura subyacente.
OCI Stack Monitoring proporciona supervisión de pila completa y gestión de alarmas de aplicaciones y recursos de infraestructura que se ejecutan en entornos locales o en la nube. La lógica específica de la aplicación de Stack Monitoring se incluye como un plugin para el agente que, a su vez, se utiliza para detectar recursos y recopilar métricas que luego se envían a Oracle Cloud Infrastructure. Stack Monitoring crea recursos y topologías de aplicaciones a partir de resultados de detección. Los datos de estado y rendimiento clave se muestran en la interfaz de usuario (IU) de Enterprise Health and Alarms, las páginas iniciales de recursos y los paneles de control de aplicaciones y conjuntos. La creación de alarmas se optimiza mediante plantillas de supervisión que crean alarmas en OCI Monitoring y se muestran y resumen automáticamente en la interfaz de usuario de Stack Monitoring. Mediante el aprendizaje automático, los puntos de referencia para los indicadores clave de rendimiento se calculan automáticamente y las anomalías se resaltan en los gráficos de rendimiento.
Detecta y supervisa todos los componentes del despliegue de la aplicación E-Business Suite, incluidos Concurrent Manager, Workflow Background Engine, Notification Mailer y los servidores WebLogic dependientes, las bases de datos Oracle y los hosts. Utiliza la página inicial de E-Business Suite para comprobar el estado de todos los componentes y las alarmas abiertas. Con Stack View, puede comprobar rápidamente las constantes vitales en toda la pila, incluidos los programas de larga ejecución de E-Business Suite, el estado de las solicitudes de Concurrent Manager, el uso de memoria WebLogic y el estado del pool de threads, los tiempos de espera de Oracle Database, la CPU del host y la memoria.
Utilizando flujos de trabajo similares, puedes detectar y supervisar PeopleSoft y sus componentes, incluidos el dominio de Application Server, la arquitectura de Internet (PIA) PeopleSoft, el programador de procesos y el servidor WebLogic dependiente, Oracle Database y los hosts. Utiliza la página inicial PeopleSoft para comprobar el estado de todos los componentes y las alarmas abiertas. Utiliza PeopleSoft Stack View para evaluar el estado y la carga de los dominios del servidor de aplicaciones y del programador de procesos y PIA, el uso de recursos WebLogic y los threads de parada, los tiempos de espera de Oracle Database, la CPU del host y la memoria.
Obtén más información sobre la supervisión de aplicaciones de Oracle
Comienza a supervisar los hosts en la nube o locales tan pronto como se despliegue un agente en él o tan pronto como se aprovisione una instancia informática de Oracle Cloud Infrastructure. Supervisa el estado, las alarmas, el uso de recursos (CPU, memoria, intercambio y uso del sistema de archivos) y la carga (actividad del disco y actividad de paginación) en todos los hosts en la nube y locales en una sola vista. Investiga los hosts con una CPU alta para determinar las aplicaciones que consumen la CPU más alta. Utiliza las anomalías que se muestran en los gráficos de rendimiento para saber si los usos de recursos altos están dentro de las bases de referencias esperadas. Si es necesario, controla las condiciones específicas de tu entorno con Metric Extensions.
Obtén más información sobre la supervisión de hosts locales y en la nube
Descubre y controla bases de datos y middleware en un solo lugar. Supervisa los sistemas de Oracle Database completos (incluidas las bases de datos PDB, el Listener, la gestión automática de almacenamiento y el clúster), GoldenGate y SQL Server. Supervisa el middleware, como servidores WebLogic, transferencia de archivos gestionados, SOA y Oracle HTTP Server, así como Tomcat, Apache HTTP Server, JBoss, servidores JVM, Oracle Identity Manager y Oracle Unified Directory.
Utiliza Enterprise Health and Alarms para clasificar las alarmas abiertas y comprender el rendimiento lento, el alto uso de recursos, los errores en la base de datos y los niveles de middleware. Utiliza tus gráficos interactivos para correlacionar dinámicamente cualquier par de métricas de carga y respuesta. Profundiza en cualquier métrica de rendimiento para consultar las tendencias históricas e identificar anomalías.
Obtén más información sobre la supervisión de bases de datos y middleware
Controla las condiciones que son exclusivas de tu entorno mediante extensiones de métricas. Sigue el flujo de trabajo guiado de Metric Extensions para definir el nombre y el tipo de métrica, los scripts personalizados o las consultas SQL. Prueba la métrica de forma iterativa; comprueba la métrica con recursos de ensayo, revisa los datos y edita la métrica según necesites. Una vez comprobado, publica y activa el elemento de Metric Extensions que necesites en tus recursos. Controla los datos de Metric Extensions desde cualquier interfaz de usuario de Stack Monitoring: páginas iniciales, Enterprise Health and Alarms o paneles de control. Activa la detección de anomalías para aprender automáticamente los puntos de referencia e identificar anomalías en los gráficos de rendimiento. Configura reglas de alarma en Metric Extensions para generar alarmas cuando los valores cruzan los umbrales de rendimiento.
Controla el estado general de tu flota de infraestructura de GPU desde una única vista de Enterprise Health and Alarms. Interactúa con esta vista para clasificar las alarmas abiertas en hosts y GPU, realizar el seguimiento de la utilización de CPU y memoria en todos los hosts, evaluar la actividad de GPU, la utilización de memoria, la potencia, la temperatura y la latencia en todas las GPU. Identifica los problemas de disponibilidad del host o los puntos de acceso, como las GPU que se acercan a las temperaturas máximas. Seguimiento de errores y GPU infrautilizadas. Accede desde la vista de empresa a una vista específica de red de clústeres. Continúa con la solución de problemas utilizando las vistas de topología incorporadas para analizar en profundidad desde una red de clústeres hasta hosts y GPU dentro de bloques de red o bloques locales de la red de clústeres.
Obtén más detalles sobre la supervisión de la infraestructura de GPU
Simplifica la gestión de alarmas para aplicaciones, sistemas e infraestructura utilizando Monitoring Templates. Las plantillas de supervisión proporcionan una forma centrada en los recursos para definir y gestionar todas las condiciones de alarma de una aplicación E-Business Suite o PeopleSoft, un sistema de base de datos o una flota de servidores y hosts de aplicaciones. Durante los periodos de aplicación de parches, utiliza Maintenance Windows para proporcionar una forma enfocada en los recursos de silenciar alarmas para un conjunto de hosts o servidores de aplicaciones o para aplicaciones como E-Business Suite y PeopleSoft.
Detección de la topología de infraestructura de GPU.
Supervisión descendente del estado de la empresa y las alarmas.
Detección con un solo clic de aplicaciones como Oracle E-Business Suite y PeopleSoft, así como tecnologías de pila de aplicaciones.
Creación automática de topología de aplicaciones que asocia aplicaciones a servidores y bases de datos de aplicaciones para facilitar la resolución de problemas en toda la pila.
Cada tipo de recurso se supervisa automáticamente para detectar señales vitales clave relacionadas con su estado de disponibilidad, respuesta, carga, error y uso. De esta forma, alivia la pesada carga que supone para DevOps la necesidad de contar con experiencia específica para poder identificar qué es importante que se supervise.
La detección de anomalías permite una rápida identificación y resolución de problemas.
Las plantillas de supervisión proporcionan una forma orientada a recursos de definir condiciones de reglas de alarma para una aplicación, un sistema o un conjunto de recursos.
Las ventanas de mantenimiento proporcionan una forma centrada en los recursos de suprimir las alarmas de los recursos que se encuentran en operaciones de mantenimiento.
Utiliza el estado y las alarmas empresariales para obtener visibilidad en toda la empresa e identificar rápidamente interrupciones, alarmas abiertas y puntos críticos de rendimiento.
Obtén acceso al estado del recurso, los indicadores clave de rendimiento, las alarmas y los recursos asociados.
Stack Views proporcionan una visión rápida de los KPI fundamentales de la aplicación y su pila de infraestructura subyacente.
Unifica métricas, rastreos y logs en los servicios de Observability and Management utilizando paneles de control.
Agrega métricas personalizadas para supervisar condiciones exclusivas de tu entorno.
Amplía la topología de tu aplicación asociando recursos de Stack Monitoring a otras instancias de servicio de Oracle Cloud Infrastructure.
Supervisa cualquier tipo de infraestructura con integración con Prometheus, Telegraf, Collectd y recursos personalizados basados en procesos.
¿Te interesa obtener más información sobre Stack Monitoring? Permite que uno de nuestros expertos te ayude.