Oracle Cloud Infrastructure (OCI) Stack Monitoring bietet zentrale Funktionen zur Überwachung und Alarmverwaltung für Anwendungen und Infrastrukturen – darunter Hosts, GPUs, Datenbanken und Anwendungsserver.
Beseitigen Sie Silos und verschaffen Sie sich einen umfassenden Überblick über den Zustand Ihrer Oracle E-Business Suite-, PeopleSoft- und GoldenGate-Systeme sowie über die Infrastruktur, wie z. B. Hosts, GPUs, Datenbanken und App-Server, die vor Ort oder in der Cloud laufen. Erweitern Sie die Überwachung auf jede beliebige Infrastruktur mit der Integration von Prometheus, collectd oder Telegraf. Überwachen Sie jede einzelne Bedingung mit benutzerdefinierten Metriken.
Verwenden Sie Überwachungsvorlagen, um alle Alarmbedingungen für Ihre E-Business Suite- oder PeopleSoft-Anwendungen, Datenbanksysteme, Anwendungsserver und Hostflotten, einschließlich der GPU-Infrastruktur, zu verwalten. Die Alarmeinstellungen werden automatisch übernommen, wenn Ihre Umgebung wächst. Während der Patching-Fenster können Sie Alarme mit Hilfe von Topologie-Wartungsfenstern einfach unterdrücken.
Mit der schlüsselfertigen Überwachung der GPU-Infrastruktur können Sie mit der Ansicht „Enterprise Health and Alarms“ die gesamte GPU-Flotte interaktiv überwachen. Sichten Sie offene Alarme, bewerten Sie die Aktivität aller GPUS, überwachen Sie die GPU-Auslastung, verfolgen Sie die GPU-Temperaturen und identifizieren Sie nicht ausgelastete GPUs und Fehler. Überwachen Sie Workload-Prozesse und korrelieren Sie sie mit der zugrunde liegenden Infrastruktur.
OCI Stack Monitoring bietet Full-Stack-Monitoring und Alarmmanagement von Anwendungen und Infrastrukturressourcen, die On-Premises oder in der Cloud laufen. Die App-spezifische Logik von Stack Monitoring wird als Plugin für den Agenten gebündelt, der wiederum zur Erkennung von Ressourcen und zum Sammeln von Metriken verwendet wird, die dann an OCI gesendet werden. Stack Monitoring erstellt Ressourcen und Anwendungstopologien aus den Discovery-Ergebnissen. Status- und wichtige Leistungsdaten werden in der Benutzeroberfläche (UI) Enterprise Health and Alarms, auf den Homepages der Ressourcen sowie in den Flotten- und Anwendungs-Dashboards angezeigt. Die Erstellung von Alarmen wird durch Überwachungsvorlagen rationalisiert, die Alarme in OCI Monitoring erstellen und automatisch in der Stack Monitoring UI angezeigt und zusammengefasst werden. Mithilfe von maschinellem Lernen werden automatisch Basiswerte für wichtige Leistungskennzahlen berechnet und Anomalien in Leistungsdiagrammen hervorgehoben.
Erkennen und überwachen Sie alle Komponenten Ihrer E-Business Suite-Anwendungsbereitstellung, einschließlich Concurrent Manager, Workflow Background Engine, Notification Mailer und die abhängigen WebLogic Server, Oracle Datenbanken und Hosts. Verwenden Sie die Homepage der E-Business Suite, um den Status aller Komponenten und offenen Alarme zu überprüfen. Mit Stack View können Sie schnell die Vitaldaten des gesamten Stacks überprüfen, einschließlich lang laufender E-Business Suite-Programme, des Status von Concurrent Manager-Anfragen, der WebLogic-Speicherauslastung und des Thread-Pool-Status, der Oracle Database-Wartezeiten, der Host-CPU und des Speichers.
Mithilfe ähnlicher Workflows können Sie PeopleSoft und seine Komponenten ermitteln und überwachen, einschließlich der Anwendungsserver-Domäne, der PeopleSoft Internet Architecture (PIA), des Prozessplaners und der abhängigen WebLogic Server, Oracle Database und Hosts. Auf der PeopleSoft-Homepage können Sie den Status aller Komponenten und offenen Alarme überprüfen. Verwenden Sie die PeopleSoft Stack View, um den Status und die Auslastung von Anwendungsserver- und Prozess-Scheduler-Domänen und PIA, WebLogic-Ressourcennutzung und festsitzende Threads, Oracle Database-Wartezeiten, Host-CPU und Speicher zu beurteilen.
Weitere Informationen zur Überwachung von Oracle Applications
Beginnen Sie mit der Überwachung von Cloud- oder On-Premises-Hosts, sobald ein Agent oder eine OCI-Compute-Instanz darauf bereitgestellt wird. Überwachen Sie Status, Alarme, Ressourcennutzung (CPU-, Speicher-, Swap- und Dateisystemnutzung) und Auslastung (Festplattenaktivität und Paging-Aktivität) für alle Cloud- und On-Premises-Hosts in einer einzigen Ansicht. Untersuchen Sie Hosts mit hohem CPU-Verbrauch, um die Anwendungen mit dem höchsten CPU-Verbrauch zu ermitteln. Nutzen Sie die in den Leistungsdiagrammen angezeigten Anomalien, um festzustellen, ob eine hohe Ressourcennutzung im Rahmen der erwarteten Grundlinien liegt. Überwachen Sie bei Bedarf die für Ihre Umgebung spezifischen Bedingungen mithilfe von Metric Extensions.
Weitere Informationen zur Überwachung von Cloud- und On-Premises-Hosts
Entdecken und überwachen Sie Datenbanken und Middleware an einem Ort. Überwachen Sie komplette Oracle Database Systeme (einschließlich PDBs, Listener, Automatic Storage Management und Cluster), GoldenGate und SQL Server Datenbanken. Überwachen Sie Middleware wie WebLogic Server, Managed File Transfer, SOA und Oracle HTTP Server, sowie Tomcat, Apache HTTP Server, JBoss, JVM Server, Oracle Identity Manager und Oracle Unified Directory.
Verwenden Sie Enterprise Health und Alarme, um offene Alarme zu bearbeiten und langsame Leistung, hohe Ressourcennutzung, Fehler in der Datenbank und auf den Middleware-Ebenen zu verstehen. Verwenden Sie die interaktiven Diagramme, um zwei beliebige Antwort- und Lastmetriken dynamisch zu korrelieren. Sie können jede beliebige Leistungskennzahl aufschlüsseln, um historische Trends zu sehen und Anomalien zu erkennen.
Weitere Informationen zur Überwachung von Datenbanken und Middleware
Überwachen Sie Bedingungen, die für Ihre Umgebung einzigartig sind, mit Metric Extensions. Folgen Sie dem geführten Workflow für Metric Extensions, um den Namen und den Typ der Metrik, benutzerdefinierte Skripte oder SQL-Abfragen zu definieren. Testen Sie die Metrik iterativ; probieren Sie die Metrik an Testressourcen aus, überprüfen Sie die Daten und bearbeiten Sie die Metrik nach Bedarf. Veröffentlichen Sie die Metric Extension nach dem Testen und aktivieren Sie sie für Ihre Ressourcen. Überwachen Sie die Daten von Metric Extensions von jeder Stack Monitoring UI aus - von den Homepages, Enterprise Health und Alarms oder Dashboards. Aktivieren Sie die Anomalieerkennung, um automatisch Baselines zu lernen und Anomalien in Leistungsdiagrammen zu erkennen. Richten Sie Alarmregeln für Metric Extensions ein, um Alarme zu erzeugen, wenn Werte Leistungsschwellen überschreiten.
Überwachen Sie den Gesamtzustand Ihrer GPU-Infrastrukturflotte in einer einzigen Ansicht für den Zustand und die Alarme des Unternehmens. Mit dieser Ansicht können Sie offene Alarme über Hosts und GPUs hinweg einordnen, die CPU- und Speicherauslastung über alle Hosts hinweg verfolgen und die GPU-Aktivität, Speicherauslastung, Stromverbrauch, Temperatur und Latenz über alle GPUs hinweg bewerten. Erkennen Sie Probleme mit der Host-Verfügbarkeit oder Hotspots wie GPUs, die sich der Maximaltemperatur nähern. Verfolgen Sie Fehler und nicht ausgelastete GPUs. Wechseln Sie von der Unternehmensansicht zu einer bestimmten Cluster-Netzwerkansicht. Setzen Sie die Fehlerbehebung mithilfe der integrierten Topologieansichten fort, um von einem Cluster-Netzwerk zu Hosts und GPUs innerhalb von Netzwerkblöcken oder lokalen Blöcken im Cluster-Netzwerk zu navigieren.
Vereinfachen Sie das Alarmmanagement für Anwendungen, Systeme und Infrastrukturflotten mithilfe von Überwachungsvorlagen. Überwachungsvorlagen (Monitoring Templates) bieten eine ressourcenorientierte Möglichkeit, alle Alarmbedingungen für eine E-Business Suite- oder PeopleSoft-Anwendung, ein Datenbanksystem oder eine Flotte von Anwendungsservern und Hosts zu definieren und zu verwalten. Verwenden Sie während Patch-Zeiträumen Wartungsfenster, um Alarme für eine Gruppe von Hosts oder Anwendungsservern oder für Anwendungen wie E-Business Suite und PeopleSoft ressourcenorientiert stummzuschalten.
Erkennung der GPU-Infrastrukturtopologie.
Top-Down-Überwachung des Unternehmenszustands und der Alarme.
Ein-Klick-Discovery für Anwendungen wie Oracle E-Business Suite und PeopleSoft sowie für Anwendungsstack-Technologien.
Automatische Erstellung einer Anwendungstopologie, die Anwendungen mit Anwendungsservern und Datenbanken verknüpft, um die Fehlerbehebung über die gesamte Stack-Struktur hinweg zu ermöglichen.
Jeder Ressourcentyp wird automatisch auf wichtige Vitalparameter hinsichtlich Verfügbarkeit, Reaktionszeit, Auslastung, Fehler und Nutzung überwacht. Dadurch werden DevOps entlastet, da sie nicht mehr über das Fachwissen verfügen müssen, um zu entscheiden, was überwacht werden muss.
Die Anomalieerkennung ermöglicht eine schnelle Problemerkennung und -lösung.
Überwachungsvorlagen bieten eine ressourcenorientierte Möglichkeit, Alarmregelbedingungen für eine Anwendung, ein System oder eine Flotte von Ressourcen festzulegen.
Wartungsfenster bieten eine ressourcenorientierte Möglichkeit, Alarme für Ressourcen zu unterdrücken, die gerade gewartet werden.
Nutzen Sie Enterprise Health und Alarms, um einen Überblick über Ihr gesamtes Unternehmen zu erhalten und Ausfälle, offene Alarme und Leistungsengpässe schnell zu erkennen.
Erhalten Sie Zugriff auf den Status der Ressource, wichtige Leistungskennzahlen, Alarme und zugehörige Ressourcen.
Stack Views bieten einen schnellen Einblick in die kritischen KPIs für die Anwendung und den zugrunde liegenden Infrastruktur-Stack.
Vereinheitlichen Sie Metriken, Traces und Protokolle über Observability- und Management-Services hinweg mithilfe von Dashboards.
Fügen Sie benutzerdefinierte Metriken hinzu, um die für Ihre Umgebung spezifischen Bedingungen zu überwachen.
Erweitern Sie Ihre Anwendungstopologie, indem Sie Stack Monitoring-Ressourcen mit anderen OCI-Serviceinstanzen verknüpfen.
Überwachen Sie jede Art von Infrastruktur durch die Integration mit Prometheus, Telegraf, collectd und prozessbasierten benutzerdefinierten Ressourcen.
Möchten Sie mehr über Stack Monitoring erfahren? Einer unserer Experten wird Ihnen gerne helfen.