Oracle Cloud Infrastructure(OCI)Stack Monitoringは、ホスト、GPU、データベース、アプリケーション・サーバーなどのアプリケーションおよびインフラストラクチャ向けに、重要なモニタリングおよびアラーム管理機能を提供します。
サイロを排除し、Oracle E-Business Suite、PeopleSoft、GoldenGateシステムだけでなく、オンプレミスまたはクラウドで稼働しているホスト、GPU、データベース、アプリケーション・サーバーなどのインフラストラクチャの健全性をフルスタックで可視化します。Prometheus、collectd、Telegrafの統合により、モニタリングをあらゆるインフラストラクチャに拡張します。カスタム・メトリックを使用して、あらゆる独自の状態をモニターします。
モニタリング・テンプレートを使用して、E-Business Suite または PeopleSoft アプリケーション、データベース・システム、アプリケーション・サーバー、およびGPUインフラストラクチャを含むホスト群のすべてのアラーム状況を管理します。アラーム設定は、環境の成長に合わせて自動的に適用されます。パッチ適用ウィンドウ中は、トポロジ対応メンテナンスウィンドウを使用しているアラームを簡単に抑制できます。
GPUインフラストラクチャのターンキー・モニタリングでは、Enterprise Health and Alarmsビューを使用して、GPUフリート全体にわたりインタラクティブにモニターできます。開放性アラームのトリアージ、GPUS全体にわたるアクティビティの評価、GPU公益事業のモニタリング、GPU温度の追跡、利用不足のGPUやエラーの特定。ワークロード・プロセスをモニターし、基盤となるインフラストラクチャと関連付けます。
OCI Stack Monitoringは、オンプレミスまたはクラウドで稼働するアプリケーションおよびインフラストラクチャ・リソースのフルスタック監視およびアラーム管理を提供します。OCI Stack Monitoringは、オンプレミスまたはクラウドで実行されるアプリケーションおよびインフラストラクチャ・リソースのフルスタック・モニタリングおよびアラーム管理を提供します。Stack Monitoringは、ディスカバリーの結果からリソースとアプリケーションのトポロジを作成します。ステータスと主要なパフォーマンス・データは、エンタープライズ・ヘルス&アラーム・ユーザー・インターフェイス(UI)、リソース・ホームページ、フリート・ダッシュボード、アプリケーション・ダッシュボードに表示されます。アラームの作成は、OCIモニタリングでアラームを作成し、自動的にスタックモニタリングUIに表示および要約されるモニタリング・テンプレートを使用して効率化されています。機械学習を使用しているため、 主要なパフォーマンスメトリクスのベースラインが自動的に計算され、異常がパフォーマンスグラフで強調表示されます。
Concurrent Manager、Workflow Background Engine、Notification Mailer、依存するWebLogic Server、Oracle Database、ホストなど、E-Business Suiteアプリケーション導入のすべてのコンポーネントを見出して監視します。E-Business Suiteのホームページを使用して、すべてのコンポーネントとオープン・アラームのステータスを確認します。サイロを排除し、Oracle E-Business Suite、PeopleSoft、GoldenGate システム、およびオンプレミスまたはクラウドで実行されているホスト、GPU、データベース、アプリケーション・サーバーなどのインフラストラクチャの健全性をフルスタックで可視化します。
同様のワークフローを使用して、Application Server Domain、PeopleSoft Internet Architecture(PIA)、Process Scheduler、および依存するWebLogic Server、Oracle Database、ホストなどのPeopleSoftとそのコンポーネントを発見し、モニターできます。PeopleSoftホームページを使用して、すべてのコンポーネントとオープン・アラームのステータスを確認します。PeopleSoftスタック・ビューを使用して、アプリケーション・サーバーおよびプロセス・スケジューラ・ドメインとPIAのステータスとロード、WebLogicリソース使用率とスタックスレッド、Oracle Databaseの待機時間、ホスト CPU、およびメモリを評価します。
エージェントが導入されるとすぐに、またはOCIコンピュート・インスタンスがプロビジョニングされるとすぐに、クラウドまたはオンプレミスのホストのモニタリングを開始します。すべてのクラウドおよびオンプレミス・ホストのステータス、アラーム、リソース使用率(CPU、メモリ、スワップ、ファイルシステム使用量)、および負荷(ディスク・アクティビティおよびページング・アクティビティ)を単一のビューでモニターします。CPUが高いホストを調査し、最もCPUを消費しているアプリケーションを特定します。パフォーマンスグラフに表示される異常値を使用して、リソース使用率が高い場合でも想定されるベースライン内に収まっているかどうかを把握します。必要に応じて、Metric Extensionsを使用して、環境に固有の条件をモニターします。
データベースとミドルウェアを一か所で、検出し、モニターします。完全なOracle Database システム(PDB、リスナー、自動ストレージ管理、クラスタを含む)、GoldenGate、SQL Serverデータベースをモニターします。WebLogic Server、マネージド・ファイル・トランスファー、SOA、Oracle HTTP Server などのミドルウェア、および Tomcat、Apache HTTP Server、JBoss、JVMサーバー、Oracle Identity Manager、Oracle Unified Directoryをモニターします。
Enterprise Health and Alarmsを使用して、未処理のアラームを分類し、パフォーマンスの低下、リソースの使用率の高さ、データベース全体やミドルウェア層におけるエラーを把握します。インタラクティブなグラフを使用して、2 つの応答およびロード・メトリクスを動的に関連付けることができます。パフォーマンス・メトリクスをドリルダウンして、過去の傾向を確認し、異常を特定することができます。
Metric Extensions を使用して、お客様の環境に固有の条件をモニターします。Metric Extensions のガイド付きワークフローに従って、メトリックの名前とタイプ、カスタム・スクリプト、またはSQLクエリを定義します。メトリックを反復的にテストし、テスト・リソースでメトリックを試し、データをレビューし、必要に応じてメトリックを編集します。テストが完了したら、リソース上でMetric Extensionを公開および有効にします。あらゆるスタック・モニタリングのUI(ホームページ、エンタープライズ・ヘルス&アラーム、ダッシュボード)から、メトリック拡張機能からのデータをモニターします。異常検知を実現し、自動的にベースラインを学習してパフォーマンス・グラフの異常を特定します。Metric Extensionsにアラーム・ルールを設定して、値がパフォーマンスしきい値を超えたときにアラームを生成します。
単一のEnterprise Health and AlarmsビューからGPUインフラストラクチャの全体的な健全性をモニターします。このビューとやりとりして、ホストとGPUにわたるオープン・アラームのトリアージ、全ホストにわたるCPUとメモリの利用状況の追跡、すべてのGPUにおけるGPUアクティビティ、メモリ利用率、電力、温度、レイテンシの評価を行います。ホストの可用性の問題や、GPUが最高温度に近づいているなどのホットスポットを特定します。エラーと使用率の不十分なGPUを追跡します。エンタープライズ・ビューから特定のクラスタ・ネットワーク・ビューにドリルダウンします。組み込みのトポロジ・ビューを使用してトラブルシューティングを継続し、クラスタ・ネットワークのネットワーク・ブロック内またはローカル・ブロック内のホストやGPUにドリルダウンします。
モニタリング・テンプレートを使用して、アプリケーション、システム、インフラストラクチャ・フリートのアラーム管理を簡素化します。モニタリング・テンプレートは、E-Business SuiteまたはPeopleSoftアプリケーション、データベース・システム、またはアプリケーション・サーバーとホストのフリートのすべてのアラーム状況を定義および管理するリソース中心の方法を提供します。パッチ適用期間中は、Maintenance Windowsを使用して、ホストやアプリケーション・サーバーのフリート、またはE-Business SuiteやPeopleSoftなどの業務アプリケーションのアラームをミュートするリソース中心の方法を提供します。
GPUインフラストラクチャのトポロジを検出します。
エンタープライズ・ヘルスとアラームをトップダウンでモニタリングします。
Oracle E-Business SuiteやPeopleSoftなどのアプリケーションやアプリケーション・スタック・テクノロジーをワンクリックで検出します。
アプリケーションとアプリケーション・サーバーおよびデータベースを関連付けるアプリケーション・トポロジを自動的に作成し、スタック全体にわたる問題のトラブルシューティングを実現します。
各リソース・タイプは、可用性、レスポンス、ロード、エラー、および利用率に関連する重要な兆候について自動的にモニターされるため、監視の重要性を判断するためにドメインの専門知識を必要とするDevOpsの負担が軽減されます。
異常検知は、問題の迅速な特定と解決を実現します。
モニタリング・テンプレートは、アプリケーション、システム、またはリソース・フリートに対してアラーム・ルールの条件を設定するリソース指向の方法を提供します。
メンテナンス・ウィンドウは、メンテナンス運用中のリソースのアラームを抑制するリソース指向の方法を提供します。
Enterprise Health and Alarmsを使用すると、企業全体の可視性を得て、停止、未解決のアラーム、パフォーマンスのホット・スポットを迅速に特定できます。
リソースのステータス、主要なパフォーマンスメトリクス、アラーム、および関連リソースにアクセスできます。
スタック・ビューは、アプリケーションとその基盤となるインフラストラクチャ・スタックの重要なKPIに関する迅速なインサイトを提供します。
ダッシュボードを使用して、可観測性および管理サービス全体でメトリック、トレースおよびログを統合します。
カスタム・メトリックを追加して、お客様の環境固有の条件をモニタリングします。
Stack Monitoringリソースを他のOCIサービスインスタンスに関連付けることで、アプリケーション・トポロジを拡張します。
Prometheus、Telegraf、collectd、プロセスベースのカスタム・リソースとの統合により、あらゆるタイプのインフラストラクチャをモニターします。
スタック・モニタリングの詳細をご希望の場合は、当社のエキスパートにお問い合わせください。