Oracle Cloud Infrastructure(OCI) Stack Monitoring은 호스트, GPU, 데이터베이스, 앱 서버 등 애플리케이션과 인프라를 위한 필수 모니터링 및 경보 관리를 제공합니다.
사일로를 없애고 Oracle E-Business Suite, PeopleSoft, GoldenGate 시스템은 물론 호스트, GPU, 데이터베이스, 앱 서버 등 온프레미스 또는 클라우드에서 실행되는 인프라의 상태를 풀스택 가시성으로 확인할 수 있습니다. Prometheus, collectd, Telegraf 통합을 활용해 모든 인프라로 모니터링 범위를 확장할 수 있습니다. 커스텀 메트릭으로 모든 고유 조건을 모니터링할 수 있습니다.
Monitoring Templates을 사용해 E-Business Suite 또는 PeopleSoft 애플리케이션, 데이터베이스 시스템, 앱 서버, GPU 인프라를 포함한 호스트 플릿의 모든 경보 조건을 관리할 수 있습니다. 경보 설정은 환경이 확장됨에 따라 자동으로 적용됩니다. 윈도우 패치가 진행되는 동안 토폴로지 인식 Maintenance Window를 사용해 경보를 쉽게 해제할 수 있습니다.
GPU 인프라의 턴키 모니터링을 바탕으로 Enterprise Health and Alarms를 사용해 GPU 플릿 전반을 인터랙티브 방식으로 모니터링할 수 있습니다. 미결 경보를 분류하고, 전체 GPU의 활동을 평가하고, GPU 활용을 모니터링하고, GPU 온도를 추적하고, 사용량이 적은 GPU 및 오류를 식별할 수 있습니다. 워크로드 프로세스를 모니터링하고 이를 기반 인프라와 상호 연계할 수 있습니다.
OCI Stack Monitoring은 온프레미스 또는 클라우드에서 실행되는 애플리케이션 및 인프라 리소스에 대한 풀스택 모니터링 및 경보 관리를 제공합니다. Stack Monitoring의 앱별 논리는 에이전트에 대한 플러그인으로 번들화되어, 후에 OCI로 전송되는 리소스를 검색하고 메트릭을 수집하는 데 사용됩니다. Stack Monitoring은 검색 결과를 바탕으로 리소스 및 애플리케이션 토폴로지를 생성합니다. 상태 및 주요 성능 데이터는 Enterprise Health and Alarms 사용자 인터페이스(UI), 리소스 홈페이지, 플릿 및 애플리케이션 대시보드에 표시됩니다. 경보 생성은 경보를 OCI Monitoring 내에 생성하는 Monitoring Templates을 사용해 간소화되며, Stack Monitoring UI에 자동으로 표시 및 요약됩니다. 주요 성능 메트릭의 기준선이 머신러닝을 사용해 자동으로 계산되며, 이상 값은 성능 차트에 강조 표시됩니다.
Concurrent Manager, Workflow Background Engine, Notification Mailer, 종속 WebLogic Servers, Oracle Databases 호스트 등 E-Business Suite 애플리케이션 배포의 모든 구성 요소를 검색 및 모니터링할 수 있습니다. E-Business Suite 홈페이지를 사용해 전체 구성 요소 및 미결 경보의 상태를 확인할 수 있습니다. Stack View를 사용하면 E-Business Suite 장기 실행 프로그램, Concurrent Manager 요청 상태, WebLogic 메모리 활용률 및 스레드 풀 상태, Oracle Database 대기 시간, 호스트 CPU, 메모리 등 스택 전반의 주요 징후를 빠르게 확인할 수 있습니다.
유사한 워크플로를 사용해 Application Server Domain, PeopleSoft Internet Architecture(PIA), Process Scheduler, 종속 WebLogic Server, Oracle Database, 호스트 등 PeopleSoft 및 구성 요소를 검색 및 모니터링할 수 있습니다. PeopleSoft 홈페이지를 사용해 전체 구성 요소 및 미결 경보의 상태를 확인할 수 있습니다. PeopleSoft Stack View를 사용해 애플리케이션 서버의 상태 및 로드, 프로세스 스케줄러 도메인 및 PIA, WebLogic 리소스 사용량 및 잠긴 스레드, Oracle Database 대기 시간, 호스트 CPU, 메모리를 평가할 수 있습니다.
에이전트가 배포되는 즉시 또는 OCI 컴퓨트 인스턴스가 프로비저닝되는 즉시 클라우드 또는 온프레미스를 모니터링할 수 있습니다. 전체 클라우드 및 온프레미스 호스트 전반의 상태, 경보, 리소스 사용량(CPU, 메모리, 스왑, 파일 시스템 사용량) 및 로드(디스크 활동, 페이징 활동)를 단일 뷰에서 모니터링할 수 있습니다. 높은 CPU를 보유한 호스트를 조사하여 CPU를 가장 많이 소비하는 앱을 확인할 수 있습니다. 성능 차트에 표시된 이상 값을 사용해 높은 리소스 사용량이 예상된 기준 범위 안에 있는지 파악할 수 있습니다. 필요 시 Metric Extensions을 사용해 환경별 조건을 모니터링할 수 있습니다.
데이터베이스와 미들웨어를 한곳에서 검색 및 모니터링할 수 있습니다. 완전한 Oracle Database 시스템(PDB, Listener, Automatic Storage Management, Cluster 등), GoldenGate, SQL Server 데이터베이스를 모니터링할 수 있습니다. WebLogic Servers, Managed File Transfer, SOA, Oracle HTTP Server와 같은 미들웨어는 물론, Tomcat, Apache HTTP Server, JBoss, JVM 서버 Oracle Identity Manager, Oracle Unified Directory까지 모니터링할 수 있습니다.
Enterprise Health and Alarms을 사용해 미결 경보를 분류하고, 느린 성능, 높은 리소스 사용량, 데이터베이스 및 미들웨어 계층 전반의 오류를 파악할 수 있습니다. 인터랙티브 방식 차트를 사용해 모든 2개 응답 및 로드 메트릭을 동적으로 연계할 수 있습니다. 모든 성능 메트릭을 드릴다운하여 과거 추세를 확인하고 이상 값을 식별할 수 있습니다.
Metric Extensions을 사용해 환경별 조건을 모니터링할 수 있습니다. Metric Extensions 안내식 워크플로를 따라 메트릭 이름, 유형, 커스텀 스크립트, SQL 쿼리를 정의할 수 있습니다. 인터랙티브 방식으로 메트릭을 테스트하고, 테스트 리소스에 대한 메트릭을 시험해 보고, 데이터를 검토하고, 필요 시 메트릭을 편집할 수 있습니다. 테스트가 완료된 후 리소스에 관한 Metric Extension을 게시 및 활성화할 수 있습니다. Stack Monitoring UI에서 수집한 Metric Extensions 데이터(홈페이지, Enterprise Health and Alarms, 대시보드 등)를 모니터링할 수 있습니다. 이상 감지 기능을 활성화해 기준선을 자동으로 파악하고 성능 차트의 이상 값을 식별할 수 있습니다. Metric Extensions에서 경보 규칙을 설정해 값이 성능 임계 값을 초과할 때 경보가 발생하도록 할 수 있습니다.
단일 Enterprise Health and Alarms 뷰를 통해 GPU 인프라 플릿의 전반적인 상태를 모니터링할 수 있습니다. 이 뷰를 활용해 호스트 및 GPU 전반의 미결 경보를 분류하고, 전체 호스트 전반의 CPU 및 메모리 활용률을 추적하고, 전체 GPU 전반의 GPU 활동, 메모리 활용률, 전력, 온도, 지연성을 평가할 수 있습니다. 호스트 가용성 문제 또는 최대 온도에 근접한 GPU 등 핫스팟을 파악할 수 있습니다. 오류 및 활용률이 낮은 GPU를 추적할 수 있습니다. 엔터프라이즈 뷰에서 특정 클러스터 네트워크 뷰로 드릴다운할 수 있습니다. 내장 토폴로지 뷰를 사용해 클러스터 네트워크에서 네트워크 블록 또는 로컬 블록 내 호스트 및 GPU로 드릴다운하는 방식으로 계속해서 문제를 해결해 나갈 수 있습니다.
Monitoring Templates을 사용해 애플리케이션, 시스템, 인프라 플릿 경보 관리를 간소화할 수 있습니다. Monitoring Templates은 리소스를 중심에 두고 E-Business Suite 또는 PeopleSoft 애플리케이션, 데이터베이스 시스템 또는 애플리케이션 서버 및 호스트의 플릿을 위한 모든 알람 조건을 정의 및 관리합니다. 패치 기간 중 Maintenance Windows를 사용해 리소스 중심적인 방식으로 호스트 또는 앱 서버 플릿용 알람 또는 E-Business Suite, PeopleSoft와 같은 애플리케이션용 알람을 무음으로 전환할 수 있습니다.
GPU 인프라 토폴로지를 검색할 수 있습니다.
엔터프라이즈 상태 및 경보 모니터링을 하향식으로 할 수 있습니다.
Oracle E-Business Suite, PeopleSoft 및 애플리케이션 스택 기술 등 애플리케이션을 위한 원클릭 검색을 지원합니다.
애플리케이션을 앱 서버 및 데이터베이스에 연계해 스택 전반의 문제 해결을 지원하는 애플리케이션 토폴로지의 자동 생성을 지원합니다.
각 리소스 유형에 대한 모니터링은 가용성, 응답, 로드, 오류, 활용률과 관련된 핵심 활성 징후에 대해 자동으로 이루어집니다. 그 결과 주요 모니터링 대상 결정을 위한 도메인 전문성의 수준에 관한 DevOps의 부담을 줄일 수 있습니다.
이상 감지는 신속한 문제 식별 및 해결을 지원합니다.
Monitoring Templates은 애플리케이션, 시스템, 리소스 플립에 대한 경보 규칙 조건을 리소스 지향적으로 설정합니다.
Maintenance Windows는 유지 보수 작업이 진행 중인 리소스의 경보를 생략하도록 하는 리소스 지향적인 방식을 제공합니다.
Enterprise Health and Alarms을 사용해 전사적 가시성을 확보하고 가동 중단, 미결 경보, 성능 핫스팟을 신속히 파악할 수 있습니다.
리소스의 상태, 주요 성능 메트릭, 경보, 관련 리소스에 액세스합니다.
Stack Views는 애플리케이션의 핵심 KPI와 기본 인프라 스택에 대한 인사이트를 빠르게 제공합니다.
대시보드를 사용해 Observability and Management 서비스 전반의 메트릭, 추적 및 로그를 통합합니다.
고객 고유의 환경 조건을 모니터링하기 위한 커스텀 메트릭을 추가합니다.
Stack Monitoring 리소스를 타 OCI 서비스 인스턴스와 연계함으로써 애플리케이션 토폴로지를 확장할 수 있습니다.
Prometheus, Telegraf, collectd 및 프로세스 기반 커스텀 리소스와의 통합을 통해 모든 유형의 인프라를 모니터링할 수 있습니다.
Stack Monitoring에 대해 더 자세히 알고 싶으신가요? Oracle의 전문가가 도와 드리겠습니다.