企业级监视功能

企业级监视

开箱即用式监视

在发现目标后,自动监视状态和性能,包括针对宕机和其他紧急状况自动生成事件。

高级阈值管理

除了静态阈值外,您还可以通过基于时间的静态阈值 (Time-Based Static Threshold) 或自适应阈值 (Adaptive Threshold) 方法来自动调整警报阈值,适应工作负载。

  • 基于时间的静态阈值是指基于工作负载的变化情况,为一天和/或一周的不同时间分别设定不同的阈值。例如,当工作日工作负载高于周末时,您可以为工作日设置较高阈值,为周末设置较低阈值。
  • 自适应阈值是指基于统计数据计算的,可适应工作负载状况的阈值。您可以基于基线时间窗口(即目标的典型行为时期)数据计算自适应阈值。例如,将警告阈值 (Warning Threshold) 设置为基线时间窗口最大观测值的 90%,将临界阈值 (Critical Threshold) 设置为基线时间窗口最大观测值的 110%。

自定义指标

Metric Extension 支持监视特定于您环境的状况。

  • 完整的 Metric Extension 开发和测试生命周期:开发、测试、发布。
  • 支持 OS 命令、SQL、SNMP 以及 JMX 指标收集方法。
  • 分别为各个目标部署 Metric Extension,或使用 Monitoring Template 来批量为多个目标部署 Metric Extension。
  • 在 Oracle Enterprise Manager 站点之间导入/导出 Metric Extension。

自动解决警报问题

Corrective Action 是一种可在警报触发后自动执行的脚本,可用于自动解决警报问题。

  • 面向常见警报(例如数据库和监听器宕机;表空间已满)的开箱即用的 Corrective Action。
  • 完整的自定义 Corrective Action 开发和测试生命周期:创建、测试、发布。
  • 使用 Monitoring Template 为目标舰队部署 Corrective Action。
  • 接收 Corrective Action 成功/失败通知。

自动化阈值管理

使用 Monitoring Template 和 Administration Group,轻松、自动化地为整个舰队应用监视设置。

  • 使用 Monitoring Template 进行常见监视设置。例如,您可以分别为生产数据库目标和测试数据库目标创建一个监视模板。
  • 使用 Administration Group 来组织具有共同监视设置(例如 Prod Group 和 Test Group)的目标,然后将 Monitoring Template 与 Administration Group 相关联,自动应用监视设置。

维护期间

在计划内维护窗口期间通过 Blackout 临时挂起非必要警报。

  • 使用 Blackout 挂起目标监视和警报功能,以执行维护操作。
  • 使用 Notification Blackout 在维护窗口期间延续警报功能,但挂起警报通知。

24/7 监视

在 Oracle Enterprise Manager 计划外和计划内停机期间持续、无中断地执行监视。

  • 在 Oracle Enterprise Manager 计划内停机期间,使用 Oracle Enterprise Manager 24ai 的 Zero Downtime Monitoring,通过警报、事件、通知以及外部系统工单持续监视目标。
  • 在 Oracle Enterprise Manager 13.5 计划内停机期间,使用 Always-On Monitoring 发送紧急警报电子邮件通知。

Oracle Database 监视

发现 Oracle Database

全面发现一个 Oracle Database 系统的所有组件,包括 RAC 数据库、可插拔数据库、监听器和 ASM。

  • 使用自动发现功能,自动查找所有未处于监视状态下的数据库。
  • 使用引导式发现功能,查找基于特定主机运行的数据库。
  • 使用手动发现功能显式指定监视属性,发现数据库。

全面监视数据库

使用 500 多个指标广泛监视 RAC 数据库、数据库实例、可插拔数据库、监听器和 ASM。

  • 500 多个指标,广泛涵盖状态、负载、性能等等。
  • 整个舰队中的重度负载数据库视图。
  • 轻松下钻至各个数据库的主页,查看资源消耗、运行时间最长 SQL 以及紧急事件。
  • 使用 Corrective Action 自动解决数据库宕机、表空间已满和监听器宕机警报问题。
  • 备份数据库;自动化修改 Oracle 和 ASM 数据库监视和非监视用户的密码。

MySQL 监视

发现 MySQL 数据库

自动化发现 MySQL 数据库。

  • 使用自动发现功能,自动查找未处于监视状态下的 MySQL 数据库。
  • 使用手动发现功能来手动指定 MySQL 数据库、InnoDB Cluster 和 InnoDB ClusterSet 详情,发现数据库。

全面监视 MySQL

使用 600 多个指标广泛监视 MySQL 实例和 InnoDB Cluster/ClusterSet。

  • 600 多个指标,广泛涵盖状态、数据库活动、复制活动等等。
  • 通过单一视图查看 InnoDB Cluster 组复制详情。
  • 自定义警报指标阈值,使用 Monitoring Template 将指标阈值应用到整个数据库舰队。
  • 通过 Corrective Action 自动解决数据库宕机警报问题。
  • 通过主页查看最近 24 小时的可用性信息、监视关键性能指标(例如 MySQL 连接状态和 InnoDB 缓冲池使用情况)、跟踪紧急事件。
  • 备份数据库,清除二进制日志。

识别性能欠佳查询

Query Analyzer 支持 DBA 运行执行计划 (Explain Plan),更好地识别性能欠佳的查询并进行分类。

  • 使用筛选器,按执行过程资源消耗、延迟或首次出现时间查看前 100 个性能最差查询。
  • 访问历史查询信息,洞悉长期性能。
  • 运行执行计划 (Explain Plan),识别查询性能瓶颈。
  • 通过图表查看平均执行用时、执行计数和受影响行方面的所有异常峰值。

保护 MySQL 数据库

获取专家建议,确保复制和 InnoDB 配置满足合规要求,符合其他适用的优秀实践。

  • 基于开箱即用的标准来评估是否符合性能、复制、安全性、模式和管理优秀实践。
  • 使用 Compliance Dashboard 跟踪整个 MySQL 数据库舰队的合规性违规问题。
  • 查看 Evaluation Report,洞悉各项合规性违规问题及补救流程。

SQL Server 和 IBM DB2 监视

发现数据库

使用手动发现功能,通过手动指定监视属性来发现 SQL Server 和 IBM DB2 数据库,实施即时监视。

全面监视 SQL Server

使用超过 450 个指标全面监视 SQL Server。

  • 超过 450 个 SQL Server 监视指标,广泛涵盖查询性能、状态和 High Availability Disaster Recovery (HADR) 副本状况等等。
  • 自定义警报指标阈值,使用 Monitoring Template 将指标阈值应用到整个数据库舰队。
  • 通过主页确保 SQL Server 实例上的所有数据库在线。查看过度消耗且消耗 CPU 资源最多的进程,跟踪需立即关注的紧急事件。
  • 启动/停止 SQL Server Agent、备份 SQL Server 数据库、终止会话。

全面监视 IBM DB2

使用超过 460 个指标全面监视 IBM DB2。

  • 超过 460 个 IBM DB2 监视指标,广泛涵盖查询性能和 High Availability Disaster Recovery (HADR) 集群状态等等。
  • 自定义警报指标阈值,使用 Monitoring Template 将指标阈值应用到整个数据库舰队。
  • 通过主页监视关键性能指标(例如表空间利用率)、跨各项应用查看 CPU 利用情况、跟踪需立即关注的紧急事件。
  • 启动/关闭 IBM DB2,在维护模式期间进入/退出 DB2 静默状态、终止 DB2 应用。

保护 SQL Server 数据库

获取专家建议,确保 SQL Server 符合配置优秀实践。

  • 基于开箱即用的标准评估配置合规性,涵盖数据库备份频率和索引碎片化修复等等。
  • 使用 Compliance Dashboard 跟踪整个 SQL Server 数据库舰队的合规性违规问题。
  • 查看 Evaluation Report,洞悉各项合规性违规问题及补救流程。

事件管理和通知

事件创建和通知

为可操作事件 (Event) 创建事件 (Incident),并发送通知。

  • 使用 Incident Rule 为可操作事件 (Event) 创建事件 (Incident),发送通知,并启用工单。
  • 通过电子邮件、Slack、Webhook、SNMP Trap 或 OS 命令发送通知。
  • 与 ServiceNow、PagerDuty、Jira、Microsoft SCOM 和 IBM Tivoli Netcool/OMNIbus 共享事件。

Event Compression

Event Compression 可自动将相关事件压缩(或分组)为更少数量的事件,减少事件数量。

  • 使用开箱即用的 Event Compression 策略满足常见压缩场景需求。
  • 针对独有压缩需求创建自定义策略。
  • 使用 Event Compression Analysis 测试 Event Compression 策略对于您独有事件的效率。

Incident Manager

Incident Manager 集中管理事件。

  • 可使用 Incident Manager 分配和跟踪事件状态,使用 Dynamic Runbook 处理事件。
  • 通过 Incident Dashboard 查看事件积压摘要(以此按严重性评估事件)、运行时间最长事件和问题领域(例如未分配事件)。

Dynamic Runbook

Dynamic Runbooks 可提供基于优秀实践的操作步骤,助力企业进行问题(例如事件、问题作业等)分类并解决问题。

  • 在 Oracle Enterprise Manager 中针对事件、指标和所有其他功能领域使用 Dynamic Runbook。
  • 创建包含多种类型操作步骤的 Dynamic Runbook,例如注释、指标图表、信息库 SQL、目标 SQL 或 OS 命令。
  • 使用来自 Oracle 的 Dynamic Runbook 进行 Oracle Enterprise Manager 基础设施问题分类并解决问题。

注:为免疑义,本网页所用以下术语专指以下含义:

  1. 除Oracle隐私政策外,本网站中提及的“Oracle”专指Oracle境外公司而非甲骨文中国 。
  2. 相关Cloud或云术语均指代Oracle境外公司提供的云技术或其解决方案。