Application Performance Monitoring

Oracle Cloud Infrastructure Application Performance Monitoring (APM) 通过分布式跟踪服务提供应用性能和可观测性解决方案,帮助打造优质的应用体验。

OCI Application Performance Monitoring:LLM 观测 (5:43)

Application Performance Monitoring 的工作原理

APM 通过分布式跟踪服务提供应用可观测性,有助于实现理想的应用体验。该解决方案适用于基于微服务的应用以及在 OCI、本地或其他公有云上运行的传统、多层应用。

用户可以通过任何编程语言的 OpenTelemetry 跟踪器收集可观察性事件(跨度、指标和日志事件)。面向 Java 和 .Net 的增强 APM agent 提供了扩展功能,适用于 Java 和 .Net 环境的分析、深度诊断以及指标收集。APM Vantage Points 为执行监控器收集丰富的观测事件。

所有遥测数据都将发送到 OCI APM 客户特定的端点,以便通过 APM 分布式跟踪服务进行处理。处理期间扩充/控制事件的选项会生成所有应用事务处理的跟踪,包括应用日志消息和指标数据到 APM 数据存储。

状态和关键性能数据显示在仪表板 UI 中;诊断分析可以通过非常灵活和强大的跟踪查询语言直接在数据存储上完成。查询结果可以进行保存并存储为快速选择,也可以重复用于仪表盘可视化。在 Oracle Cloud Infrastructure (OCI) Monitoring 中创建的预警会自动显示在 APM 监控 UI 中。使用机器学习,系统会自动计算关键绩效指标的基线,并在绩效图表中显示异常。

Application Performance Monitoring 客户成功案例

查看所有客户案例

Application Performance Monitoring 的使用场景

真实用户监控

如何提供出色的最终用户体验是所有应用管理器面临的一个共同难题。而 APM 解决了这一难题,通过监控解决方案,它可以随时跟踪每位最终用户的实际体验,无论用户在何处以何种方式访问应用。浏览器检测支持从浏览器收集数据然后传送到应用中,以评估真正的端到端用户体验。这些功能使系统可靠性工程师、IT 运营人员和应用利益相关方能够执行以下操作:

会话诊断
端到端地跟踪每一个用户会话并进行诊断。查看打开了哪些页面和点击过哪些 UI 组件,导致了用户问题。服务台员工可以使用此功能来记录难以在其他情况下重现的问题。应用所有者可以查看常见的用户点击路径和障碍,这些路径和障碍可能会妨碍用户在应用中达成重要目标。

页面诊断
跟踪页面活动是指测量和报告所有页面加载、页面导航和单独更新(点击)。深入了解使用情况;就单个 AJAX 调用的性能而言,页面的性能瓶颈;文件、图像、样式表和 JavaScript 库的加载和执行。获取有关已用屏幕大小的详细信息,万一用户需要滚动页面,或者因为烦躁而重新加载某些内容。

JavaScript 错误分析
在浏览器上检测到的每个 JavaScript 错误都会沿着浏览器活动的跨度进行记录。将源代码自动映射到经过压缩的 JavaScript 文件时,可以准确地显示哪些函数受错误影响、在代码中的哪个地方进行修复。



服务监控

全面了解应用至关重要。由于迁移到基于微服务的架构,或使用微服务对传统应用进行扩展,如果应用请求无法在整个堆栈中跟踪,就很难找出性能问题。

可观测事件(跨度、指标和日志事件)可以通过任何编程语言的 OpenTelemetry 跟踪器收集,也可以使用 Oracle 针对 Java 和 .Net 的增强 APM agent,这些 agent 提供用于分析、深度诊断和指标收集的扩展功能。

这些功能使开发人员和 IT 运营人员能够执行以下操作:

监控和预警
通过实例级观察跟踪每一项事务,获得一系列丰富的度量,并基于这些指标自动发送有关性能、可用性和负载分析的警报。

诊断
通过全面的实例级诊断实时查找,或查找某一段时间内任何事务的确切执行详情。

探索和分析
使用灵活的查询语言深入洞察应用行为,并根据现成或自定义维度筛选和集中跟踪数据,执行全面分析。



安全监控

安全性对每个应用都至关重要。监控已知不良行为者的活动并识别不同类型的威胁是了解潜在威胁的关键。APM 可自动与 Oracle Threat Intelligence Service 集成,以提供全面的安全监控解决方案。

该解决方案支持报告恶意事务处理及其对您的服务和基础设施的影响,以及它们是否最终执行任何 SQL 执行。

APM 还可用于报告已加载的 Java 库和您在应用架构中使用的版本,并检查是否存在已知漏洞。



可用性监控

主动监控功能可帮助开发人员和操作人员预防问题发生,避免对用户造成影响。可用性监控提供了运行计划的、脚本化的监控器的能力,以确保应用的可用性。这些功能使开发人员和 IT 运营人员能够执行以下操作:

浏览器和脚本化浏览器监视器
监控单个 URL 或使用 Selenium IDE 创建脚本(.side 文件)然后在 APM 中执行,通过收集和检索 HTTP 归档 (HAR) 文件、屏幕截图、控制台日志和网络跟踪来直观呈现潜在问题并了解流程。

REST API 和脚本化 REST 监视器
监控每一个 REST API,或通过 Postman 创建脚本(JavaScript 文件)以执行一系列相关的 API 交互 — 这些交互可用于监控自定义应用、SaaS 服务集成或第三方应用上使用的 API。

TCP ping 和 DNS 监控器
监控任何基础设施组件(例如计算节点和负载平衡器),查看是否可用或直接测试 DNS 服务,以确保按预期解决记录解析和权限。

Vantage Points
从在 OCI 和外部 75 多个数据中心提供的多个位置 (Vantage Points) 执行监控。或者在 OCI (Dedicated Vantage Point) 或使用 Docker(本地部署 Vantage Point)的任何位置上创建自己的 Vantage Point,以监控受保护环境中的应用和系统。



Application Performance Monitoring 的功能

真实用户监控

洞察用户与应用的所有交互、页面加载、软导航和硬导航、点击及其响应时间。

  • 报告哪些组件需要很长时间才能加载,哪些 AJAX 调用或加载的库有助于提高加载性能。
  • 提供有关地理位置、ISP 瓶颈的信息,以及 DNS 和 SSL 解析是否有助于提高性能。
  • 必须报告所使用的屏幕大小以及在滚动之前需要优化的屏幕分辨率。
  • 提供用户会话报告功能,包括页面导航路径报告。
  • 为所有应用(微)服务中从前端到后端监控的所有请求提供跟踪拓扑。
  • 支持自定义指标报告和机器学习发现异常值和模式。
  • 提供用于分析的开箱即用 UI 和仪表盘。
  • 支持通过跟踪查询语言进行长期报告和汇总。
  • 可轻松集成到数据湖或 Oracle Analytics Cloud。

服务监控

支持通过任何编程语言的 OpenTelemetry 跟踪器收集可观察性事件(跨度、指标和日志事件)。

  • 面向 Java 和 .Net 的增强 APM agent 通过 OpenTelemetry 跟踪器提供扩展功能,适用于线程分析、深度诊断和指标收集。
  • 根据整个应用架构中的应用请求,提供开箱即用的 UI 和拓扑来跟踪(微)服务。
  • 支持自定义指标报告和机器学习发现异常值和模式。
  • 提供用于分析的开箱即用 UI 和仪表盘。
  • 支持通过跟踪查询语言进行长期报告和汇总。
  • 可轻松集成到数据湖或 Oracle Analytics Cloud。

可用性监控

可用性监控提供了运行计划的、脚本化的监控器的能力,以确保应用的可用性。

  • 提供多种监控器类型,可按设定的时间间隔测试浏览器流、API 端点、http 服务器、TCP ping 和 DNS 服务器。
  • 收集用于各个资源报告的 HAR 文件、网络跟踪、控制台和错误日志以及已执行监控器的屏幕截图。
  • 通过遍布全球的公共 Vantage Points 提供所有 OCI 数据中心和外部数据中心的执行选项。
  • 提供通过 Docker 映像为 OCI 或任何本地或其他云技术供应商的计算资源上的安全环境部署 Vantage Points 选项。
  • 提供报告选项,根据为 SLA 设置的目标计算可用性。
  • 支持自定义指标报告和机器学习发现异常值和模式。
  • 提供用于分析的开箱即用 UI 和仪表盘。
  • 支持通过跟踪查询语言进行长期报告和汇总。
  • 可轻松集成到数据湖或 Oracle Analytics Cloud。

安全监控

开箱即用的与 Threat Intelligence Service 数据源的集成。

  • 报告威胁类型和置信度分数。
  • 提供用于特定威胁的 CPU 和网络资源的指示。
  • 提供受特定威胁影响的(微)服务的拓扑概览。
  • 支持报告已执行的应用堆栈中加载过的库,以根据已知的 CVE 进行检查。
  • 提供用于分析的开箱即用 UI 和仪表盘。

应用分析

内置分析功能和机器学习,具有强大的 Trace Query Language。

  • 支持通过跟踪查询语言进行长期报告和汇总。
  • 支持自定义指标报告和机器学习发现异常值和模式。
  • 提供用于分析的开箱即用 UI 和仪表盘。
  • 支持通过跟踪查询语言进行长期报告和汇总。
  • 可轻松集成到数据湖或 Oracle Analytics Cloud。

Application Performance Monitoring 快速入门

博客

访问 Oracle APM 博客,获取优秀实践、技巧和技术。

动手实验室

通过研讨会,了解有关 APM 的更多信息。

参考架构

了解 Oracle APM 解决方案的设计、开发和实施准则。

联系销售

有兴趣了解有关 Application Performance Monitoring 的更多信息?让我们的专家为您提供帮助。

注:为免疑义,本网页所用以下术语专指以下含义:

  1. 除Oracle隐私政策外,本网站中提及的“Oracle”专指Oracle境外公司而非甲骨文中国 。
  2. 相关Cloud或云术语均指代Oracle境外公司提供的云技术或其解决方案。