Document Understanding 的特性

面向应用的人工智能模型

OCI Document Understanding 采用光学字符识别 (OCR) 以及其他高级模型，可自动从各种文档文件（包括旋转、倾斜和有阴影的文档）中提取文本，有效解决费用处理和客户引导过程中常见的质量问题。

自动识别并提取文档中的表格结构，包括表格中的行和列关系。对于费用和身份文档，OCI Document Understanding 可以识别和提取发票、收据、护照、驾照和健康保险 ID 卡中的键值对。

识别文档并将其分类到相应的通用类别中，例如发票、收据和简历。常见应用包括费用处理、增强文档搜索和检索。

OCI Document Understanding 面向光学字符识别和键值对的预训练模型支持多种语言，包括阿拉伯语、中文、荷兰语、英语、法语、德语、希伯来语、日语、葡萄牙语、俄语、西班牙语和乌克兰语。

为键值对和文档分类使用场景创建自定义模型。借助 OCI Document Understanding，客户可以使用自有数据来训练、评估、部署和分析模型。

OCI Document Understanding 不在模型中存储任何训练、调试或其他数据，能够可靠保护客户隐私。

OCI Document Understanding 功能完备，支持通过 REST API、SDK（包括 Python 和 Java）或 OCI 命令行调用。开发人员无需具备数据科学或机器学习的专业知识即可轻松部署可扩展的文档服务。

通过供应专用端点来增强控制力，同时满足 OCI Document Understanding 工作流的高吞吐量要求。

注：为免疑义，本网页所用以下术语专指以下含义：