主要特性

一般问题

VECTOR 数据类型

借助 Oracle AI Database 26ai,您可以使用新的原生 VECTOR 数据类型,直接在表中存储向量。支持具有不同维度数量和格式的向量,可匹配您选择的任意向量嵌入模型,从而简化应用开发和部署。

使用 VECTOR 数据类型创建表

灵活的向量生成

使用 ONNX 框架,导入您所选的嵌入模型,并使用数据库 API 从您首选的嵌入服务(包括 NVIDIA NIM 容器)生成向量。您也可以选择将向量直接导入到数据库中。

在数据库内以 ONNX 格式导入预训练模型以供向量生成

面向查询向量的简单标准 SQL

使用简单直观的 SQL 对向量执行相似性搜索,并在同一查询中自由地将向量与关系型、文本型、JSON 及其他数据类型组合在一起。

使用 SQL 函数进行向量操作

无缝整合 AI 向量数据与业务数据

使用简单直观的 SQL,将复杂的业务数据搜索与 AI 向量相似性搜索相结合,从而在一个查询中利用融合数据库(JSON、图形、文本、关系、空间等)的全部功能。

JSON 与 VECTOR 数据类型的兼容性

向量索引

使用高度准确的近似搜索索引(向量索引)加速相似性搜索,例如内存中相邻的图形索引,以获得高性能和相邻分区索引,从而加快大规模数据集的相似性检索。

管理不同类别的向量索引

混合向量索引

结合使用全文搜索和语义向量搜索,对文档进行索引和查询,从而改善整体搜索体验并为用户提供更准确的信息。

管理混合向量索引

简单搜索准确度规范

将目标搜索准确度设为简单的百分比,无需指定高级算法参数。在创建索引期间,定义默认精确度,并根据需要改写搜索查询。

判断向量索引的准确性

为检索增强生成提供动力

通过结合相似性搜索和业务数据搜索,提供特定于上下文的专用数据来提高响应的准确性,从而增强大语言模型 (LLM) 交互。使用内置业务标准(例如安全筛选器、业务指标和业务规则),进一步扩充检索增强生成 (RAG)。

使用检索增强生成来补充 LLM

出色的安全性

Oracle AI Vector Search 与 Oracle 出色的数据库安全功能无缝集成,可降低风险并简化合规性。通过使用强大的工具(例如加密、数据屏蔽、特权用户访问控制、活动监控和审计),企业可以保护数据,同时充分利用高级 AI 搜索功能。

数据库安全性

支持完整的生成式 AI 管道

使用原生数据库 API,端到端执行生成 AI 管道的所有环节,让开发人员可以更轻松地使用业务数据构建新一代 AI 应用 — 所有这些都可以直接在数据库中实现。

Oracle AI Vector Search 与 LlamaIndex 集成

附带 AI Vector Search 的全面机器学习套件

结合基于 AI 的向量搜索功能,处理涉及机器学习操作(决策、预测、分类、预报等)的各种 AI 用例。例如,在一个 SQL 查询中,用户可以轻松地将推断和分类与 Oracle AI Vector Search 相结合。

Oracle Machine Learning

Exadata 优化

通过 Exadata System Software 24ai 优化,加快向量索引创建和搜索速度。Exadata 为企业数据库提供高性能、可扩展性和高可用性。

Elastic Vector Memory

分层可导航小世界 (HNSW) 向量索引驻留在数据库内存中。创建 HNSW 索引时,需确保有足够的内存可以容纳索引,后续对基础表的修改可能会影响 HNSW 索引的大小。借助 Elastic Vector Memory,数据库内存将能够自动调整大小,动态容纳所有 HNSW 索引。

了解更多有关 Elastic Vector Memory 的信息

自定义向量距离函数

向量搜索操作通常基于标准距离度量,例如欧几里得、余弦和点积。但是,在某些情况下,向量搜索操作也需要特定于域或专有的度量。自定义向量距离函数允许用户创建自己的自定义度量。

了解更多有关自定义向量距离函数的信息

稀疏向量支持

稀疏向量指的是通常具有许多维度的向量,但其中只有少数维度具有非零值。由于稀疏向量仅存储非零值,因此可以提高效率并节省存储空间。通过 PL/SQL 中的原生支持,您可以直接在 PL/SQL 中创建和使用稀疏向量。稀疏向量还可以使用分层可导航小世界 (HNSW) 向量索引进行索引,从而提供速度、准确度和空间优化的所有优势。

了解更多有关稀疏向量支持的信息

注:为免疑义,本网页所用以下术语专指以下含义:

  1. 除Oracle隐私政策外,本网站中提及的“Oracle”专指Oracle境外公司而非甲骨文中国 。
  2. 相关Cloud或云术语均指代Oracle境外公司提供的云技术或其解决方案。