借助 Oracle AI Database 26ai,您可以使用新的原生 VECTOR 数据类型,直接在表中存储向量。支持具有不同维度数量和格式的向量,可匹配您选择的任意向量嵌入模型,从而简化应用开发和部署。
使用 ONNX 框架,导入您所选的嵌入模型,并使用数据库 API 从您首选的嵌入服务(包括 NVIDIA NIM 容器)生成向量。您也可以选择将向量直接导入到数据库中。
使用简单直观的 SQL 对向量执行相似性搜索,并在同一查询中自由地将向量与关系型、文本型、JSON 及其他数据类型组合在一起。
使用简单直观的 SQL,将复杂的业务数据搜索与 AI 向量相似性搜索相结合,从而在一个查询中利用融合数据库(JSON、图形、文本、关系、空间等)的全部功能。
使用高度准确的近似搜索索引(向量索引)加速相似性搜索,例如内存中相邻的图形索引,以获得高性能和相邻分区索引,从而加快大规模数据集的相似性检索。
结合使用全文搜索和语义向量搜索,对文档进行索引和查询,从而改善整体搜索体验并为用户提供更准确的信息。
将目标搜索准确度设为简单的百分比,无需指定高级算法参数。在创建索引期间,定义默认精确度,并根据需要改写搜索查询。
通过结合相似性搜索和业务数据搜索,提供特定于上下文的专用数据来提高响应的准确性,从而增强大语言模型 (LLM) 交互。使用内置业务标准(例如安全筛选器、业务指标和业务规则),进一步扩充检索增强生成 (RAG)。
Oracle AI Vector Search 与 Oracle 出色的数据库安全功能无缝集成,可降低风险并简化合规性。通过使用强大的工具(例如加密、数据屏蔽、特权用户访问控制、活动监控和审计),企业可以保护数据,同时充分利用高级 AI 搜索功能。
使用原生数据库 API,端到端执行生成 AI 管道的所有环节,让开发人员可以更轻松地使用业务数据构建新一代 AI 应用 — 所有这些都可以直接在数据库中实现。
Oracle AI Vector Search 与 LlamaIndex 集成
结合基于 AI 的向量搜索功能,处理涉及机器学习操作(决策、预测、分类、预报等)的各种 AI 用例。例如,在一个 SQL 查询中,用户可以轻松地将推断和分类与 Oracle AI Vector Search 相结合。
通过 Exadata System Software 24ai 优化,加快向量索引创建和搜索速度。Exadata 为企业数据库提供高性能、可扩展性和高可用性。
分层可导航小世界 (HNSW) 向量索引驻留在数据库内存中。创建 HNSW 索引时,需确保有足够的内存可以容纳索引,后续对基础表的修改可能会影响 HNSW 索引的大小。借助 Elastic Vector Memory,数据库内存将能够自动调整大小,动态容纳所有 HNSW 索引。
了解更多有关 Elastic Vector Memory 的信息
向量搜索操作通常基于标准距离度量,例如欧几里得、余弦和点积。但是,在某些情况下,向量搜索操作也需要特定于域或专有的度量。自定义向量距离函数允许用户创建自己的自定义度量。
稀疏向量指的是通常具有许多维度的向量,但其中只有少数维度具有非零值。由于稀疏向量仅存储非零值,因此可以提高效率并节省存储空间。通过 PL/SQL 中的原生支持,您可以直接在 PL/SQL 中创建和使用稀疏向量。稀疏向量还可以使用分层可导航小世界 (HNSW) 向量索引进行索引,从而提供速度、准确度和空间优化的所有优势。
注:为免疑义,本网页所用以下术语专指以下含义: