AI 解决方案

利用开放式神经网络交换模型对 PDF 中的内容进行矢量化

介绍

在查询外部大型语言模型 (LLM) 以获得问题的答案时,通常会解决问题,但这样做的要求可能与搜索内部企业知识库和数据集略有不同。

想象一下,一个进行内部研究的组织有几个 PDF,应该由 AI 搜索引擎而不是公共 LLM 来搜索相关答案。此外,还可以使用传统的关系数据库管理系统查询以及生成式 AI 查询来增强搜索功能。

此解决方案演示了如何使用开放神经网络交换 (Open Neural Network Exchange,ONNX) 概念、创建自己的 ONNX 模型以及使用这些模型读取 PDF 和向量化内容,最终开发了一个基于 Oracle APEX 向量的搜索引擎,该引擎可以查询内部知识库(有时还可以查询外部 LLM)。

演示

演示:利用开放式神经网络交换模型将 PDF 中的内容向量化 (1:57)

先决条件和设置

  1. Oracle Cloud 账户 - 注册页面
  2. Oracle Database 23ai — 文档
  3. Oracle Machine Learning for Python — 文档
  4. ONNX — 文档
  5. Oracle APEX — 文档

注:为免疑义,本网页所用以下术语专指以下含义:

  1. 除Oracle隐私政策外,本网站中提及的“Oracle”专指Oracle境外公司而非甲骨文中国 。
  2. 相关Cloud或云术语均指代Oracle境外公司提供的云技术或其解决方案。