AI 解決方案

利用開放式神經網路交換模型將 PDF 中的內容向量化

簡介

查詢外部大型語言模型 (LLM) 以找出問題的答案通常會解決問題,但這樣做的需求可能會與搜尋內部企業知識儲存庫和資料集略有不同。

假設進行內部研究的組織有數個 PDF,應由 AI 搜尋引擎搜尋,而非公用 LLM 以取得相關答案。此外,還可以使用傳統的關聯式資料庫管理系統查詢以及生成式 AI 查詢,讓搜尋更強大。

此解決方案示範如何使用 Open Neural Network Exchange (ONNX) 概念、建立自己的 ONNX 模型,並使用這些模型來讀取 PDF 和向量化內容,最終開發可查詢內部知識儲存庫 (有時也會查詢外部 LLM) 的 Oracle APEX 向量式搜尋引擎。

展示

示範:利用開放式神經網路交換模型將 PDF 中的內容向量化 (1:57)

先決條件與設定

  1. Oracle Cloud 帳戶 — 註冊頁面
  2. Oracle Database 23ai —文件
  3. Oracle Machine Learning for Python —文件
  4. ONNX —文件
  5. Oracle APEX —文件