Solução de IA

Aproveitando modelos de troca de rede neural aberta para vetorizar conteúdo em PDFs

Introdução

Embora a consulta de grandes modelos de linguagem externos (LLMs) para respostas a perguntas muitas vezes resolva um problema, os requisitos para isso podem diferir um pouco da pesquisa de repositórios de conhecimento corporativos internos e conjuntos de dados.

Imagine que uma organização que realiza pesquisas internas tenha vários PDFs que devem ser pesquisados por um mecanismo de pesquisa de IA, em vez de LLMs públicos, para obter respostas relevantes. Há também a possibilidade de usar consultas tradicionais do sistema de gerenciamento de banco de dados relacional, juntamente com consultas de IA generativa, para tornar a pesquisa mais avançada.

Esta solução demonstra como usar os conceitos do Open Neural Network Exchange (ONNX), criar nossos próprios modelos ONNX e usar esses modelos para ler PDFs e vetorizar conteúdo, desenvolvendo um mecanismo de pesquisa baseado em vetores do Oracle APEX que pode consultar repositórios de conhecimento internos (e às vezes também consultar LLMs externos).

Demonstração

Demonstração: Aproveitando modelos de troca de rede neural aberta para vetorizar conteúdo em PDFs (1:57)

Pré-requisitos e configuração

  1. Conta Oracle Cloud —página de cadastro
  2. Oracle Database 23ai — documentação
  3. Oracle Machine Learning for Python — documentação
  4. ONNX — documentação
  5. Oracle APEX — documentação