Solution IA

Posez des questions et obtenez des réponses sur les photos téléchargées à l'aide de GenAI

Introduction

L'œil humain peut généralement déchiffrer le contenu et la signification d'une photographie simple. Maintenant, avec la capacité de l'IA générative à identifier et à interpréter de grandes quantités de données, les systèmes informatiques peuvent imiter cette tâche.

Cette solution vous montrera comment créer une application image-texte de base qui permet aux utilisateurs de télécharger une image, de saisir une invite en langage naturel décrivant une requête sur l'image et de recevoir une réponse textuelle générée par le modèle d'IA. Grâce à une interface simple construite avec Streamlit, un décodeur d'image base64 et à l'API d'inférence d'IA générative d'Oracle Cloud Infrastructure (OCI) pour le traitement de données multimodales (texte et images), il est facile à assembler et constitue un point d'entrée idéal pour tester les services d'IA sur OCI.

Démonstration

Démo : Posez des questions et obtenez des réponses sur les photos téléchargées à l'aide de GenAI (1:19)

Prérequis et configuration

  1. Compte Oracle Cloud : page d'inscription
  2. OCI Generative AI : documentation
  3. Streamlit - documentation