人類的眼睛通常可以解譯直接照相的內容和意義。現在,透過生成式 AI 能夠識別和解譯大量資料,電腦系統可以模擬這項任務。
此解決方案將向您展示如何建立基本的影像至文字應用程式,讓使用者上傳影像、輸入描述影像查詢的自然語言提示,以及接收 AI 模型產生的文字式回應。使用以 Streamlit (base64 影像解碼器) 建置的簡單介面,並運用 Oracle Cloud Infrastructure (OCI) Generative AI 推論 API 處理多模型資料 (文字和影像),即可輕鬆整合並作為在 OCI 上試用 AI 服務的理想進入點。