يمكن للعين البشرية عادة فك محتويات ومعنى صورة واضحة. الآن، مع قدرة الذكاء الاصطناعي التوليدي على تحديد وتفسير كميات هائلة من البيانات، يمكن لأنظمة الكمبيوتر محاكاة هذه المهمة.
سيوضح لك هذا الحل كيفية إنشاء تطبيق أساسي من صورة إلى نص يتيح للمستخدمين تحميل صورة، وإدخال موجه لغة طبيعية يصف استعلامًا عن الصورة، وتلقي استجابة قائمة على النص تم إنشاؤها بواسطة نموذج الذكاء الاصطناعي. باستخدام واجهة بسيطة تم إنشاؤها باستخدام Streamlit، وهي أداة فك ترميز صور base64، والاستفادة من واجهة برمجة تطبيقات استدلال الذكاء الاصطناعي التوليدي لـ Oracle Cloud Infrastructure (OCI) لمعالجة البيانات متعددة الوسائط (النص والصور)، من السهل تجميعها وتعمل كنقطة دخول مثالية لتجربة خدمات الذكاء الاصطناعي على OCI.