الأسئلة الشائعة حول مخططات الذكاء الاصطناعي

نظرة عامة والتوافر

ما المقصود بمخططات OCI للذكاء الاصطناعي؟

تمثل مخططات الذكاء الاصطناعي لـ Oracle Cloud Infrastructure مجموعة من المخططات المُجمعة مُسبقًا والتي تم التحقق منها لـ OCI والتي توفر عمليات نشر مُتسقة وقابلة للتكرار لأحمال عمل GenAI في دقائق مع إمكانية المراقبة المضمنة.

ماذا تقدم مخططات الذكاء الاصطناعي من OCI للعملاء؟

تساعدك مخططات الذكاء الاصطناعي لألبنية التحتية من Oracle Cloud على نشر أحمال عمل الذكاء الاصطناعي وتوسيعها ومراقبتها في الإنتاج في غضون دقائق. تمثل مخططات الذكاء الاصطناعي مخططات نشر دون تعليمات برمجية تم التحقق منها من OCI لأحمال عمل GenAI الشائعة. تتضمن توصيات واضحة للأجهزة مع وحدات معالجة الرسومات NVIDIA؛ ومكونات مجموعة البرامج التي تم وضعها في الاعتبار، مثل NVIDIA NIM؛ وأدوات قابلية الملاحظة التي تم وضعها في حزم مُسبقًا. يتيح لك هذا نشر أحمال عمل الذكاء الاصطناعي دون الحاجة إلى اتخاذ قرارات حزم البرامج أو توفير البنية التحتية يدويًا. يمكنك أيضًا الاستفادة من ميزات البنية التحتية المُتقدمة لمخططات الذكاء الاصطناعي، مثل وحدات معالجة الرسومات (GPU) متعددة المثيلات أو التوسع التلقائي استنادًا إلى زمن انتقال الاستدلال، مع بعض تغييرات التكوين البسيطة. باستخدام هذه الإمكانات، نقلل من وقت إعداد وحدة GPU لعمليات النشر واسعة النطاق والحيوية للمهام من أسابيع إلى دقائق.

ما تكلفة استخدام مخططات الذكاء الاصطناعي لـ OCI؟

تتوفر مخططات OCI للذكاء الاصطناعي لأي مستخدم OCI مجانًا.

بدء استخدام مخططات OCI للذكاء الاصطناعي

أين يمكنني العثور على مخططات OCI للذكاء الاصطناعي؟

يمكن العثور على مخططات OCI للذكاء الاصطناعي على GitHub. في صفحة GitHub، تتبع الإرشادات التالية حول ما يلي:

  1. تثبيت منصة مخططات OCI للذكاء الاصطناعي في مثيل قاعدة بياناتك المؤجر والوصول إلى واجهة مستخدم/واجهة برمجة تطبيقات مخططات OCI AI
  2. نشر مخطط الذكاء الاصطناعي ومراقبته
  3. عند الانتهاء، يمكنك إلغاء نشر المخطط

ما الطريقة الأكثر أمانًا لاختبار مخططات OCI للذكاء الاصطناعي في مستأجرتي؟

لاختبار مخطط OCI للذكاء الاصطناعي، يمكنك إنشاء حاوية منفصلة ومجموعة محرك OCI Kubernetes. يؤدي نشر مخططات OCI للذكاء الاصطناعي في الحاوية الذي تم تكوينه حديثًا إلى عزل أي تأثير محتمل على مستأجرتك.

ما الحاويات والموارد التي يتم نشرها في مستأجرتي؟

فيما يلي الحاويات والموارد المنشورة في المستأجرة:

  1. الحاويات الأمامية والخلفية لمخططات OCI للذكاء الاصطناعي
  2. Grafana وPrometheus (المراقبة)
  3. MLflow (تتبع التجارب)
  4. KEDA (التوسع التلقائي القائم على التطبيق)
  5. Kueue
  6. KubeRay

أين يمكنني رؤية القائمة الكاملة للمخططات؟

يتم عرض جميع المخططات المتاحة هنا.

التشغيل باستخدام مخططات OCI للذكاء الاصطناعي

كيف يمكنني تشغيل مقارنة استنتاج نماذج LLM؟

لتشغيل مخطط مقارنة استنتاج، ما عليك سوى نشر مخطط vLLM، ثم استخدام أداة مثل LLMPerf لتشغيل المقارنة مقابل نقطة انتهاء الاستنتاج.

كيف يمكنني التحقق من السجلات لاستكشاف الأخطاء وإصلاحها؟

استخدم kubectl لفحص سجلات الجراب في مجموعة محرك Oracle Kubernetes. يمكنك أيضًا فحص السجلات من بوابة مخططات الذكاء الاصطناعي.

هل تدعم مخططات OCI للذكاء الاصطناعي التوسع التلقائي؟

نعم، تستفيد مخططات OCI للذكاء الاصطناعي من KEDA للتوسع التلقائي القائم على التطبيقات. راجع الوثائق للحصول على مزيد من المعلومات.

ما هي وحدات GPU المتوافقة؟

هي أي وحدات معالجة رسومات NVIDIA متاحة في منطقة OCI لديك، مثل A10 أو A100 أو H100.

هل يمكنني النشر في مجموعة محرك Oracle Kubernetes موجودة؟

نعم، يمكنك نشر مخططات OCI للذكاء الاصطناعي في مجموعة موجودة باتباع التعليمات هنا.

كيف يمكنني تشغيل مخططات متعددة على نفس العقدة؟

لتشغيل مخططات متعددة على نفس العقدة، نوصي بتمكين مجمعات العقد المشتركة. اقرأ المزيد من هنا.

ما الفَرق بين علوم بيانات OCI/الإجراءات السريعة ومخططات الذكاء الاصطناعي؟

تمثل الإجراءات السريعة لـ Oracle Cloud Infrastructure Data Science وOracle Cloud Infrastructure Data Science عروض PaaS تهدف إلى مساعدتك في إنشاء تطبيقات الذكاء الاصطناعي ونشرها على مثيلات الحوسبة المُدارة. تمثل مخططات الذكاء الاصطناعي معزز IaaS. تعد مخططات OCI للذكاء الاصطناعي مثالية للعملاء الذين ينشرون أحمال عمل GenAI على المثيلات المحجوزة في مستأجرتهم. في المراحل الأولية من رحلة العميل، تساعد مخططات الذكاء الاصطناعي في إثبات المفهوم (POC) ما قبل البيع، ومقارنة نماذج LLM، والنماذج الأولية السريعة لتطبيقات الذكاء الاصطناعي الشاملة، مثل الإنشاء المعزز بالاسترجاع (RAG). في المراحل اللاحقة، يمكن للعملاء استخدام مخططات الذكاء الاصطناعي لأحمال عمل الإنتاج على مجموعات Kubernetes مع تكوينات مُتقدمة مثل التوسع التلقائي والاستنتاج الموزع.

ما الفَرق بين خدمة الذكاء الاصطناعي التوليدي لـ OCI ومخططات الذكاء الاصطناعي؟

تُعد خدمة الذكاء الاصطناعي التوليدي لـ OCI عرضًا لـ PaaS. تمثل مخططات الذكاء الاصطناعي معزز IaaS. تعد مخططات OCI للذكاء الاصطناعي مثالية للعملاء الذين ينشرون أحمال عمل GenAI على المثيلات المحجوزة في مستأجرتهم. في المراحل الأولية من رحلة العميل، تساعد مخططات الذكاء الاصطناعي في إثبات المفهوم (POC) ما قبل البيع، ومقارنة نماذج LLM، والنماذج الأولية السريعة لتطبيقات الذكاء الاصطناعي الشاملة، مثل RAG. في المراحل اللاحقة، يمكن للعملاء استخدام مخططات الذكاء الاصطناعي لأحمال عمل الإنتاج على مجموعات Kubernetes مع تكوينات مُتقدمة مثل التوسع التلقائي والاستنتاج الموزع.

ما النماذج التي يمكنني نشرها باستخدام مخططات OCI للذكاء الاصطناعي؟

يمكنك نشر نماذج اللغة الكبيرة المُخصصة أو معظم النماذج المتاحة على Hugging Face باستخدام مخطط vLLM لدينا طالما أن النماذج مُتوافقة مع vLLM.

هل يمكنني نشر نماذج مُتعددة الوسائط؟

نعم.

هل يمكنني خدمة نماذج LLM مع محركات الاستنتاج بخلاف vLLM؟

نعم. يمكنك استخدام حلول أخرى مثل Ollama وTensorRT وNIM.

ماذا لو لم يكن لدي وحدات GPU بعد؟ هل يمكنني نشر نماذج LLM إلى وحدات CPU باستخدام مخططات الذكاء الاصطناعي؟

نعم. لدينا مخطط خاص باستنتاج وحدة CPU الذي يشغل Ollama على وحدات CPU.

هل يمكنني استخدام مخططات الذكاء الاصطناعي مع NIM وNeMo؟

نعم.

هل تحتوي مخططات الذكاء الاصطناعي على واجهة سطر الأوامر (CLI) وواجهة برمجة التطبيقات؟

توفر مخططات الذكاء الاصطناعي حاليًا واجهة برمجة تطبيقات (CLI قيد التطوير). يمكنك أيضًا الاستفادة من واجهة سطر الأوامر Kueue CLI لتنسيق المهام والجدولة باستخدام مخططات الذكاء الاصطناعي.

ما القيمة التي توفرها مخططات الذكاء الاصطناعي؟

باستخدام مخططات OCI للذكاء الاصطناعي، يمكنك الاستفادة بالطرق التالية:

  • انشر أحمال عمل GenAI في دقائق عبر تدفق إعداد مُبسط مع مخططات وتوجيهات واضحة.
  • احصل على وقت أقصر للإنتاج وقيمة محققة أسرع لحوسبة OCI لـ GenAI من خلال تقليل مقدار الوقت المُستغرق في الإعداد الأولي والصيانة المستمرة.
  • استخدم تأهيل ذاتي للخدمة لوحدات GPU لـ GenAI مع وثائق موسعة وتركيز كبير على تجربة المستخدم النهائي مع بوابات وواجهات برمجة تطبيقات سهلة الاستهلاك.