تمثل مخططات الذكاء الاصطناعي لـ Oracle Cloud Infrastructure مجموعة من المخططات المُجمعة مُسبقًا والتي تم التحقق منها لـ OCI والتي توفر عمليات نشر مُتسقة وقابلة للتكرار لأحمال عمل GenAI في دقائق مع إمكانية المراقبة المضمنة.
تساعدك مخططات الذكاء الاصطناعي لألبنية التحتية من Oracle Cloud على نشر أحمال عمل الذكاء الاصطناعي وتوسيعها ومراقبتها في الإنتاج في غضون دقائق. تمثل مخططات الذكاء الاصطناعي مخططات نشر دون تعليمات برمجية تم التحقق منها من OCI لأحمال عمل GenAI الشائعة. تتضمن توصيات واضحة للأجهزة مع وحدات معالجة الرسومات NVIDIA؛ ومكونات مجموعة البرامج التي تم وضعها في الاعتبار، مثل NVIDIA NIM؛ وأدوات قابلية الملاحظة التي تم وضعها في حزم مُسبقًا. يتيح لك هذا نشر أحمال عمل الذكاء الاصطناعي دون الحاجة إلى اتخاذ قرارات حزم البرامج أو توفير البنية التحتية يدويًا. يمكنك أيضًا الاستفادة من ميزات البنية التحتية المُتقدمة لمخططات الذكاء الاصطناعي، مثل وحدات معالجة الرسومات (GPU) متعددة المثيلات أو التوسع التلقائي استنادًا إلى زمن انتقال الاستدلال، مع بعض تغييرات التكوين البسيطة. باستخدام هذه الإمكانات، نقلل من وقت إعداد وحدة GPU لعمليات النشر واسعة النطاق والحيوية للمهام من أسابيع إلى دقائق.
تتوفر مخططات OCI للذكاء الاصطناعي لأي مستخدم OCI مجانًا.
يمكن العثور على مخططات OCI للذكاء الاصطناعي على GitHub. في صفحة GitHub، تتبع الإرشادات التالية حول ما يلي:
لاختبار مخطط OCI للذكاء الاصطناعي، يمكنك إنشاء حاوية منفصلة ومجموعة محرك OCI Kubernetes. يؤدي نشر مخططات OCI للذكاء الاصطناعي في الحاوية الذي تم تكوينه حديثًا إلى عزل أي تأثير محتمل على مستأجرتك.
فيما يلي الحاويات والموارد المنشورة في المستأجرة:
يتم عرض جميع المخططات المتاحة هنا.
لتشغيل مخطط مقارنة استنتاج، ما عليك سوى نشر مخطط vLLM، ثم استخدام أداة مثل LLMPerf لتشغيل المقارنة مقابل نقطة انتهاء الاستنتاج.
استخدم kubectl لفحص سجلات الجراب في مجموعة محرك Oracle Kubernetes. يمكنك أيضًا فحص السجلات من بوابة مخططات الذكاء الاصطناعي.
نعم، تستفيد مخططات OCI للذكاء الاصطناعي من KEDA للتوسع التلقائي القائم على التطبيقات. راجع الوثائق للحصول على مزيد من المعلومات.
هي أي وحدات معالجة رسومات NVIDIA متاحة في منطقة OCI لديك، مثل A10 أو A100 أو H100.
نعم، يمكنك نشر مخططات OCI للذكاء الاصطناعي في مجموعة موجودة باتباع التعليمات هنا.
لتشغيل مخططات متعددة على نفس العقدة، نوصي بتمكين مجمعات العقد المشتركة. اقرأ المزيد من هنا.
تمثل الإجراءات السريعة لـ Oracle Cloud Infrastructure Data Science وOracle Cloud Infrastructure Data Science عروض PaaS تهدف إلى مساعدتك في إنشاء تطبيقات الذكاء الاصطناعي ونشرها على مثيلات الحوسبة المُدارة. تمثل مخططات الذكاء الاصطناعي معزز IaaS. تعد مخططات OCI للذكاء الاصطناعي مثالية للعملاء الذين ينشرون أحمال عمل GenAI على المثيلات المحجوزة في مستأجرتهم. في المراحل الأولية من رحلة العميل، تساعد مخططات الذكاء الاصطناعي في إثبات المفهوم (POC) ما قبل البيع، ومقارنة نماذج LLM، والنماذج الأولية السريعة لتطبيقات الذكاء الاصطناعي الشاملة، مثل الإنشاء المعزز بالاسترجاع (RAG). في المراحل اللاحقة، يمكن للعملاء استخدام مخططات الذكاء الاصطناعي لأحمال عمل الإنتاج على مجموعات Kubernetes مع تكوينات مُتقدمة مثل التوسع التلقائي والاستنتاج الموزع.
تُعد خدمة الذكاء الاصطناعي التوليدي لـ OCI عرضًا لـ PaaS. تمثل مخططات الذكاء الاصطناعي معزز IaaS. تعد مخططات OCI للذكاء الاصطناعي مثالية للعملاء الذين ينشرون أحمال عمل GenAI على المثيلات المحجوزة في مستأجرتهم. في المراحل الأولية من رحلة العميل، تساعد مخططات الذكاء الاصطناعي في إثبات المفهوم (POC) ما قبل البيع، ومقارنة نماذج LLM، والنماذج الأولية السريعة لتطبيقات الذكاء الاصطناعي الشاملة، مثل RAG. في المراحل اللاحقة، يمكن للعملاء استخدام مخططات الذكاء الاصطناعي لأحمال عمل الإنتاج على مجموعات Kubernetes مع تكوينات مُتقدمة مثل التوسع التلقائي والاستنتاج الموزع.
يمكنك نشر نماذج اللغة الكبيرة المُخصصة أو معظم النماذج المتاحة على Hugging Face باستخدام مخطط vLLM لدينا طالما أن النماذج مُتوافقة مع vLLM.
نعم.
نعم. يمكنك استخدام حلول أخرى مثل Ollama وTensorRT وNIM.
نعم. لدينا مخطط خاص باستنتاج وحدة CPU الذي يشغل Ollama على وحدات CPU.
نعم.
توفر مخططات الذكاء الاصطناعي حاليًا واجهة برمجة تطبيقات (CLI قيد التطوير). يمكنك أيضًا الاستفادة من واجهة سطر الأوامر Kueue CLI لتنسيق المهام والجدولة باستخدام مخططات الذكاء الاصطناعي.
باستخدام مخططات OCI للذكاء الاصطناعي، يمكنك الاستفادة بالطرق التالية: