Oracle Cloud Infrastructure AI Blueprintsは、OCIのためにあらかじめパッケージ化され検証されたブループリント・スイートであり、可観測性を組み込んだGenAIワークロードの一貫した反復可能な導入を数分で提供します。
Oracle Cloud Infrastructure AI Blueprintsは、AIワークロードを数分で導入、拡張、監視できるよう支援します。AIブループリントは、OCIによって検証された、一般的な生成AIワークロード用のコード不要の導入ブループリントです。これには、NVIDIA GPUによる明確なハードウェア推奨、NVIDIA NIMのようなソフトウェア・スタック・コンポーネント、およびパッケージ化された可観測性ツールが含まれます。これにより、ソフトウェア・スタックの意思決定やインフラストラクチャのプロビジョニングを手動で行うことなく、AIワークロードの導入が実現できます。また、マルチインスタンス GPU や推論のレイテンシに基づく自動スケーリングなど、AI Blueprints の高度なインフラストラクチャ機能も、シンプルな構成変更で活用できます。これらの機能により、スケーリングされたミッションクリティカルな導入のためのGPUオンボーディングを数週間から数分に短縮します。
OCI AI Blueprintsは、OCIユーザーであればどなたでも無料でご利用いただけます。
OCI AI Blueprintsは、GitHubにあります。GitHubページでは、次の方法に関する指示に従います。
OCI AIブループリントをテストするには、個別のコンパートメントとOCI Kubernetes Engineクラスタを作成します。新しく作成された区画にOCI AI Blueprintsを導入することで、テナントへの潜在的な影響が隔離されます。
テナンシに導入されているコンテナおよびリソースは次のとおりです:
使用可能なすべてのブループリントは、こちらから一覧をご確認いただけます。
推論ベンチマーク・ブループリントを実行するには、vLLM ブループリントを導入し、LLMPerf などのツールを使用して推論エンドポイントに対してベンチマークを実行するだけです。
kubectl を使用して、Oracle Kubernetes Engine クラスタのポッドログを検査します。kubectl を使用して、Oracle Kubernetes Engine クラスタのポッドログを検査します。
はい、OCI AIブループリントは、アプリケーション主導の自動スケーリングにKEDAを活用しています。詳細については、ドキュメントをご覧ください。
A10、A100、H100など、OCIリージョンで利用可能なNVIDIA GPUのいずれとも互換性があります。
はい、こちらの手順に従って、OCI AI ブループリントを既存のクラスタに導入できます。
複数のブループリントを同じノードで実行するには、共有ノードプールを有効にすることを推奨します。続きを読む
Oracle Cloud Infrastructure Data ScienceおよびOracle Cloud Infrastructure Data Science Quick Actionsは、マネージド・コンピュート・インスタンス上でのAIアプリケーションの構築と導入を支援することを目的としたPaaSです。AI BlueprintsはIaaSブースターです。OCI AI Blueprintsは、テナント内の予約済みインスタンスに生成AIワークロードを導入するお客様に最適です。カスタマー・ジャーニーの初期段階において、AIブループリントはプリセールスPOC、LLMベンチマーク、検索拡張生成(RAG)などのエンドツーエンドのAIアプリケーションの迅速なプロトタイピングを支援します。後の段階では、お客様は自動スケーリングや分散推論などの高度な構成を備えたKubernetesクラスタ上の本番ワークロードにAIブループリントを使用することができます。
OCI Generative AIサービスは、PaaS製品です。AI BlueprintsはIaaSブースターです。OCI AI Blueprintsは、テナント内の予約済みインスタンスに生成AIワークロードを導入するお客様に最適です。カスタマー・ジャーニーの初期段階において、AIブループリントはプリセールスPOC、LLMベンチマーク、RAGなどのエンドツーエンドのAIアプリケーションの迅速なプロトタイピングを支援します。後の段階では、お客様は自動スケーリングや分散推論などの高度な構成を備えたKubernetesクラスタ上の本番ワークロードにAIブループリントを使用することができます。
モデルがvLLMと互換性がある限り、カスタムLLMや Hugging Faceで利用可能なほとんどのモデルをvLLMブループリントで導入できます。
はい。
はい。Ollama、TensorRT、NIMなどの他のソリューションを使用できます。
はい。CPU上でOllamaを実行するCPU推論専用のブループリントがあります。
はい。
AI Blueprints は現在 PIを提供しています(CLIは開発中です)。Kueue CLIをAI Blueprintsのジョブ・オーケストレーションとスケジューリングに活用することもできます。
OCI AI Blueprintsを使用すると、次のようなメリットがあります。