AI Blueprints

Oracle Cloud Infrastructure（OCI）AIブループリントを使用して、生成AIワークロードを数分で導入、スケーリング、モニターします。ハードウェアの推奨、ソフトウェア・コンポーネント、すぐに可能なモニタリングを含む、パッケージ化されたOCI検証済みの導入ブループリントをご利用いただけます。

AIブループリントを試す

OCI AI Blueprintsが使用される理由

OCIが検証したベストプラクティスで確実な導入

OCI検証済みのベストプラクティス上に構築されたブループリントを使用して、AIワークロード導入のスケーリング、ドライバとアプリケーションの互換性の判断、管理容易性と管理意思決定を管理します。

次回のWebキャストに登録する
生成AI導入の簡素化

検証済みのハードウェア、ソフトウェア、すぐに利用可能なモニタリングを含むブループリントにより、ミッションクリティカルな生成AIワークロードを数分で導入およびモニタリングできます。

開発者ブログを読む
AIモニタリングと可観測性への懸念の緩和

Prometheus、Grafana、MLflowなどのサードパーティーの可観測性アプリケーションへのデフォルトの連携を導入し、AIワークロード全体にわたりモニタリングと可観測性の懸念を緩和します。

OCI AI Blueprintsを今すぐ試す

AIブループリントの一般的なユース・ケース

ブループリント

vLLMによるLLM推論とVLM推論

仮想大規模言語モデル（vLLM）と呼ばれるオープンソース・インターフェース・エンジンを使用して、大規模言語モデル（LLM）とビジョン言語モデル（VLM）の導入を簡素化します。カスタム・モデルを導入するか、Hugging Faceの様々なオープン・モデルからお選びください。
ブループリント

ファインチューニングのベンチマーク

MLCommonsの方法を使用して、ファインチューニングのためのインフラストラクチャのベンチマークを効率化します。量子化されたLlama-2-70Bモデルを標準データセットでファインチューニングします。
ブループリント

LoRAによるファインチューニング

OCI AI Blueprintsは、LLMファインチューニングの非常に効率的な手法である低ランク適応（LoRA）を使用して、効率的なモデルのチューニングを実現します。カスタムLLMをファインチューニングするか、Hugging Faceのほとんどの開放性LLMを使用してください。
ブループリント

Health Checks

本番または調査ワークロードを導入する前に、堅牢な事前チェックのブループリントを使用してGPUの健全性を徹底的に検証し、問題を先行的に検出して対処することができます。シングルノード環境とマルチノード環境間で、GPUインフラストラクチャが高負荷のエクスペリエンスに対応していることを確認します。
ブループリント

CPU推論

Mistral、Gemmaなど、さまざまなサポート・モデルを使用しているOllamaプラットフォームを使用して、CPU上でLLMを提供する包括的なフレームワークを導入します。
ブループリント

RDMAおよびvLLMによるマルチノード推論

このブループリントを使用することにより、通常1つまたは複数のGPUを搭載した複数のコンピューティング・ノードにわたり、推論サービングを分散させることができます。たとえば、vLLMとLeaderWorkerSetを使用して、複数のH100ノードにわたってLlama 405BサイズのLLMをRDMAで導入します。
ブループリント

vLLMによるスケーリング推論

推論レイテンシなどのアプリケーション指標を使用して複数のGPUやノードにスケールするKEDAを使用して、自動スケーリングでLLMを提供します。
ブループリント

MIGによるLLM推論

NVIDIAのマルチインスタンスGPUを使用して、LLMをGPUの一部に導入し、vLLMでそれらを提供します。

テクノロジーにOCI AI Blueprintsを活用

意見に基づくハードウェア推奨、パッケージ化されたソフトウェア・スタック、すぐに利用可能な可観測性ツールにより、AIアプリケーションを迅速かつ効率的に実行できます。

検証済みハードウェアの推奨

推奨するOCI GPU、CPU、ネットワーキング構成上でテストされたパッケージ化されたブループリントを使用して、生成AIワークロードを確実に導入することができます。
意見を取り入れ、パッケージ化されたソフトウェア・スタック

RAG、ファインチューニング、推論など、一般的なAIのユースケースに必要なフレームワーク、ライブラリ、モデル構成を導入したり、ビジネス・ニーズに合わせてユースケースをカスタマイズできます。
組み込みの可観測性と自動スケーリング

モニタリング、ロギング、スケーリングなどの ML 運用タスクの自動化により、インフラストラクチャ管理を簡素化できます。Prometheus、Grafana、MLflow、KEDAなどのプリインストール・ツールにより、最小限の取り組みで本番レベルの環境を迅速に開始できます。