基本モデルはオンデマンドで使用でき、プロンプトの長さとモデルからの応答(モデルからの応答が考慮されない埋込みモデルを除く)に基づく文字単位の支払いになっています。以下の表では、1トランザクションは1文字、10,000トランザクションは10,000文字です。
また、基本モデルのプライベート・レプリカをホストしたり、専用のAIクラスタ上で微調整されたモデルを作成したりすることができます。専用のAIクラスタは、ホスティングとファインチューニングの2つのタイプがあります。ホスティング・クラスタを作成するには、ホストするモデルと、そのモデルに対して想定されるコール量に基づいてAIユニットを割り当てます。ファインチューニング・クラスタには、微調整する特定のモデルのAIユニットが2つ必要です。ファインチューニング・クラスタで微調整されたモデルを作成したら、そのモデルをホスティング・クラスタでホストできます。
専用のAIクラスタでは、モデルをホスティングするために最低744単位時間(クラスタ当たり)のコミットメントが必要です。ファインチューニング・クラスタの場合は、最低1単位時間が必要です。
製品 |
比較価格(/vCPU)* |
単価 |
単位 |
Oracle Cloud Infrastructure Generative AI - Cohere Rerank - Dedicated |
クラスタ時間 |
||
Oracle Cloud Infrastructure Generative AI - Meta Llama 4 Scout |
10,000トランザクション |
||
Oracle Cloud Infrastructure Generative AI - Meta Llama 4 Maverick |
10,000トランザクション |
||
Oracle Cloud Infrastructure Generative AI - Large Cohere |
10,000トランザクション |
||
Oracle Cloud Infrastructure Generative AI - Small Cohere |
10,000トランザクション |
||
Oracle Cloud Infrastructure Generative AI - Embed Cohere |
10,000トランザクション |
||
Oracle Cloud Infrastructure生成AI - 大Meta |
10,000トランザクション |
||
Oracle Cloud Infrastructure Generative AI - Meta Llama 3.1 405B |
10,000トランザクション |
||
Oracle Cloud Infrastructure Generative AI - Meta Llama 3.2 90B Vision |
10,000トランザクション |
||
Oracle Cloud Infrastructure生成AI - 大Cohere - 専用 |
AIユニット/時 |
||
Oracle Cloud Infrastructure Generative x -小Cohere - 専用 |
AIユニット/時 |
||
Oracle Cloud Infrastructure生成AI - 埋込みCohere - 専用 |
AIユニット/時 |
||
Oracle Cloud Infrastructure生成AI - 大Meta - 専用 |
AIユニット/時 |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 or Grok 4 - Input Tokens |
1,000,000トークン |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 or Grok 4 - Cached Input Tokens |
1,000,000トークン |
||
Oracle Cloud Infrastructure Generative AI - xAI – Grok 3 or Grok 4 - Output Tokens |
1,000,000トークン |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - Input Tokens |
1,000,000トークン |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - Cached Input Tokens |
1,000,000トークン |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - Output Tokens |
1,000,000トークン |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - Input Tokens |
1,000,000トークン |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - Cached Input Tokens |
1,000,000トークン |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - Output Tokens |
1,000,000トークン |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - Input Tokens |
1,000,000トークン |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - Cached Input Tokens |
1,000,000トークン |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - Output Tokens |
1,000,000トークン |
||
Oracle Cloud Infrastructure Generative AI - xAI -Grok 4 Code -Grok-Code-Fast-1-Input Tokens |
1,000,000トークン |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 4 Code Grok-Code-Fast-1- Cached Input Tokens |
1,000,000トークン |
||
Oracle Cloud Infrastructure Generative AI - xAI -Grok 4 Code - Grok-Code-Fast-1-Output Tokens |
1,000,000トークン |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - Input Tokens - テキスト、画像、音声、動画いずれも20万未満の入力トークン |
1,000,000トークン |
||
Oracle Cloud Infrastructure Generative AI - Google -Gemini 2.5 Pro - Input Tokens - テキスト、画像、音声、動画いずれも20万を超える入力トークン |
1,000,000トークン |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - Output Tokens - 入力トークンが20万未満の場合のテキスト出力 |
1,000,000トークン |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - Output Tokens - 入力トークンが20万を超える場合のテキスト出力 |
1,000,000トークン |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - Input Tokens - テキスト、画像、動画 |
1,000,000トークン |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - Input Tokens - 音声 |
1,000,000トークン |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - Output Tokens - テキスト |
1,000,000トークン |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - Input Tokens - テキスト、画像、動画 |
1,000,000トークン |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - Input Tokens - 音声 |
1,000,000トークン |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - Output Tokens - テキスト |
1,000,000トークン |
基本モデルはオンデマンドで使用でき、プロンプトの長さとモデルからの応答(モデルからの応答が考慮されない埋込みモデルを除く)に基づく文字単位の支払いになっています。以下の表では、1トランザクションは1文字、10,000トランザクションは10,000文字です。
また、基本モデルのプライベート・レプリカをホストしたり、専用のAIクラスタ上で微調整されたモデルを作成したりすることができます。専用のAIクラスタは、ホスティングとファインチューニングの2つのタイプがあります。ホスティング・クラスタを作成するには、ホストするモデルと、そのモデルに対して想定されるコール量に基づいてAIユニットを割り当てます。ファインチューニング・クラスタには、微調整する特定のモデルのAIユニットが2つ必要です。ファインチューニング・クラスタで微調整されたモデルを作成したら、そのモデルをホスティング・クラスタでホストできます。
専用のAIクラスタでは、モデルをホスティングするために最低744単位時間(クラスタ当たり)のコミットメントが必要です。ファインチューニング・クラスタの場合は、最低1単位時間が必要です。