生成AIサービスの価格

 

基本モデルはオンデマンドで使用でき、プロンプトの長さとモデルからの応答(モデルからの応答が考慮されない埋込みモデルを除く)に基づく文字単位の支払いになっています。以下の表では、1トランザクションは1文字、10,000トランザクションは10,000文字です。

また、基本モデルのプライベート・レプリカをホストしたり、専用のAIクラスタ上で微調整されたモデルを作成したりすることができます。専用のAIクラスタは、ホスティングとファインチューニングの2つのタイプがあります。ホスティング・クラスタを作成するには、ホストするモデルと、そのモデルに対して想定されるコール量に基づいてAIユニットを割り当てます。ファインチューニング・クラスタには、微調整する特定のモデルのAIユニットが2つ必要です。ファインチューニング・クラスタで微調整されたモデルを作成したら、そのモデルをホスティング・クラスタでホストできます。

専用のAIクラスタでは、モデルをホスティングするために最低744単位時間(クラスタ当たり)のコミットメントが必要です。ファインチューニング・クラスタの場合は、最低1単位時間が必要です。

OCI生成AI

製品
比較価格(/vCPU)*
単価
単位
Oracle Cloud Infrastructure Generative AI - Cohere Rerank - Dedicated


クラスタ時間
Oracle Cloud Infrastructure Generative AI - Meta Llama 4 Scout


10,000トランザクション
Oracle Cloud Infrastructure Generative AI - Meta Llama 4 Maverick


10,000トランザクション
Oracle Cloud Infrastructure Generative AI - Large Cohere


10,000トランザクション
Oracle Cloud Infrastructure Generative AI - Small Cohere


10,000トランザクション
Oracle Cloud Infrastructure Generative AI - Embed Cohere


10,000トランザクション
Oracle Cloud Infrastructure生成AI - 大Meta


10,000トランザクション
Oracle Cloud Infrastructure Generative AI - Meta Llama 3.1 405B


10,000トランザクション
Oracle Cloud Infrastructure Generative AI - Meta Llama 3.2 90B Vision


10,000トランザクション
Oracle Cloud Infrastructure生成AI - 大Cohere - 専用


AIユニット/時
Oracle Cloud Infrastructure Generative x -小Cohere - 専用


AIユニット/時
Oracle Cloud Infrastructure生成AI - 埋込みCohere - 専用


AIユニット/時
Oracle Cloud Infrastructure生成AI - 大Meta - 専用


AIユニット/時
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 or Grok 4 - Input Tokens

1,000,000トークン
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 or Grok 4 - Cached Input Tokens

1,000,000トークン
Oracle Cloud Infrastructure Generative AI - xAI – Grok 3 or Grok 4 - Output Tokens

1,000,000トークン
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - Input Tokens

1,000,000トークン
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - Cached Input Tokens

1,000,000トークン
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - Output Tokens

1,000,000トークン
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - Input Tokens

1,000,000トークン
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - Cached Input Tokens

1,000,000トークン
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - Output Tokens

1,000,000トークン
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - Input Tokens

1,000,000トークン
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - Cached Input Tokens

1,000,000トークン
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - Output Tokens

1,000,000トークン
Oracle Cloud Infrastructure Generative AI - xAI -Grok 4 Code -Grok-Code-Fast-1-Input Tokens

1,000,000トークン
Oracle Cloud Infrastructure Generative AI - xAI - Grok 4 Code Grok-Code-Fast-1- Cached Input Tokens

1,000,000トークン
Oracle Cloud Infrastructure Generative AI - xAI -Grok 4 Code - Grok-Code-Fast-1-Output Tokens

1,000,000トークン
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - Input Tokens - テキスト、画像、音声、動画いずれも20万未満の入力トークン

1,000,000トークン
Oracle Cloud Infrastructure Generative AI - Google -Gemini 2.5 Pro - Input Tokens - テキスト、画像、音声、動画いずれも20万を超える入力トークン

1,000,000トークン
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - Output Tokens - 入力トークンが20万未満の場合のテキスト出力

1,000,000トークン
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - Output Tokens - 入力トークンが20万を超える場合のテキスト出力

1,000,000トークン
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - Input Tokens - テキスト、画像、動画

1,000,000トークン
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - Input Tokens - 音声

1,000,000トークン
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - Output Tokens - テキスト

1,000,000トークン
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - Input Tokens - テキスト、画像、動画

1,000,000トークン
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - Input Tokens - 音声

1,000,000トークン
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - Output Tokens - テキスト

1,000,000トークン
  • 1トランザクションは1文字、10,000トランザクションは10,000文字

基本モデルはオンデマンドで使用でき、プロンプトの長さとモデルからの応答(モデルからの応答が考慮されない埋込みモデルを除く)に基づく文字単位の支払いになっています。以下の表では、1トランザクションは1文字、10,000トランザクションは10,000文字です。

また、基本モデルのプライベート・レプリカをホストしたり、専用のAIクラスタ上で微調整されたモデルを作成したりすることができます。専用のAIクラスタは、ホスティングとファインチューニングの2つのタイプがあります。ホスティング・クラスタを作成するには、ホストするモデルと、そのモデルに対して想定されるコール量に基づいてAIユニットを割り当てます。ファインチューニング・クラスタには、微調整する特定のモデルのAIユニットが2つ必要です。ファインチューニング・クラスタで微調整されたモデルを作成したら、そのモデルをホスティング・クラスタでホストできます。

専用のAIクラスタでは、モデルをホスティングするために最低744単位時間(クラスタ当たり)のコミットメントが必要です。ファインチューニング・クラスタの場合は、最低1単位時間が必要です。