基础模型可以按需使用,您可以根据提示词的长度和模型的回答按字符付费(嵌入模型除外,该模型的回答不计入字符数)。在下表中,1 个事务 = 1 个字符,10000 个事务 = 10000 个字符。
此外,您可以托管基础模型的私有副本,并在专用 AI 集群上创建微调模型。专用 AI 集群分为两种类型:托管和微调。您可以根据要托管的模型以及模型的预计调用量,将 AI 单元分配给集群,以此创建托管集群。微调群集需要特定模型(即您想要微调的模型)的两个 AI 单元。在微调集群中创建微调模型后,您就可以将其托管在自己的托管集群上了。
专用 AI 集群要求最低承诺 744 个单元小时(每个集群)用于托管模型。微调群集至少需要 1 个单元小时。
产品 |
价格对比 (vCPU) * |
单价 |
单位 |
Oracle Cloud Infrastructure Generative AI - Cohere Rerank - Dedicated |
集群小时 |
||
Oracle Cloud Infrastructure Generative AI - Meta Llama 4 Scout |
10000 个事务 |
||
Oracle Cloud Infrastructure Generative AI - Meta Llama 4 Maverick |
10000 个事务 |
||
Oracle Cloud Infrastructure Generative AI - Large Cohere |
10000 个事务 |
||
Oracle Cloud Infrastructure Generative AI - Small Cohere |
10000 个事务 |
||
Oracle Cloud Infrastructure Generative AI - Embed Cohere |
10000 个事务 |
||
Oracle Cloud Infrastructure Generative AI — 大型 Meta |
10000 个事务 |
||
Oracle Cloud Infrastructure Generative AI — Meta Llama 3.1 405B |
10000 个事务 |
||
Oracle Cloud Infrastructure Generative AI - Meta Llama 3.2 90B Vision |
10000 个事务 |
||
Oracle Cloud Infrastructure Generative AI - 大型 Cohere - 专有 |
AI 单位/小时 |
||
Oracle Cloud Infrastructure Generative x - 小型 Cohere - 专有 |
AI 单位/小时 |
||
Oracle Cloud Infrastructure Generative AI - 内嵌式 Cohere - 专有 |
AI 单位/小时 |
||
Oracle Cloud Infrastructure Generative AI - 大型 Meta - 专有 |
AI 单位/小时 |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 或 Grok 4 - 输入 Token |
1000000 个 Token |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 或 Grok 4 - 缓存输入 Token |
1000000 个 Token |
||
Oracle Cloud Infrastructure Generative AI - xAI – Grok 3 或 Grok 4 - 输出 Token |
1000000 个 Token |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - 输入 Token |
1000000 个 Token |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - 缓存输入 Token |
1000000 个 Token |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - 输出 Token |
1000000 个 Token |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - 输入 Token |
1000000 个 Token |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - 缓存输入 Token |
1000000 个 Token |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - 输出 Token |
1000000 个 Token |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - 输入 Token |
1000000 个 Token |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - 缓存输入 Token |
1000000 个 Token |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - 输出 Token |
1000000 个 Token |
||
Oracle Cloud Infrastructure Generative AI - xAI -Grok 4 Code -Grok-Code-Fast-1- 输入 Token |
1000000 个 Token |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 4 Code Grok-Code-Fast-1- 缓存输入 Token |
1000000 个 Token |
||
Oracle Cloud Infrastructure Generative AI - xAI -Grok 4 Code - Grok-Code-Fast-1- 输出 Token |
1000000 个 Token |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - 输入 Token - 输入 Token 数小于 200000 的文本、图像、音频和视频 |
1000000 个 Token |
||
Oracle Cloud Infrastructure Generative AI - Google -Gemini 2.5 Pro - 输入 Token - 输入 Token 数大于 200000 的文本、图像、音频和视频 |
1000000 个 Token |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - 输出 Token - 输入 Token 数小于 200000 的文本输出 |
1000000 个 Token |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - 输出 Token - 输入 Token 数小于 200000 的文本输出 |
1000000 个 Token |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - 输入 Token - 文本、图像和视频 |
1000000 个 Token |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - 输入 Token - 音频 |
1000000 个 Token |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - 输出 Token - 文本 |
1000000 个 Token |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - 输入 Token - 文本、图像和视频 |
1000000 个 Token |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - 输入 Token - 音频 |
1000000 个 Token |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - 输出 Token - 文本 |
1000000 个 Token |
基础模型可以按需使用,您可以根据提示词的长度和模型的回答按字符付费(嵌入模型除外,该模型的回答不计入字符数)。在下表中,1 个事务 = 1 个字符,10000 个事务 = 10000 个字符。
此外,您可以托管基础模型的私有副本,并在专用 AI 集群上创建微调模型。专用 AI 集群分为两种类型:托管和微调。您可以根据要托管的模型以及模型的预计调用量,将 AI 单元分配给集群,以此创建托管集群。微调群集需要特定模型(即您想要微调的模型)的两个 AI 单元。在微调集群中创建微调模型后,您就可以将其托管在自己的托管集群上了。
专用 AI 集群要求最低承诺 744 个单元小时(每个集群)用于托管模型。微调群集至少需要 1 个单元小时。
注:为免疑义,本网页所用以下术语专指以下含义: