Generative AI Service 的定价

 

基础模型可以按需使用,您可以根据提示词的长度和模型的回答按字符付费(嵌入模型除外,该模型的回答不计入字符数)。在下表中,1 个事务 = 1 个字符,10000 个事务 = 10000 个字符。

此外,您可以托管基础模型的私有副本,并在专用 AI 集群上创建微调模型。专用 AI 集群分为两种类型:托管和微调。您可以根据要托管的模型以及模型的预计调用量,将 AI 单元分配给集群,以此创建托管集群。微调群集需要特定模型(即您想要微调的模型)的两个 AI 单元。在微调集群中创建微调模型后,您就可以将其托管在自己的托管集群上了。

专用 AI 集群要求最低承诺 744 个单元小时(每个集群)用于托管模型。微调群集至少需要 1 个单元小时。

OCI Generative AI

产品
价格对比 (vCPU) *
单价
单位
Oracle Cloud Infrastructure Generative AI - Cohere Rerank - Dedicated


集群小时
Oracle Cloud Infrastructure Generative AI - Meta Llama 4 Scout


10000 个事务
Oracle Cloud Infrastructure Generative AI - Meta Llama 4 Maverick


10000 个事务
Oracle Cloud Infrastructure Generative AI - Large Cohere


10000 个事务
Oracle Cloud Infrastructure Generative AI - Small Cohere


10000 个事务
Oracle Cloud Infrastructure Generative AI - Embed Cohere


10000 个事务
Oracle Cloud Infrastructure Generative AI — 大型 Meta


10000 个事务
Oracle Cloud Infrastructure Generative AI — Meta Llama 3.1 405B


10000 个事务
Oracle Cloud Infrastructure Generative AI - Meta Llama 3.2 90B Vision


10000 个事务
Oracle Cloud Infrastructure Generative AI - 大型 Cohere - 专有


AI 单位/小时
Oracle Cloud Infrastructure Generative x - 小型 Cohere - 专有


AI 单位/小时
Oracle Cloud Infrastructure Generative AI - 内嵌式 Cohere - 专有


AI 单位/小时
Oracle Cloud Infrastructure Generative AI - 大型 Meta - 专有


AI 单位/小时
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 或 Grok 4 - 输入 Token

1000000 个 Token
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 或 Grok 4 - 缓存输入 Token

1000000 个 Token
Oracle Cloud Infrastructure Generative AI - xAI – Grok 3 或 Grok 4 - 输出 Token

1000000 个 Token
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - 输入 Token

1000000 个 Token
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - 缓存输入 Token

1000000 个 Token
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - 输出 Token

1000000 个 Token
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - 输入 Token

1000000 个 Token
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - 缓存输入 Token

1000000 个 Token
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - 输出 Token

1000000 个 Token
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - 输入 Token

1000000 个 Token
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - 缓存输入 Token

1000000 个 Token
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - 输出 Token

1000000 个 Token
Oracle Cloud Infrastructure Generative AI - xAI -Grok 4 Code -Grok-Code-Fast-1- 输入 Token

1000000 个 Token
Oracle Cloud Infrastructure Generative AI - xAI - Grok 4 Code Grok-Code-Fast-1- 缓存输入 Token

1000000 个 Token
Oracle Cloud Infrastructure Generative AI - xAI -Grok 4 Code - Grok-Code-Fast-1- 输出 Token

1000000 个 Token
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - 输入 Token - 输入 Token 数小于 200000 的文本、图像、音频和视频

1000000 个 Token
Oracle Cloud Infrastructure Generative AI - Google -Gemini 2.5 Pro - 输入 Token - 输入 Token 数大于 200000 的文本、图像、音频和视频

1000000 个 Token
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - 输出 Token - 输入 Token 数小于 200000 的文本输出

1000000 个 Token
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - 输出 Token - 输入 Token 数小于 200000 的文本输出

1000000 个 Token
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - 输入 Token - 文本、图像和视频

1000000 个 Token
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - 输入 Token - 音频

1000000 个 Token
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - 输出 Token - 文本

1000000 个 Token
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - 输入 Token - 文本、图像和视频

1000000 个 Token
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - 输入 Token - 音频

1000000 个 Token
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - 输出 Token - 文本

1000000 个 Token
  • 1 个事务即为 1 个字符。10000 个事务 = 10000 个字符

基础模型可以按需使用,您可以根据提示词的长度和模型的回答按字符付费(嵌入模型除外,该模型的回答不计入字符数)。在下表中,1 个事务 = 1 个字符,10000 个事务 = 10000 个字符。

此外,您可以托管基础模型的私有副本,并在专用 AI 集群上创建微调模型。专用 AI 集群分为两种类型:托管和微调。您可以根据要托管的模型以及模型的预计调用量,将 AI 单元分配给集群,以此创建托管集群。微调群集需要特定模型(即您想要微调的模型)的两个 AI 单元。在微调集群中创建微调模型后,您就可以将其托管在自己的托管集群上了。

专用 AI 集群要求最低承诺 744 个单元小时(每个集群)用于托管模型。微调群集至少需要 1 个单元小时。

注:为免疑义,本网页所用以下术语专指以下含义:

  1. 除Oracle隐私政策外,本网站中提及的“Oracle”专指Oracle境外公司而非甲骨文中国 。
  2. 相关Cloud或云术语均指代Oracle境外公司提供的云技术或其解决方案。