Preços do Generative AI Service

 

Os modelos básicos podem ser consumidos sob demanda, em que você paga por caractere, dependendo da duração do prompt e da resposta do modelo (exceto para aqueles incorporados, no qual a respectiva resposta não é levada em conta). Na tabela abaixo: uma transação = um caractere e 10.000 transações = 10.000 caracteres.

Além disso, você pode hospedar suas próprias réplicas de modelos básicos e criar modelos com ajuste fino em clusters de IA dedicados. Os clusters de IA dedicados são oferecidos em dois tipos: hospedagem e ajuste fino. Você cria um cluster de hospedagem atribuindo unidades de IA a ele de acordo com o modelo que deseja hospedar e o volume de chamadas esperado do modelo. Os clusters de ajuste fino exigem duas unidades de IA do modelo específico que deseja ajustar. Depois de criar um modelo ajustado em um cluster de ajuste fino, é possível hospedá-lo no cluster de hospedagem.

Os clusters dedicados de IA exigem um mínimo de 744 unidades-hora (por cluster) para hospedar modelos. O ajuste fino dos clusters requer pelo menos 1 unidade-hora.

IA Generativa da OCI

Produto
Preço de comparação (/vCPU) *
Preço unitário
Unidade
Oracle Cloud Infrastructure Generative AI - Cohere Rerank - Dedicado


Hora de cluster
Oracle Cloud Infrastructure Generative AI - Meta Llama 4 Scout


10.000 transações
Oracle Cloud Infrastructure Generative AI - Meta Llama 4 Maverick


10.000 transações
Oracle Cloud Infrastructure Generative AI - Cohere Grande


10.000 transações
Oracle Cloud Infrastructure Generative AI - Cohere Pequeno


10.000 transações
Oracle Cloud Infrastructure Generative AI - Cohere Integrado


10.000 transações
Oracle Cloud Infrastructure Generative AI – Meta Grande


10.000 transações
Oracle Cloud Infrastructure Generative AI - Meta Llama 3.1 405B


10.000 transações
Oracle Cloud Infrastructure Generative AI - Meta Llama 3.2 90B Vision


10.000 transações
Oracle Cloud Infrastructure Generative AI - Cohere Grande - Dedicado


Unidade de IA por hora
Oracle Cloud Infrastructure Generative x - Small Cohere - Dedicado


Unidade de IA por hora
Oracle Cloud Infrastructure Generative AI - Cohere Integrado - Dedicado


Unidade de IA por hora
Oracle Cloud Infrastructure Generative AI - Large Meta - Dedicated


Unidade de IA por hora
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 ou Grok 4 - Tokens de entrada

1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 ou Grok 4 - Tokens de entrada em cache

1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 ou Grok 4 - Tokens de saída

1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - Tokens de entrada

1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - Tokens de entrada em cache

1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - Tokens de saída

1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - Tokens de entrada

1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - Tokens de entrada em cache

1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - Tokens de saída

1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - Tokens de entrada

1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - Tokens de entrada em cache

1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - Tokens de saída

1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI -Grok 4 Code -Grok-Code-Fast-1-Tokens de entrada

1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 4 Code Grok-Code-Fast-1- Tokens de entrada em cache

1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI -Grok 4 Code - Grok-Code-Fast-1-Tokens de saída

1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - Tokens de entrada - Texto, Imagem, Áudio e Vídeo com menos de 200 mil tokens de entrada

1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - Google -Gemini 2.5 Pro - Tokens de entrada - Texto, Imagem, Áudio e Vídeo maiores que 200 mil tokens de entrada

1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - Tokens de saída - Saída de texto com menos de 200 mil tokens de entrada

1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - Tokens de Saída - Saída de texto com mais de 200 mil tokens de entrada

1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - Tokens de entrada - Texto, Imagem e Vídeo

1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - Tokens de entrada - Áudio

1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - Tokens de saída - Texto

1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - Tokens de entrada - Texto, Imagem e Vídeo

1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - Tokens de entrada - Áudio

1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - Tokens de saída - Texto

1.000.000 de tokens
  • Uma transação é um caractere. 10.000 transações = 10.000 caracteres

Os modelos básicos podem ser consumidos sob demanda, em que você paga por caractere, dependendo da duração do prompt e da resposta do modelo (exceto para aqueles incorporados, no qual a respectiva resposta não é levada em conta). Na tabela abaixo: uma transação = um caractere e 10.000 transações = 10.000 caracteres.

Além disso, você pode hospedar suas próprias réplicas de modelos básicos e criar modelos com ajuste fino em clusters de IA dedicados. Os clusters de IA dedicados são oferecidos em dois tipos: hospedagem e ajuste fino. Você cria um cluster de hospedagem atribuindo unidades de IA a ele de acordo com o modelo que deseja hospedar e o volume de chamadas esperado do modelo. Os clusters de ajuste fino exigem duas unidades de IA do modelo específico que deseja ajustar. Depois de criar um modelo ajustado em um cluster de ajuste fino, é possível hospedá-lo no cluster de hospedagem.

Os clusters dedicados de IA exigem um mínimo de 744 unidades-hora (por cluster) para hospedar modelos. O ajuste fino dos clusters requer pelo menos 1 unidade-hora.