Preços do Generative AI Service

Os modelos básicos podem ser consumidos sob demanda, em que você paga por caractere, dependendo da duração do prompt e da resposta do modelo (exceto para aqueles incorporados, no qual a respectiva resposta não é levada em conta). Na tabela abaixo: uma transação = um caractere e 10.000 transações = 10.000 caracteres.

Além disso, você pode hospedar suas próprias réplicas de modelos básicos e criar modelos com ajuste fino em clusters de IA dedicados. Os clusters de IA dedicados são oferecidos em dois tipos: hospedagem e ajuste fino. Você cria um cluster de hospedagem atribuindo unidades de IA a ele de acordo com o modelo que deseja hospedar e o volume de chamadas esperado do modelo. Os clusters de ajuste fino exigem duas unidades de IA do modelo específico que deseja ajustar. Depois de criar um modelo ajustado em um cluster de ajuste fino, é possível hospedá-lo no cluster de hospedagem.

Os clusters dedicados de IA exigem um mínimo de 744 unidades-hora (por cluster) para hospedar modelos. O ajuste fino dos clusters requer pelo menos 1 unidade-hora.

Moeda

Estimador de custos

IA Generativa da OCI

Produto	Preço de comparação (/vCPU) *	Preço unitário	Unidade
Oracle Cloud Infrastructure Generative AI - Cohere Rerank - Dedicado			Hora de cluster
Oracle Cloud Infrastructure Generative AI - Meta Llama 4 Scout			10.000 transações
Oracle Cloud Infrastructure Generative AI - Meta Llama 4 Maverick			10.000 transações
Oracle Cloud Infrastructure Generative AI - Cohere Grande			10.000 transações
Oracle Cloud Infrastructure Generative AI - Cohere Pequeno			10.000 transações
Oracle Cloud Infrastructure Generative AI - Cohere Integrado			10.000 transações
Oracle Cloud Infrastructure Generative AI – Meta Grande			10.000 transações
Oracle Cloud Infrastructure Generative AI - Meta Llama 3.1 405B			10.000 transações
Oracle Cloud Infrastructure Generative AI - Meta Llama 3.2 90B Vision			10.000 transações
Oracle Cloud Infrastructure Generative AI - Cohere Grande - Dedicado			Unidade de IA por hora
Oracle Cloud Infrastructure Generative x - Small Cohere - Dedicado			Unidade de IA por hora
Oracle Cloud Infrastructure Generative AI - Cohere Integrado - Dedicado			Unidade de IA por hora
Oracle Cloud Infrastructure Generative AI - Large Meta - Dedicated			Unidade de IA por hora
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 ou Grok 4 - Tokens de entrada			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 ou Grok 4 - Tokens de entrada em cache			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 ou Grok 4 - Tokens de saída			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - Tokens de entrada			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - Tokens de entrada em cache			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - Tokens de saída			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - Tokens de entrada			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - Tokens de entrada em cache			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - Tokens de saída			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - Tokens de entrada			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - Tokens de entrada em cache			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - Tokens de saída			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI -Grok 4 Code -Grok-Code-Fast-1-Tokens de entrada			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 4 Code Grok-Code-Fast-1- Tokens de entrada em cache			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI -Grok 4 Code - Grok-Code-Fast-1-Tokens de saída			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - Tokens de entrada - Texto, Imagem, Áudio e Vídeo com menos de 200 mil tokens de entrada			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - Google -Gemini 2.5 Pro - Tokens de entrada - Texto, Imagem, Áudio e Vídeo maiores que 200 mil tokens de entrada			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - Tokens de saída - Saída de texto com menos de 200 mil tokens de entrada			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - Tokens de Saída - Saída de texto com mais de 200 mil tokens de entrada			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - Tokens de entrada - Texto, Imagem e Vídeo			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - Tokens de entrada - Áudio			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - Tokens de saída - Texto			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - Tokens de entrada - Texto, Imagem e Vídeo			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - Tokens de entrada - Áudio			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - Tokens de saída - Texto			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 4 Fast - Input Tokens menos de 128K Tokens			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 4 Fast - Input Tokens mais de 128K Tokens			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 4 Fast - Cached Input Tokens menos de 128K Tokens			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 4 Fast - Cached Input Tokens mais de 128K Tokens			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 4 Fast - Output Tokens menos de 128K Tokens			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 4 Fast - Output Tokens mais de 128K Tokens			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - Importação de modelos			Unidade de IA por hora
Oracle Cloud Infrastructure Generative AI - OpenAI - gpt-oss-120b - Tokens de entrada			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - OpenAI - gpt-oss-120b - Tokens de saída			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - OpenAI - gpt-oss-20b - Tokens de entrada			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - OpenAI - gpt-oss-20b - Tokens de saída			1.000.000 de tokens
Oracle Cloud Infrastructure Generative AI - OpenAI - Dedicated			Unidade de IA por hora

Uma transação é um caractere. 10.000 transações = 10.000 caracteres

Os clusters dedicados de IA exigem um mínimo de 744 unidades-hora (por cluster) para hospedar modelos. O ajuste fino dos clusters requer pelo menos 1 unidade-hora.