Os modelos básicos podem ser consumidos sob demanda, em que você paga por caractere, dependendo da duração do prompt e da resposta do modelo (exceto para aqueles incorporados, no qual a respectiva resposta não é levada em conta). Na tabela abaixo: uma transação = um caractere e 10.000 transações = 10.000 caracteres.
Além disso, você pode hospedar suas próprias réplicas de modelos básicos e criar modelos com ajuste fino em clusters de IA dedicados. Os clusters de IA dedicados são oferecidos em dois tipos: hospedagem e ajuste fino. Você cria um cluster de hospedagem atribuindo unidades de IA a ele de acordo com o modelo que deseja hospedar e o volume de chamadas esperado do modelo. Os clusters de ajuste fino exigem duas unidades de IA do modelo específico que deseja ajustar. Depois de criar um modelo ajustado em um cluster de ajuste fino, é possível hospedá-lo no cluster de hospedagem.
Os clusters dedicados de IA exigem um mínimo de 744 unidades-hora (por cluster) para hospedar modelos. O ajuste fino dos clusters requer pelo menos 1 unidade-hora.
Produto |
Preço de comparação (/vCPU) * |
Preço unitário |
Unidade |
Oracle Cloud Infrastructure Generative AI - Cohere Rerank - Dedicado |
Hora de cluster |
||
Oracle Cloud Infrastructure Generative AI - Meta Llama 4 Scout |
10.000 transações |
||
Oracle Cloud Infrastructure Generative AI - Meta Llama 4 Maverick |
10.000 transações |
||
Oracle Cloud Infrastructure Generative AI - Cohere Grande |
10.000 transações |
||
Oracle Cloud Infrastructure Generative AI - Cohere Pequeno |
10.000 transações |
||
Oracle Cloud Infrastructure Generative AI - Cohere Integrado |
10.000 transações |
||
Oracle Cloud Infrastructure Generative AI – Meta Grande |
10.000 transações |
||
Oracle Cloud Infrastructure Generative AI - Meta Llama 3.1 405B |
10.000 transações |
||
Oracle Cloud Infrastructure Generative AI - Meta Llama 3.2 90B Vision |
10.000 transações |
||
Oracle Cloud Infrastructure Generative AI - Cohere Grande - Dedicado |
Unidade de IA por hora |
||
Oracle Cloud Infrastructure Generative x - Small Cohere - Dedicado |
Unidade de IA por hora |
||
Oracle Cloud Infrastructure Generative AI - Cohere Integrado - Dedicado |
Unidade de IA por hora |
||
Oracle Cloud Infrastructure Generative AI - Large Meta - Dedicated |
Unidade de IA por hora |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 ou Grok 4 - Tokens de entrada |
1.000.000 de tokens |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 ou Grok 4 - Tokens de entrada em cache |
1.000.000 de tokens |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 ou Grok 4 - Tokens de saída |
1.000.000 de tokens |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - Tokens de entrada |
1.000.000 de tokens |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - Tokens de entrada em cache |
1.000.000 de tokens |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - Tokens de saída |
1.000.000 de tokens |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - Tokens de entrada |
1.000.000 de tokens |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - Tokens de entrada em cache |
1.000.000 de tokens |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - Tokens de saída |
1.000.000 de tokens |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - Tokens de entrada |
1.000.000 de tokens |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - Tokens de entrada em cache |
1.000.000 de tokens |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - Tokens de saída |
1.000.000 de tokens |
||
Oracle Cloud Infrastructure Generative AI - xAI -Grok 4 Code -Grok-Code-Fast-1-Tokens de entrada |
1.000.000 de tokens |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 4 Code Grok-Code-Fast-1- Tokens de entrada em cache |
1.000.000 de tokens |
||
Oracle Cloud Infrastructure Generative AI - xAI -Grok 4 Code - Grok-Code-Fast-1-Tokens de saída |
1.000.000 de tokens |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - Tokens de entrada - Texto, Imagem, Áudio e Vídeo com menos de 200 mil tokens de entrada |
1.000.000 de tokens |
||
Oracle Cloud Infrastructure Generative AI - Google -Gemini 2.5 Pro - Tokens de entrada - Texto, Imagem, Áudio e Vídeo maiores que 200 mil tokens de entrada |
1.000.000 de tokens |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - Tokens de saída - Saída de texto com menos de 200 mil tokens de entrada |
1.000.000 de tokens |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - Tokens de Saída - Saída de texto com mais de 200 mil tokens de entrada |
1.000.000 de tokens |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - Tokens de entrada - Texto, Imagem e Vídeo |
1.000.000 de tokens |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - Tokens de entrada - Áudio |
1.000.000 de tokens |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - Tokens de saída - Texto |
1.000.000 de tokens |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - Tokens de entrada - Texto, Imagem e Vídeo |
1.000.000 de tokens |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - Tokens de entrada - Áudio |
1.000.000 de tokens |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - Tokens de saída - Texto |
1.000.000 de tokens |
Os modelos básicos podem ser consumidos sob demanda, em que você paga por caractere, dependendo da duração do prompt e da resposta do modelo (exceto para aqueles incorporados, no qual a respectiva resposta não é levada em conta). Na tabela abaixo: uma transação = um caractere e 10.000 transações = 10.000 caracteres.
Além disso, você pode hospedar suas próprias réplicas de modelos básicos e criar modelos com ajuste fino em clusters de IA dedicados. Os clusters de IA dedicados são oferecidos em dois tipos: hospedagem e ajuste fino. Você cria um cluster de hospedagem atribuindo unidades de IA a ele de acordo com o modelo que deseja hospedar e o volume de chamadas esperado do modelo. Os clusters de ajuste fino exigem duas unidades de IA do modelo específico que deseja ajustar. Depois de criar um modelo ajustado em um cluster de ajuste fino, é possível hospedá-lo no cluster de hospedagem.
Os clusters dedicados de IA exigem um mínimo de 744 unidades-hora (por cluster) para hospedar modelos. O ajuste fino dos clusters requer pelo menos 1 unidade-hora.