Tarification de Generative AI Service

Les modèles de base peuvent être consommés à la demande. Vous payez alors par caractère en fonction de la longueur de l'invite et de la réponse du modèle (sauf pour les modèles d'intégration, pour lesquels la réponse du modèle n'est pas prise en compte). Dans le tableau ci-dessous, une transaction = un caractère et 10 000 transactions = 10 000 caractères.

En outre, vous pouvez héberger des répliques privées de modèles de base et créer des modèles affinés sur des clusters d'IA dédiés. Il existe deux types de clusters d'IA dédiés : l'hébergement et le réglage fin. Vous créez un cluster d'hébergement en lui affectant des unités d'IA en fonction du modèle que vous souhaitez héberger et du volume d'appels attendu pour le modèle. Les clusters à réglage fin nécessitent deux unités d'IA du modèle spécifique que vous souhaitez affiner. Une fois que vous avez créé un modèle affiné dans un cluster affiné, vous pouvez l'héberger sur votre cluster d'hébergement.

Les clusters d'IA dédiés nécessitent un engagement minimal de 744 unités-heures (par cluster) pour les modèles d'hébergement. Les clusters à réglage fin nécessitent un minimum de 1 unité-heure.

Devise

Outil d’estimation des coûts

OCI Generative AI

Produit	Prix pour la comparaison (/vCPU) *	Prix unitaire	Unité
Oracle Cloud Infrastructure Generative AI - Cohere Rerank - Dédié			Heure de cluster
Oracle Cloud Infrastructure Generative AI - Meta Llama 4 Scout			10 000 transactions
Oracle Cloud Infrastructure Generative AI - Meta Llama 4 Maverick			10 000 transactions
Oracle Cloud Infrastructure Generative AI - Large Cohere			10 000 transactions
Oracle Cloud Infrastructure Generative AI - Small Cohere			10 000 transactions
Oracle Cloud Infrastructure Generative AI - Embed Cohere			10 000 transactions
Oracle Cloud Infrastructure Generative AI - Large Meta			10 000 transactions
Oracle Cloud Infrastructure Generative AI - Meta Llama 3.1 405B			10 000 transactions
Oracle Cloud Infrastructure Generative AI - Meta Llama 3.2 90B Vision			10 000 transactions
Oracle Cloud Infrastructure Generative AI - Large Cohere - Dédié			Unité d'IA par heure
Oracle Cloud Infrastructure Generative x - Small Cohere - Dédié			Unité d'IA par heure
Oracle Cloud Infrastructure Generative AI - Embed Cohere - Dédié			Unité d'IA par heure
Oracle Cloud Infrastructure Generative AI - Large Meta - Dédié			Unité d'IA par heure
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 ou Grok 4 - Jetons d'entrée			1 000 000 jetons
IA générative Oracle Cloud Infrastructure - xAI - Grok 3 ou Grok 4 - Jetons d'entrée mis en cache			1 000 000 jetons
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 ou Grok 4 - Jetons de sortie			1 000 000 jetons
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - Jetons d'entrée			1 000 000 jetons
IA générative Oracle Cloud Infrastructure - xAI - Grok 3 Mini - Jetons d'entrée mis en cache			1 000 000 jetons
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - Jetons de sortie			1 000 000 jetons
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - Jetons d'entrée			1 000 000 jetons
IA générative Oracle Cloud Infrastructure - xAI - Grok 3 Fast - Jetons d'entrée mis en cache			1 000 000 jetons
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - Jetons de sortie			1 000 000 jetons
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - Jetons d'entrée			1 000 000 jetons
IA générative Oracle Cloud Infrastructure - xAI - Grok 3 Mini Fast - Jetons d'entrée mis en cache			1 000 000 jetons
Oracle Cloud Infrastructure Generative AI - xAI - Mini Fast Grok 3 - Jetons de sortie			1 000 000 jetons
IA générative Oracle Cloud Infrastructure - xAI - Grok 4 Code - Jetons d'entrée Grok-Code-Fast-1			1 000 000 jetons
IA générative Oracle Cloud Infrastructure - xAI - Grok 4 Code Grok-Code-Fast-1 - Jetons d'entrée mis en cache			1 000 000 jetons
IA générative Oracle Cloud Infrastructure - xAI - Grok 4 Code - Jeton de sortie Grok-Code-Fast-1			1 000 000 jetons
IA générative Oracle Cloud Infrastructure - Google - Gemini 2.5 Pro - Jetons d'entrée - Texte, image, audio et vidéo inférieurs à 200 000 jetons d'entrée			1 000 000 jetons
IA générative Oracle Cloud Infrastructure - Google - Gemini 2.5 Pro - Jetons d'entrée - Texte, image, audio et vidéo supérieurs à 200 000 jetons d'entrée			1 000 000 jetons
IA générative Oracle Cloud Infrastructure - Google - Gemini 2.5 Pro - Jetons de sortie - Sortie de texte inférieure à 200 000 jetons d'entrée			1 000 000 jetons
IA générative Oracle Cloud Infrastructure - Google - Gemini 2.5 Pro - Jetons de sortie - Sortie de texte supérieure à 200 000 jetons d'entrée			1 000 000 jetons
IA générative Oracle Cloud Infrastructure - Google - Gemini 2.5 Flash GA - Jetons d'entrée - Texte, image et vidéo			1 000 000 jetons
IA générative Oracle Cloud Infrastructure - Google - Gemini 2.5 Flash GA - Jetons d'entrée - Audio			1 000 000 jetons
IA générative Oracle Cloud Infrastructure - Google - Gemini 2.5 Flash GA - Jetons de sortie - Texte			1 000 000 jetons
IA générative Oracle Cloud Infrastructure - Google - Gemini 2.5 Flash Lite - Jetons d'entrée - Texte, image et vidéo			1 000 000 jetons
IA générative Oracle Cloud Infrastructure - Google - Gemini 2.5 Flash Lite - Jetons d'entrée - Audio			1 000 000 jetons
IA générative Oracle Cloud Infrastructure - Google - Gemini 2.5 Flash Lite - Jetons de sortie - Texte			1 000 000 jetons
IA générative Oracle Cloud Infrastructure - xAI - Grok 4 Fast - Jetons d'entrée inférieurs à 128 000 jetons			1 000 000 jetons
IA générative Oracle Cloud Infrastructure - xAI - Grok 4 Fast - Jetons d'entrée supérieurs à 128 000 jetons			1 000 000 jetons
IA générative Oracle Cloud Infrastructure - xAI - Grok 4 Fast - Jetons d'entrée mis en cache inférieurs à 128 000 jetons			1 000 000 jetons
IA générative Oracle Cloud Infrastructure - xAI - Grok 4 Fast - Jetons d'entrée mis en cache supérieurs à 128 000 jetons			1 000 000 jetons
IA générative Oracle Cloud Infrastructure - xAI - Grok 4 Fast - Jetons de sortie inférieurs à 128 000 jetons			1 000 000 jetons
IA générative Oracle Cloud Infrastructure - xAI - Grok 4 Fast - Jetons de sortie supérieurs à 128 000 jetons			1 000 000 jetons
Oracle Cloud Infrastructure Generative AI - Importation de modèle			Unité d'IA par heure
Oracle Cloud Infrastructure Generative AI - OpenAI - gpt-oss-120b - Jetons d’entrée			1 000 000 jetons
Oracle Cloud Infrastructure Generative AI - OpenAI - gpt-oss-120b - Jetons de sortie			1 000 000 jetons
Oracle Cloud Infrastructure Generative AI - OpenAI - gpt-oss-20b - Jetons d’entrée			1 000 000 jetons
Oracle Cloud Infrastructure Generative AI - OpenAI - gpt-oss-20b - Jetons de sortie			1 000 000 jetons
Oracle Cloud Infrastructure Generative AI - OpenAI - Dédié			Unité d'IA par heure

Une transaction est un caractère. 10 000 transactions = 10 000 caractères