Servicio de IA generativa | Oracle

Los modelos básicos se pueden consumir bajo demanda, donde se paga por carácter en función de la longitud de la petición de datos y la respuesta del modelo (excepto los modelos de inserción, donde la respuesta del modelo no se contabiliza). En la siguiente tabla, una transacción = un carácter y 10 000 transacciones = 10 000 caracteres.

Además, puede alojar réplicas privadas de modelos fundamentales y crear modelos ajustados en clústeres de IA dedicados. Los clústeres de IA dedicados se presentan en dos tipos: alojamiento y ajuste. Puedes crear un clúster de alojamiento asignándole unidades IA según el modelo que deseas alojar y el volumen de llamadas esperado al modelo. Los clústeres de ajuste necesitan dos unidades IA del modelo específico que desea ajustar. Una vez que hayas creado un modelo ajustado en un clúster de ajuste, puedes alojarlo en el clúster de alojamiento.

Los clústeres de IA dedicados requieren un compromiso mínimo de 744 horas unitarias (por clúster) para los modelos de alojamiento. Los clústeres de ajuste requieren un mínimo de 1 unidad-hora.

Moneda

Calculadora de costos

IA generativa en OCI

Producto	Precio de comparación (/vCPU) *	Precio unitario	Unidad
Oracle Cloud Infrastructure Generative AI - Cohere Rerank - Dedicado			Hora de cluster
Oracle Cloud Infrastructure Generative AI - Meta Llama 4 Scout			10 000 transacciones
Oracle Cloud Infrastructure Generative AI - Meta Llama 4 Maverick			10 000 transacciones
Oracle Cloud Infrastructure Generative AI - Large Cohere			10 000 transacciones
Oracle Cloud Infrastructure Generative AI - Small Cohere			10 000 transacciones
Oracle Cloud Infrastructure Generative AI - Embed Cohere			10 000 transacciones
Oracle Cloud Infrastructure Generative AI - Large Meta			10 000 transacciones
Oracle Cloud Infrastructure Generative AI - Meta Llama 3.1 405B			10 000 transacciones
Oracle Cloud Infrastructure Generative AI - Meta Llama 3.2 90B Vision			10 000 transacciones
Oracle Cloud Infrastructure Generative AI - Large Cohere - Dedicado			Unidad de IA por hora
Oracle Cloud Infrastructure Generative x - Small Cohere - Dedicado			Unidad de IA por hora
Oracle Cloud Infrastructure Generative AI - Embed Cohere - Dedicado			Unidad de IA por hora
Oracle Cloud Infrastructure Generative AI - Large Meta - Dedicado			Unidad de IA por hora
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 o Grok 4 - Tokens de entrada			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 or Grok 4 - Tokens de entrada en caché			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - xAI – Grok 3 o Grok 4 - Tokens de salida			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - Tokens de entrada			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - Tokens de entrada			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - Tokens de salida			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - Tokens de entrada			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - Tokens de entrada en caché			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - Tokens de salida			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - Tokens de entrada			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - Tokens de entrada en caché			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - Tokens de salida			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - xAI -Grok 4 Code -Grok-Code-Fast-1-Tokens de entrada			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - xAI - Grok 4 Code Grok-Code-Fast-1- Tokens de entrada en caché			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - xAI -Grok 4 Code -Grok-Code-Fast-1-Tokens de salida			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - Tokens de entrada - Texto, Imagen, Audio y Video menos de 200K tokens de entrada			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - Google -Gemini 2.5 Pro - Tokens de entrada - Texto, Imagen, Audio y Video más de 200K tokens de entrada			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - Tokens de salida - Salida de texto menos de 200K tokens de entrada			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - Tokens de salida - Salida de texto más de 200K tokens de entrada			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - Tokens de entrada - Texto, imagen y video			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - Tokens de entrada - Audio			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - Tokens de salida - Texto			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - Tokens de entrada - Texto, imagen y video			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - Tokens de entrada - Audio			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - Tokens de salida - Texto			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI – xAI – Grok 4 Fast – Tokens de entrada con menos de 128 000 tokens			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI – xAI – Grok 4 Fast – Tokens de entrada con más de 128 000 tokens			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI – xAI – Grok 4 Fast – Tokens de entrada en caché con menos de 128 000 tokens			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI – xAI – Grok 4 Fast – Tokens de entrada en caché con más de 128 000 tokens			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI – xAI – Grok 4 Fast – Tokens de salida con menos de 128 000 tokens			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI – xAI – Grok 4 Fast – Tokens de salida con más de 128 000 tokens			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - Importación de modelos			Unidad de IA por hora
Oracle Cloud Infrastructure Generative AI - OpenAI - gpt-oss-120b - Tokens de entrada			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - OpenAI - gpt-oss-120b - Tokens de salida			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - OpenAI - gpt-oss-20b - Tokens de entrada			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - OpenAI - gpt-oss-20b - Tokens de salida			1 000 000 tokens
Oracle Cloud Infrastructure Generative AI - OpenAI - Dedicado			Unidad de IA por hora

Una transacción es un carácter. 10.000 transacciones = 10.000 caracteres

Los clústeres de IA dedicados requieren un compromiso mínimo de 744 horas unitarias (por clúster) para los modelos de alojamiento. Los clústeres de ajuste requieren un mínimo de 1 unidad-hora.