Generative AI – Servicetarife

Bei Bedarf können Basismodelle verwendet werden, wobei Sie pro Zeichen basierend auf der Länge der Eingabeaufforderung und der Antwort des Modells bezahlen (mit Ausnahme der Einbettungsmodelle, bei denen die Antwort des Modells nicht berücksichtigt wird). In der folgenden Tabelle ist eine Transaktion = ein Zeichen und 10.000 Transaktionen = 10.000 Zeichen.

Darüber hinaus können Sie private Replikate von Basismodellen hosten und optimierte Modelle auf dedizierten KI-Clustern erstellen. Dedizierte KI-Cluster gibt es in zwei Varianten: Hosting und Feinabstimmung. Sie erstellen ein Hostingcluster, indem Sie ihm KI-Einheiten basierend auf dem Modell, das Sie hosten möchten, und dem erwarteten Anrufvolumen für das Modell zuweisen. Für die Feinabstimmung von Clustern sind zwei KI-Einheiten des spezifischen Modells erforderlich, das Sie optimieren möchten. Nachdem Sie ein optimiertes Modell in einem Feinabstimmungscluster erstellt haben, können Sie es in Ihrem Hostingcluster hosten.

Dedizierte KI-Cluster erfordern eine Mindestverpflichtung von 744 Einheitsstunden (pro Cluster) für das Hosting von Modellen. Für die Feinabstimmung von Clustern ist mindestens 1 Std. erforderlich.

Währung

Kostenrechner

OCI Generative AI

Produkt	Vergleichspreis (/vCPU) *	Einzeltarif	Einheit
Oracle Cloud Infrastructure Generative AI - Cohere Rerank - Dedicated			Clusterstunde
Oracle Cloud Infrastructure Generative AI - Meta Llama 4 Scout			10.000 Transaktionen
Oracle Cloud Infrastructure Generative AI - Meta Llama 4 Maverick			10.000 Transaktionen
Oracle Cloud Infrastructure Generative AI - Large Cohere			10.000 Transaktionen
Oracle Cloud Infrastructure Generative AI - Small Cohere			10.000 Transaktionen
Oracle Cloud Infrastructure Generative AI - Embed Cohere			10.000 Transaktionen
Oracle Cloud Infrastructure Generative AI - Large Meta			10.000 Transaktionen
Oracle Cloud Infrastructure Generative AI – Meta Llama 3.1 405B			10.000 Transaktionen
Oracle Cloud Infrastructure Generative AI – Meta Llama 3.2 90B Vision			10.000 Transaktionen
Oracle Cloud Infrastructure Generative AI – Large Cohere – Dediziert			KI-Einheit pro Stunde
Oracle Cloud Infrastructure Generative x – Small Cohere – Dediziert			KI-Einheit pro Stunde
Oracle Cloud Infrastructure Generative AI – Embed Cohere – dediziert			KI-Einheit pro Stunde
Oracle Cloud Infrastructure Generative AI – Large Meta – dediziert			KI-Einheit pro Stunde
Oracle Cloud Infrastructure Generative AI – xAI – Grok 3 oder Grok 4 – Input Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – xAI – Grok 3 oder Grok 4 – zwischengespeicherte Input Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – xAI – Grok 3 oder Grok 4 – Output Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - Input Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – xAI – Grok 3 Mini – zwischengespeicherte Input Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - Output Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - Input Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – xAI – Grok 3 Fast – zwischengespeicherte Input Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - Output Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - Input Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – xAI – Grok 3 Mini Fast – zwischengespeicherte Input Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - Output Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – xAI – Grok 4 Code –Grok-Code-Fast-1 – Input Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – xAI – Grok 4 Code – Grok-Code-Fast-1 – zwischengespeicherte Input Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – xAI – Grok 4 Code – Grok-Code-Fast-1 –Output Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – Google – Gemini 2.5 Pro – Input Tokens – Text, Bild, Audio und Video weniger als 200.000 Input Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – Google – Gemini 2.5 Pro – Input Tokens – Text, Bild, Audio und Video mehr als 200.000 Input Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – Google – Gemini 2.5 Pro – Output Tokens – Textausgabe weniger als 200.000 Input Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – Google – Gemini 2.5 Pro – Output Tokens – Textausgabe mehr als 200.000 Input Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – Google – Gemini 2.5 Flash GA – Input Tokens – Text, Bild und Video			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – Google – Gemini 2.5 Flash GA – Input Tokens – Audio			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – Google – Gemini 2.5 Flash GA – Output Tokens – Text			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – Google – Gemini 2.5 Flash Lite – Input Tokens – Text, Bild und Video			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – Google – Gemini 2.5 Flash Lite – Input Tokens – Audio			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – Google – Gemini 2.5 Flash Lite – Output Tokens – Text			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – xAI – Grok 4 Fast – Eingabetokens geringer als 128.000-Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – xAI – Grok 4 Fast – Eingabetokens größer als 128.000-Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – xAI – Grok 4 Fast – zwischengespeicherte Eingabetokens geringer als 128.000-Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – xAI – Grok 4 Fast – zwischengespeicherte Eingabetokens größer als 128.000-Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – xAI – Grok 4 Fast – Ausgabetoken geringer als 128.000-Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – xAI – Grok 4 Fast – Ausgabetokens größer als 128.000-Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – Modellimport			KI-Einheit pro Stunde
Oracle Cloud Infrastructure Generative AI – OpenAI – gpt-oss-120b – Input Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – OpenAI – gpt-oss-120b – Output Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – OpenAI – gpt-oss-20b – Input Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – OpenAI – gpt-oss-20b – Output Tokens			1.000.000 Token
Oracle Cloud Infrastructure Generative AI – OpenAI – Dediziert			KI-Einheit pro Stunde

Eine Transaktion ist ein Zeichen. 10.000 Transaktionen = 10.000 Zeichen

Dedizierte KI-Cluster erfordern eine Mindestverpflichtung von 744 Einheitsstunden (pro Cluster) für das Hosting von Modellen. Für die Feinabstimmung von Clustern ist mindestens 1 Std. erforderlich.