Bei Bedarf können Basismodelle verwendet werden, wobei Sie pro Zeichen basierend auf der Länge der Eingabeaufforderung und der Antwort des Modells bezahlen (mit Ausnahme der Einbettungsmodelle, bei denen die Antwort des Modells nicht berücksichtigt wird). In der folgenden Tabelle ist eine Transaktion = ein Zeichen und 10.000 Transaktionen = 10.000 Zeichen.
Darüber hinaus können Sie private Replikate von Basismodellen hosten und optimierte Modelle auf dedizierten KI-Clustern erstellen. Dedizierte KI-Cluster gibt es in zwei Varianten: Hosting und Feinabstimmung. Sie erstellen ein Hostingcluster, indem Sie ihm KI-Einheiten basierend auf dem Modell, das Sie hosten möchten, und dem erwarteten Anrufvolumen für das Modell zuweisen. Für die Feinabstimmung von Clustern sind zwei KI-Einheiten des spezifischen Modells erforderlich, das Sie optimieren möchten. Nachdem Sie ein optimiertes Modell in einem Feinabstimmungscluster erstellt haben, können Sie es in Ihrem Hostingcluster hosten.
Dedizierte KI-Cluster erfordern eine Mindestverpflichtung von 744 Einheitsstunden (pro Cluster) für das Hosting von Modellen. Für die Feinabstimmung von Clustern ist mindestens 1 Std. erforderlich.
Produkt |
Vergleichspreis (/vCPU) * |
Einzeltarif |
Einheit |
Oracle Cloud Infrastructure Generative AI - Cohere Rerank - Dedicated |
Clusterstunde |
||
Oracle Cloud Infrastructure Generative AI - Meta Llama 4 Scout |
10.000 Transaktionen |
||
Oracle Cloud Infrastructure Generative AI - Meta Llama 4 Maverick |
10.000 Transaktionen |
||
Oracle Cloud Infrastructure Generative AI - Large Cohere |
10.000 Transaktionen |
||
Oracle Cloud Infrastructure Generative AI - Small Cohere |
10.000 Transaktionen |
||
Oracle Cloud Infrastructure Generative AI - Embed Cohere |
10.000 Transaktionen |
||
Oracle Cloud Infrastructure Generative AI - Large Meta |
10.000 Transaktionen |
||
Oracle Cloud Infrastructure Generative AI – Meta Llama 3.1 405B |
10.000 Transaktionen |
||
Oracle Cloud Infrastructure Generative AI – Meta Llama 3.2 90B Vision |
10.000 Transaktionen |
||
Oracle Cloud Infrastructure Generative AI – Large Cohere – Dediziert |
KI-Einheit pro Stunde |
||
Oracle Cloud Infrastructure Generative x – Small Cohere – Dediziert |
KI-Einheit pro Stunde |
||
Oracle Cloud Infrastructure Generative AI – Embed Cohere – dediziert |
KI-Einheit pro Stunde |
||
Oracle Cloud Infrastructure Generative AI – Large Meta – dediziert |
KI-Einheit pro Stunde |
||
Oracle Cloud Infrastructure Generative AI – xAI – Grok 3 oder Grok 4 – Input Tokens |
1.000.000 Token |
||
Oracle Cloud Infrastructure Generative AI – xAI – Grok 3 oder Grok 4 – zwischengespeicherte Input Tokens |
1.000.000 Token |
||
Oracle Cloud Infrastructure Generative AI – xAI – Grok 3 oder Grok 4 – Output Tokens |
1.000.000 Token |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - Input Tokens |
1.000.000 Token |
||
Oracle Cloud Infrastructure Generative AI – xAI – Grok 3 Mini – zwischengespeicherte Input Tokens |
1.000.000 Token |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - Output Tokens |
1.000.000 Token |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - Input Tokens |
1.000.000 Token |
||
Oracle Cloud Infrastructure Generative AI – xAI – Grok 3 Fast – zwischengespeicherte Input Tokens |
1.000.000 Token |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - Output Tokens |
1.000.000 Token |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - Input Tokens |
1.000.000 Token |
||
Oracle Cloud Infrastructure Generative AI – xAI – Grok 3 Mini Fast – zwischengespeicherte Input Tokens |
1.000.000 Token |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - Output Tokens |
1.000.000 Token |
||
Oracle Cloud Infrastructure Generative AI – xAI – Grok 4 Code –Grok-Code-Fast-1 – Input Tokens |
1.000.000 Token |
||
Oracle Cloud Infrastructure Generative AI – xAI – Grok 4 Code – Grok-Code-Fast-1 – zwischengespeicherte Input Tokens |
1.000.000 Token |
||
Oracle Cloud Infrastructure Generative AI – xAI – Grok 4 Code – Grok-Code-Fast-1 –Output Tokens |
1.000.000 Token |
||
Oracle Cloud Infrastructure Generative AI – Google – Gemini 2.5 Pro – Input Tokens – Text, Bild, Audio und Video weniger als 200.000 Input Tokens |
1.000.000 Token |
||
Oracle Cloud Infrastructure Generative AI – Google – Gemini 2.5 Pro – Input Tokens – Text, Bild, Audio und Video mehr als 200.000 Input Tokens |
1.000.000 Token |
||
Oracle Cloud Infrastructure Generative AI – Google – Gemini 2.5 Pro – Output Tokens – Textausgabe weniger als 200.000 Input Tokens |
1.000.000 Token |
||
Oracle Cloud Infrastructure Generative AI – Google – Gemini 2.5 Pro – Output Tokens – Textausgabe mehr als 200.000 Input Tokens |
1.000.000 Token |
||
Oracle Cloud Infrastructure Generative AI – Google – Gemini 2.5 Flash GA – Input Tokens – Text, Bild und Video |
1.000.000 Token |
||
Oracle Cloud Infrastructure Generative AI – Google – Gemini 2.5 Flash GA – Input Tokens – Audio |
1.000.000 Token |
||
Oracle Cloud Infrastructure Generative AI – Google – Gemini 2.5 Flash GA – Output Tokens – Text |
1.000.000 Token |
||
Oracle Cloud Infrastructure Generative AI – Google – Gemini 2.5 Flash Lite – Input Tokens – Text, Bild und Video |
1.000.000 Token |
||
Oracle Cloud Infrastructure Generative AI – Google – Gemini 2.5 Flash Lite – Input Tokens – Audio |
1.000.000 Token |
||
Oracle Cloud Infrastructure Generative AI – Google – Gemini 2.5 Flash Lite – Output Tokens – Text |
1.000.000 Token |
Bei Bedarf können Basismodelle verwendet werden, wobei Sie pro Zeichen basierend auf der Länge der Eingabeaufforderung und der Antwort des Modells bezahlen (mit Ausnahme der Einbettungsmodelle, bei denen die Antwort des Modells nicht berücksichtigt wird). In der folgenden Tabelle ist eine Transaktion = ein Zeichen und 10.000 Transaktionen = 10.000 Zeichen.
Darüber hinaus können Sie private Replikate von Basismodellen hosten und optimierte Modelle auf dedizierten KI-Clustern erstellen. Dedizierte KI-Cluster gibt es in zwei Varianten: Hosting und Feinabstimmung. Sie erstellen ein Hostingcluster, indem Sie ihm KI-Einheiten basierend auf dem Modell, das Sie hosten möchten, und dem erwarteten Anrufvolumen für das Modell zuweisen. Für die Feinabstimmung von Clustern sind zwei KI-Einheiten des spezifischen Modells erforderlich, das Sie optimieren möchten. Nachdem Sie ein optimiertes Modell in einem Feinabstimmungscluster erstellt haben, können Sie es in Ihrem Hostingcluster hosten.
Dedizierte KI-Cluster erfordern eine Mindestverpflichtung von 744 Einheitsstunden (pro Cluster) für das Hosting von Modellen. Für die Feinabstimmung von Clustern ist mindestens 1 Std. erforderlich.