기본 모델은 프롬프트 및 모델 응답의 길이에 비례한 문자당 비용을 지불하는 온디맨드 방식으로 사용할 수 있습니다(모델 응답의 길이를 고려하지 않는 임베딩 모델 제외). 하단의 테이블의 경우, 1트랜잭션 = 1자이고 10,000 트랜잭션=10,000자입니다.
또한 기본 모델의 프라이빗 복제본을 호스팅할 수도 있고, 전용 AI 클러스터에 미세 조정된 모델을 생성할 수도 있습니다. 전용 AI 클러스터는 호스팅 및 미세 조정이라는 두 가지 유형으로 제공됩니다. 호스팅할 모델 및 해당 모델에 필요한 호출 볼륨에 기반하여 AI 유닛을 호스트에 지정함으로써 호스팅 클러스터를 만들 수 있습니다. 미세 조정 클러스터의 경우, 미세 조정 대상인 특정 모델의 AI 유닛 2개를 필요로 합니다. 미세 조정 클러스터에서 미세 조정된 모델을 생성하고 나면 호스팅 클러스터에서 해당 모델을 호스트할 수 있습니다.
전용 AI 클러스터에 모델을 호스팅하는 경우 최소 744단위-시간(클러스터당)의 약정이 요구됩니다. 미세 조정 클러스터의 경우 최소 1단위-시간의 약정이 요구됩니다.
제품 |
비교 가격(/vCPU)* |
단위 가격 |
단위 |
Oracle Cloud Infrastructure Generative AI - Cohere Rerank - 전용 |
클러스터 시간 |
||
Oracle Cloud Infrastructure Generative AI - Meta Llama 4 Scout |
10,000 트랜잭션 |
||
Oracle Cloud Infrastructure Generative AI - Meta Llama 4 Maverick |
10,000 트랜잭션 |
||
Oracle Cloud Infrastructure Generative AI - 대규모 Cohere |
10,000 트랜잭션 |
||
Oracle Cloud Infrastructure Generative AI - 소규모 Cohere |
10,000 트랜잭션 |
||
Oracle Cloud Infrastructure Generative AI - 임베드 Cohere |
10,000 트랜잭션 |
||
Oracle Cloud Infrastructure Generative AI - 대규모 Meta |
10,000 트랜잭션 |
||
Oracle Cloud Infrastructure Generative AI - Meta Llama 3.1 405B |
10,000 트랜잭션 |
||
Oracle Cloud Infrastructure Generative AI - Meta Llama 3.2 90B Vision |
10,000 트랜잭션 |
||
Oracle Cloud Infrastructure Generative AI - 대규모 Cohere - 전용 |
시간당 AI 단위 |
||
Oracle Cloud Infrastructure Generative x - 소규모 Cohere - 전용 |
시간당 AI 단위 |
||
Oracle Cloud Infrastructure Generative AI - 임베드 Cohere - 전용 |
시간당 AI 단위 |
||
Oracle Cloud Infrastructure Generative AI - 대규모 Meta - 전용 |
시간당 AI 단위 |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 또는 Grok 4 - 입력 토큰 |
1,000,000 토큰 |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 또는 Grok 4 - 캐시 입력 토큰 |
1,000,000 토큰 |
||
Oracle Cloud Infrastructure Generative AI - xAI – Grok 3 또는 Grok 4 - 출력 토큰 |
1,000,000 토큰 |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - 입력 토큰 |
1,000,000 토큰 |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - 캐시 입력 토큰 |
1,000,000 토큰 |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - 출력 토큰 |
1,000,000 토큰 |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - 입력 토큰 |
1,000,000 토큰 |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - 캐시 입력 토큰 |
1,000,000 토큰 |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - 출력 토큰 |
1,000,000 토큰 |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - 입력 토큰 |
1,000,000 토큰 |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - 캐시 입력 토큰 |
1,000,000 토큰 |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - 출력 토큰 |
1,000,000 토큰 |
||
Oracle Cloud Infrastructure Generative AI - xAI -Grok 4 Code -Grok-Code-Fast-1-입력 토큰 |
1,000,000 토큰 |
||
Oracle Cloud Infrastructure Generative AI - xAI - Grok 4 Code Grok-Code-Fast-1- 캐시 입력 토큰 |
1,000,000 토큰 |
||
Oracle Cloud Infrastructure Generative AI - xAI -Grok 4 Code - Grok-Code-Fast-1-출력 토큰 |
1,000,000 토큰 |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - Input Tokens - 입력 토큰 200K개 미만의 텍스트, 이미지, 오디오 및 비디오 |
1,000,000 토큰 |
||
Oracle Cloud Infrastructure Generative AI - Google -Gemini 2.5 Pro - Input Tokens - 입력 토큰 200K개 이상의 텍스트, 이미지, 오디오 및 비디오 |
1,000,000 토큰 |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - Output Tokens - 입력 토큰 200K개 미만의 텍스트 출력 |
1,000,000 토큰 |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - 출력 토큰 - 200K 입력 토큰 이상의 텍스트 출력 |
1,000,000 토큰 |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - 입력 토큰 - 텍스트, 이미지 및 비디오 |
1,000,000 토큰 |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - 입력 토큰 - 오디오 |
1,000,000 토큰 |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - 출력 토큰 - 텍스트 |
1,000,000 토큰 |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - 입력 토큰 - 텍스트, 이미지 및 비디오 |
1,000,000 토큰 |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - 입력 토큰 - 오디오 |
1,000,000 토큰 |
||
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - 출력 토큰 - 텍스트 |
1,000,000 토큰 |
기본 모델은 프롬프트 및 모델 응답의 길이에 비례한 문자당 비용을 지불하는 온디맨드 방식으로 사용할 수 있습니다(모델 응답의 길이를 고려하지 않는 임베딩 모델 제외). 하단의 테이블의 경우, 1트랜잭션 = 1자이고 10,000 트랜잭션=10,000자입니다.
또한 기본 모델의 프라이빗 복제본을 호스팅할 수도 있고, 전용 AI 클러스터에 미세 조정된 모델을 생성할 수도 있습니다. 전용 AI 클러스터는 호스팅 및 미세 조정이라는 두 가지 유형으로 제공됩니다. 호스팅할 모델 및 해당 모델에 필요한 호출 볼륨에 기반하여 AI 유닛을 호스트에 지정함으로써 호스팅 클러스터를 만들 수 있습니다. 미세 조정 클러스터의 경우, 미세 조정 대상인 특정 모델의 AI 유닛 2개를 필요로 합니다. 미세 조정 클러스터에서 미세 조정된 모델을 생성하고 나면 호스팅 클러스터에서 해당 모델을 호스트할 수 있습니다.
전용 AI 클러스터에 모델을 호스팅하는 경우 최소 744단위-시간(클러스터당)의 약정이 요구됩니다. 미세 조정 클러스터의 경우 최소 1단위-시간의 약정이 요구됩니다.