Generative AI 서비스 가격 정책

 

기본 모델은 프롬프트 및 모델 응답의 길이에 비례한 문자당 비용을 지불하는 온디맨드 방식으로 사용할 수 있습니다(모델 응답의 길이를 고려하지 않는 임베딩 모델 제외). 하단의 테이블의 경우, 1트랜잭션 = 1자이고 10,000 트랜잭션=10,000자입니다.

또한 기본 모델의 프라이빗 복제본을 호스팅할 수도 있고, 전용 AI 클러스터에 미세 조정된 모델을 생성할 수도 있습니다. 전용 AI 클러스터는 호스팅 및 미세 조정이라는 두 가지 유형으로 제공됩니다. 호스팅할 모델 및 해당 모델에 필요한 호출 볼륨에 기반하여 AI 유닛을 호스트에 지정함으로써 호스팅 클러스터를 만들 수 있습니다. 미세 조정 클러스터의 경우, 미세 조정 대상인 특정 모델의 AI 유닛 2개를 필요로 합니다. 미세 조정 클러스터에서 미세 조정된 모델을 생성하고 나면 호스팅 클러스터에서 해당 모델을 호스트할 수 있습니다.

전용 AI 클러스터에 모델을 호스팅하는 경우 최소 744단위-시간(클러스터당)의 약정이 요구됩니다. 미세 조정 클러스터의 경우 최소 1단위-시간의 약정이 요구됩니다.

OCI Generative AI

제품
비교 가격(/vCPU)*
단위 가격
단위
Oracle Cloud Infrastructure Generative AI - Cohere Rerank - 전용


클러스터 시간
Oracle Cloud Infrastructure Generative AI - Meta Llama 4 Scout


10,000 트랜잭션
Oracle Cloud Infrastructure Generative AI - Meta Llama 4 Maverick


10,000 트랜잭션
Oracle Cloud Infrastructure Generative AI - 대규모 Cohere


10,000 트랜잭션
Oracle Cloud Infrastructure Generative AI - 소규모 Cohere


10,000 트랜잭션
Oracle Cloud Infrastructure Generative AI - 임베드 Cohere


10,000 트랜잭션
Oracle Cloud Infrastructure Generative AI - 대규모 Meta


10,000 트랜잭션
Oracle Cloud Infrastructure Generative AI - Meta Llama 3.1 405B


10,000 트랜잭션
Oracle Cloud Infrastructure Generative AI - Meta Llama 3.2 90B Vision


10,000 트랜잭션
Oracle Cloud Infrastructure Generative AI - 대규모 Cohere - 전용


시간당 AI 단위
Oracle Cloud Infrastructure Generative x - 소규모 Cohere - 전용


시간당 AI 단위
Oracle Cloud Infrastructure Generative AI - 임베드 Cohere - 전용


시간당 AI 단위
Oracle Cloud Infrastructure Generative AI - 대규모 Meta - 전용


시간당 AI 단위
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 또는 Grok 4 - 입력 토큰

1,000,000 토큰
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 또는 Grok 4 - 캐시 입력 토큰

1,000,000 토큰
Oracle Cloud Infrastructure Generative AI - xAI – Grok 3 또는 Grok 4 - 출력 토큰

1,000,000 토큰
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - 입력 토큰

1,000,000 토큰
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - 캐시 입력 토큰

1,000,000 토큰
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini - 출력 토큰

1,000,000 토큰
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - 입력 토큰

1,000,000 토큰
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - 캐시 입력 토큰

1,000,000 토큰
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Fast - 출력 토큰

1,000,000 토큰
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - 입력 토큰

1,000,000 토큰
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - 캐시 입력 토큰

1,000,000 토큰
Oracle Cloud Infrastructure Generative AI - xAI - Grok 3 Mini Fast - 출력 토큰

1,000,000 토큰
Oracle Cloud Infrastructure Generative AI - xAI -Grok 4 Code -Grok-Code-Fast-1-입력 토큰

1,000,000 토큰
Oracle Cloud Infrastructure Generative AI - xAI - Grok 4 Code Grok-Code-Fast-1- 캐시 입력 토큰

1,000,000 토큰
Oracle Cloud Infrastructure Generative AI - xAI -Grok 4 Code - Grok-Code-Fast-1-출력 토큰

1,000,000 토큰
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - Input Tokens - 입력 토큰 200K개 미만의 텍스트, 이미지, 오디오 및 비디오

1,000,000 토큰
Oracle Cloud Infrastructure Generative AI - Google -Gemini 2.5 Pro - Input Tokens - 입력 토큰 200K개 이상의 텍스트, 이미지, 오디오 및 비디오

1,000,000 토큰
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - Output Tokens - 입력 토큰 200K개 미만의 텍스트 출력

1,000,000 토큰
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Pro - 출력 토큰 - 200K 입력 토큰 이상의 텍스트 출력

1,000,000 토큰
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - 입력 토큰 - 텍스트, 이미지 및 비디오

1,000,000 토큰
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - 입력 토큰 - 오디오

1,000,000 토큰
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash GA - 출력 토큰 - 텍스트

1,000,000 토큰
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - 입력 토큰 - 텍스트, 이미지 및 비디오

1,000,000 토큰
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - 입력 토큰 - 오디오

1,000,000 토큰
Oracle Cloud Infrastructure Generative AI - Google - Gemini 2.5 Flash Lite - 출력 토큰 - 텍스트

1,000,000 토큰
  • 1트랜잭션은 1문자입니다. 예: 10,000트랜잭션 = 10,000자

기본 모델은 프롬프트 및 모델 응답의 길이에 비례한 문자당 비용을 지불하는 온디맨드 방식으로 사용할 수 있습니다(모델 응답의 길이를 고려하지 않는 임베딩 모델 제외). 하단의 테이블의 경우, 1트랜잭션 = 1자이고 10,000 트랜잭션=10,000자입니다.

또한 기본 모델의 프라이빗 복제본을 호스팅할 수도 있고, 전용 AI 클러스터에 미세 조정된 모델을 생성할 수도 있습니다. 전용 AI 클러스터는 호스팅 및 미세 조정이라는 두 가지 유형으로 제공됩니다. 호스팅할 모델 및 해당 모델에 필요한 호출 볼륨에 기반하여 AI 유닛을 호스트에 지정함으로써 호스팅 클러스터를 만들 수 있습니다. 미세 조정 클러스터의 경우, 미세 조정 대상인 특정 모델의 AI 유닛 2개를 필요로 합니다. 미세 조정 클러스터에서 미세 조정된 모델을 생성하고 나면 호스팅 클러스터에서 해당 모델을 호스트할 수 있습니다.

전용 AI 클러스터에 모델을 호스팅하는 경우 최소 744단위-시간(클러스터당)의 약정이 요구됩니다. 미세 조정 클러스터의 경우 최소 1단위-시간의 약정이 요구됩니다.