Oracle Cloud Infrastructure(OCI) AI Blueprints를 활용하면 생성형 AI 워크로드를 단 몇 분 만에 배포, 확장, 모니터링할 수 있습니다. 사전 패키징되고 OCI 관련 검증이 완료된 배포 블루프린트를 살펴보세요. 하드웨어 권장 사항, 소프트웨어 구성 요소, 즉시 사용 가능한 모니터링 기능 등을 모두 제공합니다.
OCI 관련 검증이 완료된 모범 사례를 기반으로 구축된 블루프린트를 활용해 배포를 확장하고, 드라이버 및 애플리케이션 호환성을 결정하고, 관측 가능성 및 관리 차원의 결정을 수행함으로써 AI 워크로드 배포와 관련된 우려를 최소화할 수 있습니다.
검증된 하드웨어, 소프트웨어, 즉시 사용 가능한 모니터링 기능 등이 포함된 블루프린트를 사용해 미션 크리티컬 생성형 AI 워크로드를 단 몇 분 만에 배포하고 모니터링할 수 있습니다.
Prometheus, Grafana, MLflow 등의 서드파티 관측 가능성 애플리케이션들과의 사전 구축된 연결을 활용해 AI 워크로드 전반에 대한 모니터링 및 관측 가능성 문제를 손쉽게 해결할 수 있습니다.
가상 대규모 언어 모델(vLLM)이라는 오픈 소스 인터페이스 엔진을 사용해 대규모 언어 모델(LLM) 및 비전 언어 모델(VLM)의 배포를 간소화할 수 있습니다. 커스텀 모델을 배포할 수도 있고, Hugging Face의 다양한 오픈 모델을 선택해 사용할 수도 있습니다.
MLCommons 방법론을 사용해 미세 조정을 위한 인프라 벤치마킹을 간소화할 수 있습니다. 표준 데이터 세트를 사용해 정량화된 Llama-2-70B 모델을 미세 조정합니다.
OCI AI Blueprints는 LLM 매우 효율적인 미세 조정 방법인 낮은 순위 적응(LoRA)을 사용한 효율적인 모델 튜닝을 지원합니다. 커스텀 LLM을 미세 조정할 수도 있고, Hugging Face에서 제공되는 대부분의 오픈 LLM을 사용할 수도 있습니다.
운영 또는 연구 워크로드를 배포하기에 앞서 철저한 GPU 상태 검증을 위한 강력한 사전 점검 블루프린트를 사용해 문제를 사전에 감지하고 해결할 수 있습니다. GPU 인프라가 단일 노드 및 멀티 노드 환경 모두에서 고사양 실험을 수행할 준비가 되어 있는지 확인합니다.
Mistral, Gemma 등 다양한 모델을 지원하는 Ollama 플랫폼을 사용해 CPU 상에 LLM을 배포하기 위한 포괄적인 프레임워크를 채택할 수 있습니다.
이 블루프린트를 사용하면 추론 서비스를 여러 컴퓨팅 노드에 분산시킬 수 있고, 각 노드에는 일반적으로 한 개 이상의 GPU가 장착되어 있습니다. 예를 들어 vLLM 및 LeaderWorkerSet을 사용하는 RDMA를 통해 여러 H100 노드에 Llama 405B 사이즈의 LLM을 배포할 수 있습니다.
KEDA를 사용한 자동 확장을 지원하는 LLM을 배포할 수 있습니다. 추론 지연 시간과 같은 애플리케이션 메트릭을 사용해 여러 GPU 및 노드로 확장 가능합니다.
명확한 지침이 제공되는 하드웨어 권장 사항, 사전 패키징된 소프트웨어 스택, 즉시 사용 가능한 통합 관측 가능성 도구를 활용해 귀사의 AI 애플리케이션을 빠르고 효율적으로 실행할 수 있습니다.
권장되는 OCI GPU, CPU, 네트워킹 구성에서 테스트 완료된 사전 패키징 블루프린트를 사용해 생성형 AI 워크로드를 안전하게 배포해 보세요. 많은 시간이 소요되는 성능 벤치마킹과 추측을 더 이상 직접 수행하지 않아도 됩니다.
RAG, 미세 조정, 추론 등 널리 사용되는 AI 사용 사례에 필요한 프레임워크, 라이브러리, 모델 구성을 선택하거나 귀사의 비즈니스 요구 사항에 부합하는 사용 사례를 커스터마이징할 수 있습니다.
모니터링, 로깅, 확장 등 자동화된 MLOps 작업을 통해 인프라 관리를 간소화할 수 있습니다. Prometheus, Grafana, MLflow, KEDA 등의 사전 설치된 도구를 활용해 신속하게 시작하고 운영 수준의 환경을 간단히 구축할 수 있습니다.
AI 워크로드 Kubernetes 관리 플랫폼인 OCI AI Blueprints를 소개합니다. OCI AI Blueprints는 AI 워크로드를 단 몇 분 만에 배포, 확장, 모니터링할 수 있는 블루프린트 세트를 제공합니다.
게시물 전문 읽어보기30일 체험판으로 20개 이상의 상시 무료 클라우드 서비스를 체험해 보세요.
OCI AI Blueprints를 살펴보고 직접 체험하거나 운영 테넌시에 배포할 수 있습니다.
Oracle이 다른 클라우드 하이퍼스케일러 대비 저렴한 컴퓨트, 스토리지, 네트워킹 비용을 지속적으로 제공하는 방법을 확인해 보세요.
Oracle Cloud Infrastructure에 대해 자세히 알고 싶으신가요? Oracle의 전문가가 도와 드리겠습니다.