Oracle Cloud Infrastructure AI Blueprints 是一套预打包且经过验证的 OCI 蓝图,可在数分钟内提供一致且可重复的生成式 AI 工作负载部署,并具有内置的观测功能。
Oracle Cloud Infrastructure AI Blueprints 可帮助您在几分钟内部署、扩展和监控生产环境中的 AI 工作负载。这些 AI Blueprints 是经过 OCI 验证的无代码部署蓝图,适用于常用生成式 AI 工作负载,其中包括针对 NVIDIA GPU 的明确硬件推荐、有明确推荐配置的软件栈组件(例如 NVIDIA NIM)以及预打包的观测工具。因此,您无需做出软件栈决策或手动预配基础设施,即可部署 AI 工作负载。您还可以利用 AI Blueprint 的高级基础设施功能,例如多实例 GPU 或基于推断延迟的自动缩放,并进行一些简单的配置更改。借助这些功能,我们将 GPU 在大规模关键任务部署中的上线时间,从数周缩短到几分钟。
OCI AI Blueprint 免费提供给所有 OCI 用户。
您可以在 GitHub 上找到 OCI AI Blueprints。在 GitHub 页面中,您可以按照指示执行以下操作:
如需测试 OCI AI Blueprints,请创建单独的区间和 OCI Kubernetes Engine 集群。在新创建的区间中部署 OCI AI Blueprints 可防止对租户造成任何潜在影响。
以下是租户中部署的容器和资源:
请点击此处查看所有可用的蓝图。
如需运行推理基准测试蓝图,您只需部署一个 vLLM 蓝图,然后使用 LLMPerf 等工具针对推理端点运行基准测试。
使用 kubectl,检查 Oracle Kubernetes Engine 集群中的 pod 日志。或者,在 AI Blueprints 门户中检查日志。
OCI AI Blueprints 利用 KEDA 实现应用驱动的自动缩放。请参阅文档,了解更多详情。
支持 OCI 区域中提供的所有 NVIDIA GPU,例如 A10、A100 或 H100。
可以,您可以按照此处的说明将 OCI AI Blueprints 部署到现有集群。
如需在同一节点上运行多个蓝图,我们建议您启用共享节点池。有关更多信息,请点击这里。
Oracle Cloud Infrastructure Data Science 和 Oracle Cloud Infrastructure Data Science Quick Actions 是 PaaS 产品,旨在帮助您在托管计算实例上构建和部署 AI 应用。AI Blueprints 是 IaaS 助推器。OCI AI Blueprints 非常适合那些需要将生成式 AI 工作负载部署到租户中的预留实例的客户。在客户旅程的初始阶段,AI Blueprints 可帮助进行售前 POC、LLM 基准测试以及端到端 AI 应用(例如检索增强生成 (RAG))的快速原型设计。在后面的阶段,客户可以使用 AI Blueprints 来处理 Kubernetes 集群上的生产工作负载,并采用自动缩放和分布式推断等高级配置。
OCI Generative AI 服务属于一种 PaaS 产品。AI Blueprints 是 IaaS 助推器。OCI AI Blueprints 非常适合那些需要将生成式 AI 工作负载部署到租户中的预留实例的客户。在客户旅程的初始阶段,AI Blueprints 可帮助进行售前 POC、LLM 基准测试以及端到端 AI 应用(例如 RAG)的快速原型设计。在后面的阶段,客户可以使用 AI Blueprints 来处理 Kubernetes 集群上的生产工作负载,并采用自动缩放和分布式推断等高级配置。
只要模型与 vLLM 兼容,您就可以使用我们的 vLLM 蓝图部署自定义 LLM 或 Hugging Face 上可用的大多数模型。
可以。
可以,您可以使用其他解决方案,例如 Ollama、TensorRT 和 NIM 等。
可以,我们有一个专门针对 CPU 推断的蓝图,可基于 CPU 运行 Ollama。
可以,
AI Blueprints 目前仅提供一个 API(CLI 尚在开发中)。您还可以利用 Kueue CLI 通过 AI Blueprints 进行作业编排和调度。
借助 OCI AI Blueprints,您可以通过以下方式获益:
注:为免疑义,本网页所用以下术语专指以下含义: