菜单联系我们登录 Oracle Cloud

AI 基础设施

在分布式云环境的任意位置更快地运行高要求的 AI 工作负载，包括包括前沿模型训练和推理、agentic AI、科学计算和推荐系统。使用可支持多达 131072 个 GPU 的 Oracle Cloud Infrastructure ( OCI ) Supercluster，实现 zettascale 级性能。

与 AI 技术专家交流

参加 AI 研讨会

全球 Oracle Cloud 区域采用 NVIDIA GB200 NVL72 机架 (2:21)

Oracle 与 Google 合作，将 Gemini 引入 OCI Generative AI。

阅读新闻稿

现场演示日：Oracle、Meta 和 NVIDIA 专家在 OCI 上部署 Llama
不要错过 10 月 30 日的独家现场演示，我们将展示 Llama 在 OCI 上的部署。了解新的生成式 AI 技术的实际应用，了解实际用例，学习如何逐步构建更智能、更自动化的工作流。

立即报名
首要原则：Zettascale OCI Superclusters
OCI 的优秀架构师揭示了集群网络如何为可扩展的 GenAI 提供强大支持，从几个 GPU 到具有 131072 个 NVIDIA Blackwell GPU 的 Zettascale OCI Supercluster。

阅读博客
使用 OCI 加速 AI 工作负载 (PDF)
Oracle AI 基础设施可扩展、高性能且可随时随地部署。了解我们如何凭借出色的可扩展性、裸金属 GPU 实例等优势脱颖而出。

获取解决方案手册 (PDF)
AMD Instinct 企业策略组 MI300X
了解分析师对使用搭载 AMD GPU 的 OCI AI 基础设施的看法，以及此组合如何提高生产力、加快价值实现速度并降低能源成本。

了解更多

Oracle 和 NVIDIA 共同创新

了解两家公司如何加速 AI 采用。

Oracle 宣布推出新的开发人员功能

OCI 部署 NVIDIA Blackwell

为何要选择 OCI AI 基础设施？

性能和价值

利用 OCI 独特的 GPU 裸金属实例和超快的 RDMA 集群网络加快 AI 训练速度，将延迟降低至 2.5 微秒。在 GPU VM 上获得更实惠的定价。

HPC 存储

利用具有高性能挂载目标 (HPMT) 和 Lustre 的 OCI File Storage，实现每秒 TB 级的吞吐量。可使用高达 61.44 TB 的 NVMe 存储，是业内超高的 GPU 实例。

主权 AI

Oracle 的分布式云技术支持您在任意位置部署 AI 基础设施，满足您独特的性能、安全性和 AI 主权要求。了解 Oracle 和 NVIDIA 如何在任何位置提供主权 AI 服务。

搭载了 NVIDIA Blackwell 和 Hopper GPU 的 OCI Supercluster

GPU 多达 131072 个，8 倍更高的可扩展性
网络结构的创新支持 OCI Supercluster 扩展至 131072 个 NVIDIA B200 GPU，以及超过 100000 个 NVIDIA Grace Blackwell Superchips 和 65536 个 NVIDIA H200 GPU。

阅读的公告

OCI AI 基础设施可满足您的所有需求

无论是执行推断、微调还是训练大型横向扩展的生成式 AI 模型，OCI 都能提供出色的裸金属和虚拟机 GPU 集群，通过超高带宽网络和高性能存储满足您的 AI 需求。

使用配备 Instinct MI300X GPU 的 OCI Compute AMD 的“先试后买”计划。

立即注册

了解面向大规模 AI 训练的 OCI Supercluster

使用 NVIDIA Blackwell 和 Hopper 实现大规模横向扩展集群

超级计算
•无任何虚拟机管理程序开销的裸金属实例
•由 NVIDIA Blackwell (GB200 NVL72，HGX B200)、
Hopper (H200，H100) 和上一代 GPU 加速
•可选择使用 AMD MI300X GPU
•用于内置硬件加速的数据处理单元 (Data Processing Unit，DPU)

大容量和高吞吐量存储
•本地存储：高达 61.44 TB 的 NVMe SSD 容量
• 文件存储：由 Oracle 托管的文件存储，具备 Lustre 服务和高性能挂载目标
• 块存储：均衡、高性能和超高性能卷，并提供性能 SLA
• 对象存储：不同的存储类层、存储桶复制和高容量限制

超高速网络
•定制设计的基于融合以太网的 RDMA 协议 (RoCE v2)
• 2.5 至 9.1 微秒的集群网络延迟
•至多 3,200 Gb/秒的集群网络带宽
•最多 400 Gb/秒的前端网络带宽

OCI Supercluster 计算服务

基于 NVIDIA GB200 NVL72、NVIDIA B200、NVIDIA H200、AMD MI300X、NVIDIA L40S、NVIDIA H100 和 NVIDIA A100 GPU 的 OCI 裸金属实例支持您为深度学习、会话式 AI 和生成式 AI 等使用场景运行大型 AI 模型。

借助 OCI Supercluster，您可以扩展至超过 100000 个 GB200 Superchips、131072 个 B200 GPU、65536 个 H200 GPU、32768 个 A100 GPU、16384 个 H100 GPU、16384 个 MI300X GPU 以及每个集群 3840 个 L40S GPU。