OCI 使用 Zettascale10 和 Acceleron 重新定義頂級 AI 效能

800,000-GPU 超級叢集、新的高速乙太網路連線以及超彈性軟體授權,將 OCI 轉換為終極 AI 效能平台。

Alan Zeichick | 2025 年 10 月 16 日


LAS VEGAS — 為實現大量 AI 雲端運算能力做好準備。Oracle 本週在 AI 世界大會上宣布推出其 OCI Zettascale10 超級叢集,在多瓦特叢集內提供 16 個 zettaFLOPS。這家超大規模雲端服務供應商也推出了以乙太網路為基礎的高速網路互連 (稱為 Oracle Acceleron),以及一個全新的多雲端軟體授權系統,為客戶提供前所未有的部署選項。

Oracle Cloud Infrastructure (OCI) 上建置的 Zettacale10 Supercluster 橫跨多個資料中心,並整合多達 800,000 個 NVIDIA GPU,全都使用 Oracle 的超低延遲 InfiniBand 和 RoCE 網路。InfiniBand 是超級電腦適用的業界標準高速互連通訊標準,可讓一部伺服器直接使用 RDMA 或「遠端直接記憶體存取」讀取或寫入另一部伺服器的記憶體。Oracle Acceleron RoCE (RDMA over Converged Ethernet) 網路可將 RDMA 延伸至雲端運算叢集,特別適合 AI 作業。

OCI 執行副總裁 Mahesh Thiagarajan 表示:「客戶可以使用較少的每效能單位電力,在生產環境中建置、訓練及部署最大的 AI 模型,並實現更高的可靠性。有了 OCI Zettascale10,我們正利用 OCI 與新一代 NVIDIA AI 基礎架構的突破性 Oracle Acceleron RoCE 網路架構,以無與倫比的規模提供多瓦 AI 容量。」

Zettascale10 的強大功能無法只使用 zettaFLOPS (每個區段的浮點運算)、甚至十億瓦來測量。Zettascale10 叢集位於許多密集資料中心,而所有資料中心都與高容量光纖連結互連,因此能夠處理最具挑戰性 AI 工作負載的超級叢集。

第一部 Zettascale10 超級電腦位於德州阿比倫,位於大型十億瓦資料中心園區。

Acceleron RoCE 可調整運算結構

Zettascale10 超級叢集的關鍵是最新內建的高速網路連結,也就是 Oracle Acceleron RoCE 網路結構。Acceleron 使用專門的乙太網路介面卡 (NIC) 和纜線來連結 OCI 資料中心內的高效能 GPU,這點與提供卓越效能但需要特殊硬體的 InfiniBand 不同。這些特殊的 NIC 包括自己的四埠乙太網路交換器,這種設計可降低大型、複雜網路中的流量延遲。

雖然 OCI 是服務集合,但其設計實際上卻是凝聚性的整體。當您開始使用我們的產品時,從您佈建產品的方式 (使用我們主控台的方式) 開始,所有 API 協同運作的方式、您下載 SDK 的方式、服務實際運作的方式,都採用統一的設計且易於使用。」

Clay Magouyrk Oracle 執行長

透過 Acceleron 網路結構,Oracle 可協助客戶同時將 GPU NIC 連線至多個網路交換器,以更低的成本快速部署大型 AI 叢集,進而建立具有許多隔離網路平面的更扁平網路結構。該架構讓流量更快速地流動,因此 GPU 不會因等待傳送或接收資料而停滯。其中一項優點是效率,因為 Zettascale10 超級叢集可以更快提供結果。另一項優點是可預測性:超級電腦叢集的效能更一致,但 GPU 對 GPU 的延遲也較低,因為周遊時的切換次數較少。如此也能在網路因使用率過重而停滯時,提升復原能力。最後,即使因硬體或軟體維護而無法使用某個網路平面,Acceleron RoCE 結構仍會維持資料流。

Acceleron 的獨特架構透過網路和跨網路提供線速加密,延遲極低。客戶將獲得兩倍的潛在網路容量,最多兩倍的儲存 IOPS (每秒輸入/輸出),以及直接在主機強制執行零信任封包路由 (ZPR) 安全原則 (亦即在每個 Acceleron NIC 和網路上的每個點)。此方法的一項優點:On-NIC 安全原則可封鎖網際網路上的物件儲存存取,以防止資料外流。

Oracle 執行長 Clay Magouyrk 在 AI World 的主題演說中表示:「Acceleron 是我們所有 I/O 安全性和加速功能的基礎。客戶將享有更低的成本、更簡單的使用方式和更高的安全性,並因而獲得更高的尖峰效能。」

通用購買方式

許多客戶需要進行複雜的雲端部署,這些客戶使用來自超大規模雲端服務供應商 Oracle、Amazon Web Services、Google Cloud 和 Microsoft Azure 的各種應用程式和服務。即使組織必須使用複雜架構以符合技術要求,服務授權也應該要很簡單,而新的 Oracle Multicloud Universal Credits 方案能提供這方面的協助。

客戶可以透過這項方案,在單一或多個雲端中購買 Oracle Database 和 OCI 服務。方案點數可用於 Oracle Database@AWS、Oracle Database@Azure、Oracle Database@Google Cloud 和 OCI 本身。如此一來,客戶就能靈活地部署工作負載,並為不同的雲端簽署一致的合約。

OCI 資深副總裁 Karan Batta 表示:「現在 AWS、Azure 和 Google Cloud 有 37 個多雲端區域上線,我們也即將推出 Oracle Multicloud Universal Credits,藉此簡化合約並導入業界第一個彈性跨雲端使用模型,為客戶提供比以往更多的選擇和彈性。透過跨雲端的單一授權和使用模式,客戶可以獲得 Oracle Applications 和服務的單一管理和治理結構,以及一致的資料庫體驗。

企業也可以將點數用於超大規模雲端或所選雲端中的任何 OCI 服務。

新的高效能彈性企業級 AI 標準

客戶可以使用 Zettascale10 超級電腦和 Acceleron RoCE 網路結構技術,跨多達 800,000 個 GPU 執行繁重的 AI 工作負載。透過 Oracle Multicloud Universal Credits 方案,跨多個雲端授權和使用 Oracle Database 服務從未如此簡單,也更直截了當。Oracle 透過這些進展,為多雲端客戶提供高效率、簡易性、彈性、卓越效能和更多選擇。


檢視更多 Oracle Connect 文章