I supercluster da 800.000 GPU, la nuova connessione basata su Ethernet ad alta velocità e le licenze software ultra flessibili trasformano OCI nella piattaforma di prestazioni AI definitiva.
Alan Zeichick | 16 ottobre 2025
LAS VEGAS - Preparati a enormi quantità di potenza di cloud computing a supporto dell'intelligenza artificiale. Oracle ha annunciato il suo supercluster OCI Zettascale10, che offre 16 zettaFLOPS all'interno di un cluster multigigawatt, alla conferenza AI World di questa settimana. L'hyperscaler ha anche lanciato un'interconnessione di rete basata su Ethernet ad alta velocità, chiamata Oracle Acceleron, nonché un nuovo sistema di licenze software multicloud che offre ai clienti una gamma senza precedenti di opzioni di implementazione.
Il Zettacale10 Supercluster, basato su Oracle Cloud Infrastructure (OCI), si estende su più data center e integra fino a 800.000 GPU NVIDIA, tutte collegate tra loro utilizzando le reti InfiniBand e RoCE a bassissima latenza di Oracle. InfiniBand è un'interconnessione ad alta velocità standard del settore per i supercomputer che consente a un server di leggere o scrivere la memoria di un altro server direttamente utilizzando RDMA o Remote Direct Memory Access. La rete RoCE (RDMA over Converged Ethernet) di Oracle Acceleron estende l'RDMA nei cluster di cloud computing ed è particolarmente adatta alle attività AI.
"I clienti possono creare, addestrare e mettere i loro più grandi modelli AI in produzione utilizzando meno potenza per unità di prestazioni e ottenendo una maggiore affidabilità", ha dichiarato Mahesh Thiagarajan, Executive Vice President di OCI. "Con OCI Zettascale10, stiamo fondendo l'innovativa architettura di rete Oracle Acceleron RoCE di OCI con l'infrastruttura AI NVIDIA di nuova generazione per fornire capacità AI multigigawatt su scala senza precedenti".
La potenza di Zettascale10 non viene misurata solo in zettaFLOPS (operazioni a punto variabile per sezione) o in gigawatt. Un cluster Zettascale10 vive in molti data center densamente popolati, tutti interconnessi con collegamenti in fibra ottica ad alta capacità. Il risultato: un supercluster in grado di gestire anche i carichi di lavoro AI più impegnativi.
Il primo supercomputer Zettascale10 ha sede ad Abilene, in Texas, in un grande campus di data center gigawatt.
La chiave per il supercluster Zettascale10 è la più recente fabric ad alta velocità Oracle Acceleron RoCE. A differenza di InfiniBand, che offre prestazioni eccellenti ma richiede un hardware specializzato, Acceleron utilizza network interface card (NIC) di rete Ethernet specializzate e cavi per collegare GPU ad alte prestazioni all'interno di un data center OCI. Queste NIC specializzate includono i propri switch Ethernet a quattro porte, un design che riduce la latenza del traffico su una rete grande e complessa.
"Sebbene OCI sia una raccolta di servizi, è in realtà progettata come un insieme coerente. C'è un design specifico che garantisce facilità d'uso in ogni aspetto dell'utilizzo del nostro prodotto: dal modo in cui è valutato e dal modo in cui lo si fornisce, al modo in cui si utilizza la nostra console, al modo in cui tutte le API funzionano insieme, al modo vengono scaricati i nostri SDK e al modo in cui i servizi funzionano".
Grazie alla fabric Acceleron, Oracle può aiutare i clienti a implementare cluster AI molto grandi in modo rapido e a costi inferiori, connettendo le schede NIC GPU a più switch di rete contemporaneamente, creando così un fabric di rete più piatto con molti piani di rete isolati. Tale architettura consente un flusso di traffico più rapido, quindi le GPU non sono bloccate in attesa di inviare o ricevere dati. Un vantaggio è l'efficienza: il supercluster Zettascale10 è in grado di garantire risultati notevolmente più rapidi. Un'altra è la prevedibilità: le prestazioni sono più uniformi tra i cluster di supercomputer, con una latenza GPU-GPU inferiore perché ci sono meno switch da attraversare. Ciò aggiunge anche resilienza nel caso in cui una parte della rete si blocchi a causa di un grande utilizzo. Infine, la fabric Acceleron RoCE mantiene il flusso dei dati anche se un piano di rete viene rimosso dal servizio per la manutenzione hardware o software.
L'architettura di Acceleron offre crittografia a velocità di linea attraverso la rete, con latenza ultra bassa. I clienti ottengono il doppio della potenziale capacità di rete, fino al doppio delle IOPS (input/output al secondo) di storage e delle policy di sicurezza ZPR (zero-trust packet routing) applicate direttamente all'host, ovvero in ogni NIC Acceleron e in ogni punto della rete. Uno dei vantaggi di questo approccio: le policy di sicurezza On-NIC possono bloccare l'accesso allo storage degli oggetti su Internet per impedire l'esfiltrazione dei dati.
"Acceleron è la base per tutte le nostre funzioni di sicurezza e accelerazione I/O", ha dichiarato Clay Magouyrk, CEO di Oracle, durante la sua keynote all'AI World. "I clienti vedranno prestazioni di picco più elevate con costi inferiori, maggiore facilità d'uso e maggiore sicurezza".
La complessità definisce le implementazioni cloud per molti clienti che utilizzano un web eterogeneo di applicazioni e servizi dagli hyperscaler Oracle, Amazon Web Services, Google Cloud e Microsoft Azure. Anche quando un'architettura deve essere complicata per soddisfare i requisiti tecnici di un'organizzazione, la licenza di servizio deve essere semplice ed è qui che si dimostra d'aiuto il nuovo programma Oracle Multicloud Universal Credits.
Con il programma, i clienti acquistano i servizi Oracle Database e OCI nel cloud, o nei cloud, che preferiscono. I crediti sono utilizzabili su Oracle Database@AWS, Oracle Database@Azure, Oracle Database@Google Cloud e OCI stesso. Ciò consente ai clienti di implementare in modo flessibile i carichi di lavoro e visualizzare contratti coerenti tra i cloud.
"Con 37 region multicloud ora disponibili in AWS, Azure e Google Cloud e il lancio che avverrà a breve di Oracle Multicloud Universal Credits, stiamo offrendo ai clienti più scelte e flessibilità che mai semplificando i contratti e introducendo il primo modello di consumo flessibile e cross-cloud del settore", ha dichiarato Karan Batta, senior vice president di OCI. Con un unico modello di licenza e consumo nei cloud, i clienti ottengono un'unica struttura di amministrazione e governance per Oracle Applications e servizi, nonché un'esperienza di database coerente.
Le aziende possono anche utilizzare i propri crediti per qualsiasi servizio OCI nel cloud hyperscaler, o nei cloud, che preferiscono.
Con il supercomputer Zettascale10 e la tecnologia fabric Acceleron RoCE, i clienti possono eseguire carichi di lavoro AI pesanti su fino a 800.000 GPU. Con il programma Oracle Multicloud Universal Credits, le licenze e l'uso dei servizi Oracle Database su più cloud non sono mai stati così semplici. Con questi progressi, Oracle offre efficienza, semplicità, flessibilità, prestazioni eccezionali e scelta per i clienti multicloud.
Un cloud distribuito con AI integrata, ovunque tu ne abbia bisogno.
Scopri come LLM, AI agent e machine learning avanzato pronti all'uso possono aiutarti ad automatizzare i flussi di lavoro, conquistare i clienti e rendere le persone più produttive.