Os superclusters de 800.000 GPUs, a nova conexão baseada em Ethernet de alta velocidade e o licenciamento de software ultraflexível transformam a OCI na melhor plataforma de desempenho de IA.
Alan Zeichick | 16 de outubro de 2025
LAS VEGAS — Prepare-se para uma grande quantidade de poder de processamento na nuvem habilitada por IA. A Oracle anunciou o supercluster OCI Zettascale10, que oferece 16 zettaFLOPS em um cluster multigigawatt, no AI World essa semana. O provedor em hiperescala também lançou uma interconexão de rede baseada em Ethernet de alta velocidade, chamada Oracle Acceleron, além de um novo sistema de licenciamento de software multicloud que oferece aos clientes uma gama sem precedentes de opções de implementação.
O Zettacale10 Supercluster, desenvolvido na Oracle Cloud Infrastructure (OCI), abrange vários data centers e integra até 800.000 GPUs NVIDIA, todas vinculadas usando as redes baseadas em InfiniBand e RoCE de latência ultrabaixa da Oracle. InfiniBand é uma interconexão de alta velocidade padrão do setor para supercomputadores que permite que um servidor leia ou grave a memória de outro servidor diretamente usando RDMA, ou Remote Direct Memory Access. A rede Oracle Acceleron RoCE (RDMA sobre Ethernet Convergente) estende o RDMA a clusters de computação em nuvem e é especialmente indicada para tarefas de inteligência artificial.
“Os clientes podem criar, treinar e implementar os maiores modelos de IA em produção usando menos energia por unidade de desempenho e alcançando maior confiabilidade”, disse Mahesh Thiagarajan, vice-presidente executivo da OCI. “Com o OCI Zettascale10, estamos fundindo a inovadora arquitetura de rede Oracle Acceleron RoCE da OCI com a infraestrutura de IA de última geração da NVIDIA para fornecer capacidade de IA de vários gigawatts em escala incomparável.”
O poder do Zettascale10 não é medido apenas em zettaFLOPS (operações de ponto flutuante por seção) ou mesmo gigawatts. Um cluster Zettascale10 reside em muitos data centers densamente compactados, todos interconectados com links de fibra óptica de alta capacidade. O resultado: um supercluster que pode lidar até com as cargas de trabalho de IA mais desafiadoras.
O primeiro supercomputador Zettascale10 está localizado em Abilene, Texas, em um grande campus de data center de gigawatts.
A chave para o supercluster Zettascale10 é a mais recente tecnologia em interconexões de rede de alta velocidade, a malha de rede Oracle Acceleron RoCE. Ao contrário do InfiniBand, que oferece excelente desempenho, mas requer hardware especializado, o Acceleron usa placas de interface de rede Ethernet (NICs) e cabos especializados para conectar GPUs de alto desempenho em um data center da OCI. Essas NICs especializadas incluem seus próprios switches Ethernet de quatro portas, um design que reduz a latência do tráfego em uma rede grande e complexa.
"Embora a OCI seja um conjunto de serviços, ela foi projetada como um sistema coeso. Quando você aparece e usa nosso produto, desde o preço, a forma como você o provisiona, a maneira como você usa nosso console, a forma como todas as APIs funcionam juntas, a maneira como você faz download dos nossos SDKs, a forma como os serviços realmente funcionam, há uma combinação de design e facilidade de uso.
Com a estrutura de rede Acceleron, a Oracle pode ajudar os clientes a implementar grandes clusters de IA rapidamente e com menor custo, conectando NICs de GPU a vários switches de rede simultaneamente, criando assim uma estrutura de rede mais plana com muitos planos de rede isolados. Essa arquitetura permite que o tráfego flua mais rapidamente, para que as GPUs não fiquem paradas esperando para enviar ou receber dados. Um dos benefícios é a eficiência, pois o supercluster Zettascale10 pode entregar resultados significativamente mais rápido. Outro é a previsibilidade: o desempenho é mais uniforme entre os clusters de supercomputadores, com menor latência de GPU para GPU, pois há menos switches para percorrer. Isso também adiciona resiliência no caso de parte da rede ser interrompida devido ao uso excessivo. Por fim, a rede RoCE da Acceleron mantém o fluxo de dados mesmo se um plano de rede for retirado de serviço para a manutenção de hardware ou software.
A arquitetura exclusiva da Acceleron oferece criptografia de taxa de linha por toda a rede, com latência ultrabaixa. Os clientes obtêm o dobro da capacidade potencial de rede, até o dobro de IOPS de armazenamento (entrada/saída por segundo) e políticas de segurança de roteamento de pacotes de confiança zero (ZPR) aplicadas diretamente no host, ou seja, em cada NIC Acceleron e em cada ponto da rede. Um dos benefícios dessa abordagem é que as políticas de segurança On-NIC podem bloquear o acesso ao armazenamento de objetos pela Internet para evitar a exfiltração de dados.
“A Acceleron é a base de todas as nossas funções de segurança e aceleração de E/S”, afirmou o CEO da Oracle, Clay Magouyrk, durante o keynote no AI World. “Os clientes terão um desempenho superior com menor custo, maior facilidade de uso e maior segurança.”
A complexidade define as implementações em nuvem para muitos clientes que utilizam uma rede diversificada de aplicações e serviços de provedores em hiperescala, como Oracle, Amazon Web Services, Google Cloud e Microsoft Azure. Mesmo quando uma arquitetura precisa ser complexa para atender aos requisitos técnicos de uma organização, o licenciamento de serviços deve ser simples, e é aí que o novo programa Oracle Multicloud Universal Credits ajuda.
Com o programa, os clientes adquirem serviços do Oracle Database e da OCI na nuvem ou nas nuvens de sua escolha. Os créditos podem ser usados no Oracle Database@AWS, Oracle Database@Azure, Oracle Database@Google Cloud e na própria OCI. Isso permite que os clientes implementem cargas de trabalho de forma flexível e vejam contratos consistentes em todas as nuvens.
“Com 37 regiões multicloud ativas na AWS, Azure e Google Cloud, e o lançamento previsto do Oracle Multicloud Universal Credits, estamos oferecendo aos clientes mais opções e flexibilidade do que nunca, simplificando os contratos e introduzindo o primeiro modelo de consumo flexível e entre nuvens do setor”, afirmou Karan Batta, vice-presidente sênior da OCI. Com um único modelo de licenciamento e consumo entre nuvens, os clientes obtêm uma única estrutura de administração e governança para aplicações e serviços Oracle, bem como uma experiência consistente de banco de dados.
As empresas também podem usar seus créditos para qualquer serviço OCI na nuvem, ou nuvens, do provedor em hiperescala de sua escolha.
Com o supercomputador Zettascale10 e a tecnologia de malha de rede Acceleron RoCE, os clientes podem executar cargas de trabalho de IA complexas em até 800.000 GPUs. Com o programa Oracle Multicloud Universal Credits, o licenciamento e o uso dos serviços do Oracle Database em várias nuvens nunca foram tão simples. Com esses avanços, a Oracle oferece eficiência, simplicidade, flexibilidade, desempenho excepcional e opções para clientes multicloud.
Uma nuvem distribuída com IA integrada, onde você precisar.
Descubra como LLMs prontos para uso, agentes de IA e machine learning avançado podem ajudar a automatizar fluxos de trabalho, conquistar clientes e tornar as pessoas mais produtivas.