Los superclústeres de 800 000 GPU, la nueva conexión basada en Ethernet de alta velocidad y las licencias de software ultraflexibles transforman a Oracle Cloud Infrastrucure en la plataforma de rendimiento de IA definitiva.
Alan Zeichick | 16 de octubre de 2025
LAS VEGAS: prepárate para cantidades masivas de capacidad de procesamiento en la nube que mejoran la IA. Oracle anunció su superclúster OCI Zettascale10, que entrega 16 zettaFLOPS dentro de un clúster de varios gigavatios, en su conferencia AI World esta semana. El hiperescalador también lanzó una interconexión de red basada en Ethernet de alta velocidad, llamada Oracle Acceleron, así como un nuevo sistema de licencias de software multicloud que ofrece a los clientes una gama sin precedentes de opciones de implementación.
Zettacale10 Supercluster, basado en Oracle Cloud Infrastructure (OCI), abarca varios centros de datos e integra hasta 800 000 GPU de NVIDIA, todas unidas mediante las redes InfiniBand y RoCE de latencia ultrabaja de Oracle. InfiniBand es una interconexión de alta velocidad estándar del sector para supercomputadoras que permite que un servidor lea o escriba la memoria de otro servidor directamente mediante RDMA o acceso directo a memoria remoto. Las redes Oracle Acceleron RoCE (RDMA sobre Ethernet convergente) amplían la RDMA a clústeres de informática en la nube y son especialmente adecuadas para las tareas de IA.
"Los clientes pueden construir, entrenar y desplegar sus modelos de IA más grandes en producción utilizando menos energía por unidad de rendimiento y logrando mayor fiabilidad", dice Mahesh Thiagarajan, vicepresidente ejecutivo de OCI. "Con OCI Zettascale10, estamos fusionando la innovadora arquitectura de red de Oracle Acceleron RoCE de OCI con la infraestructura de IA NVIDIA de última generación para ofrecer capacidad de IA de varios gigavatios a una escala inigualable".
La potencia de Zettascale10 no se mide simplemente en zettaFLOPS (operaciones de punto flotante por sección) o incluso en gigavatios. Un clúster Zettascale10 reside en muchos centros de datos densamente empaquetados, todos interconectados con enlaces de fibra óptica de alta capacidad. El resultado: un superclúster que puede gestionar incluso las cargas de trabajo de IA más desafiantes.
La primera supercomputadora Zettascale10 tiene su sede en Abilene, en el Estado de Texas, en un gran campus de centro de datos de gigavatios.
La clave del superclúster Zettascale10 es la última de las interconexiones de red de alta velocidad, el tejido de red RoCE de Oracle Acceleron. A diferencia de InfiniBand, que ofrece un rendimiento excelente pero requiere hardware especializado, Acceleron utiliza tarjetas y cables de interfaz de red Ethernet (NIC) especializados para vincular GPU de alto rendimiento dentro de un centro de datos de OCI. Estas NIC especializadas incluyen sus propios conmutadores Ethernet de cuatro puertos, un diseño que reduce la latencia del tráfico en una red grande y compleja.
"Si bien OCI es un conjunto de servicios, en realidad está diseñado como un todo cohesivo. Cuando llegas y utilizas nuestro producto, desde cómo se fija precio, cómo se aprovisiona, cómo usas nuestra consola, cómo todas las API funcionan juntas, cómo se descargan nuestros SDK, cómo funcionan realmente los servicios..., percibes una total cohesión entre diseño y facilidad de uso".
Con el tejido de red Acceleron, Oracle puede ayudar a los clientes a desplegar clústeres de IA muy grandes de forma rápida y a un costo menor, conectando NIC de GPU a varios conmutadores de red simultáneamente, lo que crea un tejido de red más plano con muchos planos de red aislados. Esa arquitectura permite que el tráfico fluya de forma más rápida, por lo que las GPU no se quedan paralizadas a la espera de enviar o recibir datos. Una ventaja es la eficiencia: el superclúster Zettascale10 puede ofrecer resultados significativamente más rápido. Otra es la previsibilidad: el rendimiento es más uniforme en los clústeres de supercomputadoras, con menor latencia de GPU a GPU porque hay menos conmutadores que recorrer. Esto también incrementa la resiliencia en caso de que parte de la red se detenga debido a un excesivo uso. Por último, el tejido Acceleron RoCE mantiene el flujo de datos incluso si un plano de red se retira del servicio para realizar mantenimiento de hardware o software.
La arquitectura única de Acceleron ofrece cifrado de velocidad de línea a lo largo y ancho de la red, con latencia ultra baja. Los clientes obtienen el doble de la capacidad potencial de red, hasta el doble de IOPS de almacenamiento (entrada/salida por segundo) y políticas de seguridad de enrutamiento de paquetes de confianza cero (ZPR) aplicadas directamente en el host, es decir, en cada NIC de Acceleron y en cada punto de la red. Una de las ventajas de este enfoque es que las políticas de seguridad en NIC pueden bloquear el acceso al almacenamiento de objetos en Internet para evitar la filtración de datos.
"Acceleron es la base de todas nuestras funciones de seguridad y aceleración de E/S", comenta el CEO de Oracle, Clay Magouyrk, durante su presentación en AI World. "Los clientes disfrutarán de un mayor rendimiento máximo a un costo menor, más facilidad de uso y una seguridad reforzada".
La complejidad define las implementaciones en la nube para muchos clientes que utilizan una amplia web de aplicaciones y servicios de hiperescaladores como Oracle, Amazon Web Services, Google Cloud y Microsoft Azure. Incluso cuando una arquitectura debiera ser compleja para cumplir los requisitos técnicos de una organización, las licencias de servicio deben ser simples, y es ahí donde resulta de enorme utilidad el nuevo programa de Oracle Multicloud Universal Credits.
Con el programa, los clientes adquieren los servicios de Oracle Database y OCI en la nube, o nubes, que elijan. Los créditos se pueden utilizar en Oracle Database@AWS, Oracle Database@Azure, Oracle Database@Google Cloud y la propia OCI. Esto permite a los clientes desplegar cargas de trabajo de forma flexible y tener contratos uniformes en todas las nubes.
"Con 37 regiones multicloud en vivo en AWS, Azure y Google Cloud, y el próximo lanzamiento de Oracle Multicloud Universal Credits, estamos brindando a nuestros clientes más opciones y libertad que nunca simplificando los contratos e introduciendo el primer modelo de consumo flexible y entre nubes de la industria", señala Karan Batta, vicepresidente sénior de OCI. Con un único modelo de licencias y consumo para todas las nubes, los clientes obtienen una única estructura de administración y gobernanza para Oracle Applications y servicios, así como una experiencia de base de datos coherente.
Las empresas también pueden utilizar sus créditos para cualquier servicio de OCI en la nube hiperescaladora, o nubes, dque prefieran.
Con la supercomputadora Zettascale10 y la tecnología de tejido de red Acceleron RoCE, los clientes pueden ejecutar cargas de trabajo de IA pesadas en hasta 800 000 GPU. Con el programa Oracle Multicloud Universal Credits, las licencias y el uso de los servicios de Oracle Database en múltiples nubes nunca han sido más fáciles ni más sencillos. Con estos avances, Oracle ofrece eficiencia, simplicidad, flexibilidad, rendimiento excepcional y opciones para los clientes multinube.
Una nube distribuida con IA integrada, dondequiera que la necesites.
Descubre cómo los LLM listos para usar, los agentes de IA y el aprendizaje automático avanzado pueden ayudarte a automatizar los flujos de trabajo, ganar clientes e incrementar la productividad de tus profesionales.