La Red de Conocimientos Pedagógicos - Currículum vitae - Meta y NVIDIA se unen para construir una enorme supercomputadora de investigación en inteligencia artificial

Meta y NVIDIA se unen para construir una enorme supercomputadora de investigación en inteligencia artificial

La supercomputadora AI de Meta es el sistema cliente NVIDIA DGX A100 más grande hasta la fecha. El sistema proporcionará a los investigadores de IA de Meta 50 mil millones de rendimiento informático de IA, utilizando los sistemas NVIDIA, redes InfiniBand y software más avanzados para lograr la optimización del sistema de miles de clústeres de GPU.

Meta Platforms reconoce mucho a NVIDIA y seleccionó la tecnología avanzada de NVIDIA para convertirlo en el sistema de investigación más poderoso jamás creado.

El AI Research Super Cluster (RSC) lanzado hoy ha estado entrenando nuevos modelos para promover el desarrollo de la IA.

Cuando esté completamente implementado, se espera que el RSC de Meta se convierta en el sistema NVIDIA para 100 clientes más grande de DGX.

Meta dijo en una publicación de blog: "Esperamos que RSC pueda ayudarnos a construir un nuevo sistema de inteligencia artificial, como proporcionar traducción de voz en tiempo real para equipos con diferentes idiomas, para que puedan colaborar sin problemas en la investigación. proyectos e incluso jugar juegos AR juntos."

Entrenando el modelo de inteligencia artificial más grande

Cuando RSC esté completamente terminado a finales de este año, Meta lo utilizará para entrenar a más de 1 billón. Modelo de IA paramétrico. Esto facilitará el desarrollo del procesamiento del lenguaje natural y otras áreas como la identificación en tiempo real de contenidos ilegales.

Además de lograr un rendimiento a escala, Meta también considera la confiabilidad, la seguridad, la privacidad y la flexibilidad ultra altas para manejar "varios modelos de IA" como indicadores clave de RSC.

El superclúster de investigación de IA de Meta tiene cientos de sistemas NVIDIA DGX conectados a través de la red NVIDIA Quantum InfiniBand para ayudar al equipo de investigación de Meta AI a aumentar el ritmo de trabajo.

El secreto del espectáculo

Actualmente, este nuevo superordenador de inteligencia artificial ha desplegado 760 sistemas NVIDIA DGX A100 como sus nodos informáticos. * * * La red InfiniBand NVIDIA Quantum de 200 GB/s conecta 6080 GPU NVIDIA A100, lo que ofrece un rendimiento informático TF32 de 1895 (petaflops).

A pesar del impacto de la epidemia de COVID-19, RSC solo tardó 18 meses en llevar una supercomputadora de IA tan operativa desde la idea hasta la realización. Uno de los "héroes" utiliza la tecnología NVIDIA DGX A100 como piedra angular.

Penguin Computing es el socio responsable de la entrega de RSC en la red de socios de NVIDIA. Además del sistema 760 DGX A100 y la red InfiniBand, Penguin proporciona servicios de gestión y optimización de infraestructura de inteligencia artificial para Meta, incluido el sistema Altus de caché de 46 PB.

Mejora del rendimiento 20 veces

Esta es la segunda vez que Meta elige la tecnología NVIDIA como base para su plataforma de investigación. En 2017, Meta construyó la infraestructura de investigación de IA de primera generación, equipada con 22 000 GPU con núcleo tensorial NVIDIA v 100, que pueden manejar 35 000 tareas de entrenamiento de IA todos los días.

Los primeros puntos de referencia de Meta muestran que RSC puede entrenar grandes modelos de PNL 3 veces más rápido que los sistemas anteriores y ejecutar trabajos de visión por computadora 20 veces más rápido que los sistemas anteriores.

En la segunda fase a finales de este año, RSC se expandirá a 16.000 GPU. Meta cree que RSC proporcionará un rendimiento informático de IA de precisión mixta de hasta 50 mil millones de veces para entonces. Meta espera proporcionar hasta 1 eb de datos a una velocidad de 1 terabyte por segundo ampliando el sistema de almacenamiento de RSC.

Arquitectura escalable

La tecnología NVIDIA AI es adecuada para aplicaciones empresariales de cualquier tamaño.

NVIDIA DGX incluye la pila completa de software NVIDIA AI que escala fácilmente desde un único sistema a un DGX SuperPOD completo y puede ejecutarse localmente o en un proveedor de alojamiento. Los clientes también pueden alquilar sistemas DGX a través de NVIDIA DGX OEM.