DeepSeek-R1 — un ejemplo perfecto de escalado en el tiempo de prueba

DeepSeek-R1 es un modelo de mezcla de expertos (MoE) de gran tamaño. Incorpora unos impresionantes 671 mil millones de parámetros — 10 veces más que muchos otros modelos de lenguaje abiertos populares — y soporta una larga longitud de contexto de entrada de 128,000 tokens. Además, el modelo utiliza un número extremo de expertos por capa. Cada capa de R1 cuenta con 256 expertos, con cada token dirigido a ocho expertos separados en paralelo para su evaluación.

Para ofrecer respuestas en tiempo real para R1, se requieren muchas GPU con alto rendimiento de computación, conectadas con comunicación de alta capacidad y baja latencia para dirigir los tokens de entrada a todos los expertos para la inferencia. Combinado con las optimizaciones de software disponibles en el microservicio NIM de NVIDIA, un solo servidor con ocho GPU H200 conectadas utilizando NVLink y NVLink Switch puede ejecutar el modelo completo de 671 mil millones de parámetros de DeepSeek-R1 a una velocidad de hasta 3,872 tokens por segundo. Este rendimiento se logra gracias a la arquitectura NVIDIA Hopper que utiliza el motor FP8 Transformer en cada capa y los 900 GB/s de ancho de banda NVLink para la comunicación entre expertos MoE.

Comienza ahora con el microservicio DeepSeek-R1 NIM

Los desarrolladores pueden experimentar el microservicio DeepSeek-R1, ahora disponible. Con NVIDIA NIM, las empresas pueden desplegar DeepSeek-R1 con facilidad y asegurarse de obtener la alta eficiencia necesaria para los sistemas de inteligencia artificial agente.

- A word from our sposor -

DeepSeek-R1 se lanza con NVIDIA NIM y promete revolucionar la inteligencia artificial

0

31/01/2025

Artículo anterior

El niño Hugo Delgado Vizcaíno triunfa en la final autonómica de lectura en voz alta del Ayuntamiento de San Cristóbal de La Laguna

Artículo siguiente

Gobierno de Navarra invertirá más de 14 millones de euros en agua para la Ribera en los próximos seis años

IHG Expande su Marca Voco con Seis Nuevos Hoteles en México

Kimpton KAFD Riyadh: Un vistazo al primer hotel de lujo en el Medio Oriente

Volkswagen revela su emocionante futuro eléctrico en IAA MOBILITY 2025