NVIDIA presenta microservicios NIM y planos de IA para facilitar a los desarrolladores la creación de agentes de IA y flujos de trabajo creativos en PC
CES—NVIDIA anunció modelos fundamentales que funcionan localmente en PC de IA NVIDIA RTX™, los cuales mejoran los humanos digitales, la creación de contenido, la productividad y el desarrollo.
Modelos impulsados por la nueva serie GeForce RTX 50
Estos modelos, disponibles como microservicios NVIDIA NIM™, están acelerados por las nuevas GPU GeForce RTX™ 50 Series, que ofrecen hasta 3,352 billones de operaciones por segundo de rendimiento en IA y 32GB de VRAM. Basadas en la arquitectura NVIDIA Blackwell, las RTX 50 Series son las primeras GPU para consumidores que añaden soporte para cálculo FP4, duplicando el rendimiento de inferencia en IA y permitiendo que modelos generativos funcionen localmente con un menor uso de memoria en comparación con el hardware de generaciones anteriores.
Un nuevo enfoque para desarrolladores de IA
GeForce™ ha sido durante mucho tiempo una plataforma vital para desarrolladores de IA. La primera red de aprendizaje profundo acelerada por GPU, AlexNet, se entrenó en la GeForce GTX™ 580 en 2012, y el año pasado, más del 30% de los artículos de investigación en IA publicados citaban el uso de GeForce RTX.
Ahora, con la IA generativa y los PC de IA RTX, cualquier persona puede ser desarrollador. Una nueva ola de herramientas de bajo código y sin código, como AnythingLLM, ComfyUI, Langflow y LM Studio, permite a los entusiastas utilizar modelos de IA en flujos de trabajo complejos a través de interfases gráficas sencillas.
Los microservicios NIM conectados a estas interfaces gráficas harán que sea fácil acceder y desplegar los últimos modelos de IA generativa. Los Blueprints de IA de NVIDIA, construidos sobre microservicios NIM, ofrecen flujos de trabajo de referencia preconfigurados y fáciles de usar para humanos digitales, creación de contenido y más.
La demanda de PCs de IA RTX listos para NIM
Para satisfacer la creciente demanda de desarrolladores y entusiastas de IA, todos los principales fabricantes de PC y constructores de sistemas están lanzando PCs de IA RTX listos para NIM con GPU GeForce RTX 50 Series.
“IA avanza a una velocidad sorprendente, desde la IA de percepción hasta la IA generativa y ahora la IA agente,” afirmó Jensen Huang, fundador y CEO de NVIDIA. “Los microservicios NIM y los Blueprints de IA proporcionan a los desarrolladores y entusiastas de PC las bases para explorar la magia de la IA.”
Modelos fundamentales y aplicaciones de IA
Los modelos fundamentales, redes neuronales entrenadas con enormes cantidades de datos, son la base para la IA generativa. NVIDIA lanzará una serie de microservicios NIM para PCs de IA RTX de importantes desarrolladores de modelos como Black Forest Labs, Meta, Mistral y Stability AI. Los casos de uso abarcan modelos de lenguaje grande (LLMs), modelos de lenguaje de visión, generación de imágenes, procesamiento del habla y modelos de incrustación para generación aumentada por recuperación (RAG), extracción de PDF y visión por computadora.
“Las GPU GeForce RTX 50 Series con cálculo FP4 desbloquearán una amplia gama de modelos que pueden correr en PC, los cuales anteriormente estaban limitados a grandes centros de datos,” comentó Robin Rombach, CEO de Black Forest Labs. “Convertir a FLUX en un microservicio NIM de NVIDIA aumenta la velocidad a la que se puede desplegar y experimentar la IA por más usuarios, mientras se brinda un rendimiento increíble.”
NVIDIA también presentó hoy la familia Llama Nemotron de modelos abiertos que proporcionan alta precisión en una amplia gama de tareas de IA agente. El modelo Llama Nemotron Nano se ofrecerá como un microservicio NIM para PCs de IA RTX y estaciones de trabajo, y se destaca en tareas de IA agente como seguir instrucciones, llamar funciones, chat, codificación y matemáticas.
Compatibilidad y facilidad de desarrollo en Windows 11
Los microservicios NIM contienen los componentes clave para ejecutar IA en PCs y están optimizados para su implementación en las GPU de NVIDIA, ya sea en PCs RTX, estaciones de trabajo o en la nube. Los desarrolladores y entusiastas podrán descargar, configurar y ejecutar estos microservicios NIM rápidamente en PCs con Windows 11 utilizando el Subsistema de Windows para Linux (WSL).
“IA está impulsando la innovación en PCs con Windows 11 a un ritmo acelerado, y el Subsistema de Windows para Linux (WSL) ofrece un excelente entorno multiplataforma para el desarrollo de IA en Windows 11 junto con Windows Copilot Runtime,” dijo Pavan Davuluri, vicepresidente corporativo de Windows en Microsoft. “Los microservicios NIM de NVIDIA, optimizados para PCs con Windows, ofrecen a los desarrolladores y entusiastas modelos de IA listos para integrar en sus aplicaciones de Windows, acelerando aún más la implementación de capacidades de IA para los usuarios de Windows.”
Experiencia de NIM microservices en el futuro
Los microservicios NIM, funcionando en PCs de IA RTX, serán compatibles con los principales marcos de desarrollo de IA y agentes, incluidos AI Toolkit para VSCode, AnythingLLM, ComfyUI, CrewAI, Flowise AI, LangChain, Langflow y LM Studio. Los desarrolladores podrán conectar aplicaciones y flujos de trabajo construidos sobre estos marcos a los modelos de IA que funcionan con microservicios NIM a través de puntos finales estándar de la industria, permitiendo el uso de la última tecnología con una interfaz unificada en la nube, centros de datos, estaciones de trabajo y PCs.
Los entusiastas también podrán experimentar una variedad de microservicios NIM utilizando una próxima versión de la demostración técnica ChatRTX de NVIDIA.
Uso de avatares en IA agente
Para demostrar cómo los entusiastas y desarrolladores pueden utilizar NIM para construir agentes y asistentes de IA, NVIDIA presentó hoy el Proyecto R2X, un avatar de PC habilitado para visión que puede proporcionar información al usuario, asistir con aplicaciones de escritorio y videollamadas, leer y resumir documentos, entre otras funciones.
El avatar se renderiza utilizando NVIDIA RTX Neural Faces, un nuevo algoritmo de IA generativa que complementa la rasterización tradicional con píxeles generados en su totalidad. La cara se anima mediante un nuevo modelo basado en difusión NVIDIA Audio2Face™-3D que mejora el movimiento de labios y lengua. R2X puede conectarse a servicios de IA en la nube como GPT4o de OpenAI y Grok de xAI, así como a microservicios NIM y Blueprints de IA, como recuperadores de PDF u otros LLM, a través de marcos de desarrolladores como CrewAI, Flowise AI y Langflow.
Blueprints de IA disponibles para PC
Los microservicios NIM también están disponibles para los usuarios de PC a través de Blueprints de IA, flujos de trabajo de IA de referencia que pueden ejecutarse localmente en PCs RTX. Con estos planos, los desarrolladores pueden crear podcasts a partir de documentos PDF, generar imágenes impresionantes guiadas por escenas en 3D y más.
El plano para convertir PDF a podcast extrae texto, imágenes y tablas de un PDF para crear un guion de podcast que puede ser editado por los usuarios. También puede generar una grabación de audio completa a partir del guion utilizando voces disponibles en el plano o basándose en una muestra de voz del usuario. Además, los usuarios pueden tener una conversación en tiempo real con el anfitrión del podcast de IA para aprender más sobre temas específicos.
Este plano utiliza microservicios NIM como Mistral-Nemo-12B-Instruct para lenguaje, NVIDIA Riva para conversión de texto a voz y reconocimiento automático de voz, y la colección de microservicios NeMo Retriever para extracción de PDF.
El Blueprint de IA para IA generativa guiada por 3D otorga a los artistas un control más fino sobre la generación de imágenes. Si bien la IA puede generar imágenes increíbles a partir de simples indicaciones de texto, controlar la composición de imagen usando solo palabras puede ser un reto. Con este plano, los creadores pueden usar objetos 3D simples dispuestos en un renderizador 3D como Blender para guiar la generación de imágenes de IA. El artista puede crear activos 3D manualmente o generarlos usando IA, colocarlos en la escena y ajustar la cámara del visor 3D. Luego, un flujo de trabajo preconfigurado impulsado por el microservicio FLUX NIM usará la composición actual para generar imágenes de alta calidad que coincidan con la escena 3D.
Los microservicios NIM de NVIDIA y los Blueprints de IA estarán disponibles a partir de febrero con soporte inicial de hardware para GeForce RTX 50 Series, GeForce RTX 4090 y 4080, así como GPUs profesionales NVIDIA RTX 6000 y 5000. Se espera que más GPUs sean compatibles en el futuro.
Los PCs de IA RTX listos para NIM estarán disponibles de marcas como Acer, ASUS, Dell, GIGABYTE, HP, Lenovo, MSI, Razer y Samsung, así como de constructores de sistemas locales como Corsair, Falcon Northwest, LDLC, Maingear, Mifcon, Origin PC, PCS y Scan.