La inteligencia artificial está ingresando en una nueva era — AI agentiva — donde equipos de agentes especializados pueden ayudar a las personas a resolver problemas complejos y automatizar tareas repetitivas.
Nueva familia de modelos Llama Nemotron de NVIDIA
Con agentes de IA personalizados, las empresas de diversos sectores pueden manufacturar inteligencia y lograr una productividad sin precedentes. Estos avanzados agentes de IA requieren un sistema de múltiples modelos generativos de IA optimizados para funciones y capacidades de AI agentiva. Esta complejidad significa que la necesidad de modelos potentes y eficientes de grado empresarial nunca ha sido tan grande.
Para proporcionar una base para la IA agentiva en empresas, NVIDIA anunció la familia de modelos de lenguaje de gran escala Llama Nemotron. Construidos con Llama, los modelos pueden ayudar a los desarrolladores a crear y desplegar agentes de IA en una variedad de aplicaciones, incluyendo atención al cliente, detección de fraudes y optimización de la gestión de la cadena de suministro y de inventarios.
Modelos Llama Nemotron optimizan la eficiencia y exactitud para agentes de IA
Construidos con los modelos base Llama — una de las colecciones de modelos de código abierto comerciales más populares, que se han descargado más de 650 millones de veces — los modelos Llama Nemotron de NVIDIA proporcionan bloques de construcción optimizados para el desarrollo de agentes de IA. Esto refuerza el compromiso de NVIDIA de desarrollar modelos de vanguardia, como el Llama 3.1 Nemotron 70B, que ahora está disponible a través del catálogo de API de NVIDIA.
Los modelos Llama Nemotron están entrenados y optimizados con las últimas técnicas de NVIDIA y conjuntos de datos de alta calidad para mejorar sus capacidades agentivas. Sobresalen en seguir instrucciones, chat, invocación de funciones, programación y matemáticas, al mismo tiempo que están optimizados en tamaño para funcionar en una amplia gama de recursos de computación acelerada de NVIDIA.
“AI agentiva es la próxima frontera en el desarrollo de IA, y cumplir con esta oportunidad requiere una optimización de pila completa a través de un sistema de modelos de lenguaje de gran escala para ofrecer agentes de IA eficientes y precisos,” afirmó Ahmad Al-Dahle, vicepresidente y líder de GenAI en Meta. “A través de nuestra colaboración con NVIDIA y nuestro compromiso compartido con los modelos abiertos, la familia Llama Nemotron de NVIDIA, construida sobre Llama, puede ayudar a las empresas a crear rápidamente sus propios agentes de IA personalizados.”
Se espera que proveedores líderes de plataformas de agentes de IA, como SAP y ServiceNow, sean de los primeros en utilizar los nuevos modelos Llama Nemotron.
“Los agentes de IA que colaboran para resolver tareas complejas en múltiples líneas de negocio desbloquearán un nuevo nivel de productividad empresarial más allá de los escenarios de IA generativa de hoy,” dijo Philipp Herzig, director de IA en SAP. “A través de Joule de SAP, cientos de millones de usuarios empresariales interactuarán con estos agentes para lograr sus objetivos más rápido que nunca. La nueva familia de modelos abiertos Llama Nemotron de NVIDIA fomentará el desarrollo de múltiples agentes de IA especializados para transformar los procesos empresariales.”
“Los agentes de IA permiten a las organizaciones lograr más con menos esfuerzo, estableciendo nuevos estándares para la transformación empresarial,” expresó Jeremy Barnes, vicepresidente de IA en plataforma en ServiceNow. “El rendimiento y la precisión mejorados de los modelos abiertos Llama Nemotron de NVIDIA pueden ayudar a construir servicios avanzados de agentes de IA que resuelvan problemas complejos en múltiples funciones y en cualquier sector.”
Los modelos Llama Nemotron de NVIDIA utilizan NeMo para destilación, poda y alineación. Usando estas técnicas, los modelos son lo suficientemente pequeños como para ejecutarse en diversas plataformas de computación mientras ofrecen alta precisión y un mayor rendimiento de modelo.
Los modelos de la familia Llama Nemotron estarán disponibles como modelos descargables y como microservicios NVIDIA NIM que se pueden desplegar fácilmente en la nube, centros de datos, PCs y estaciones de trabajo. Ofrecen a las empresas un rendimiento líder en la industria con integración confiable, segura y fluida en sus flujos de trabajo de aplicaciones de IA agentiva.
Personaliza y conecta con el conocimiento empresarial usando NVIDIA NeMo
Las familias de modelos Llama Nemotron y Cosmos Nemotron estarán disponibles en tamaños Nano, Super y Ultra para proporcionar opciones de despliegue de agentes de IA a cualquier escala.
- Nano: El modelo más rentable optimizado para aplicaciones en tiempo real con baja latencia, ideal para desplegar en PCs y dispositivos de borde.
- Super: Un modelo de alta precisión que ofrece un rendimiento excepcional en una sola GPU.
- Ultra: El modelo de mayor precisión, diseñado para aplicaciones a escala de centros de datos que exigen el máximo rendimiento.
Las empresas también pueden personalizar los modelos para sus casos de uso y dominios específicos con los microservicios NVIDIA NeMo para simplificar la curación de datos, acelerar la personalización y evaluación del modelo, y aplicar medidas de control para mantener las respuestas en el camino correcto.
Con NVIDIA NeMo Retriever, los desarrolladores también pueden integrar capacidades de generación aumentada por recuperación para conectar modelos a sus datos empresariales. Además, utilizando los modelos de referencia de NVIDIA para IA agentiva, las empresas pueden crear rápidamente sus propias aplicaciones usando las avanzadas herramientas de IA de NVIDIA y la experiencia en desarrollo de extremo a extremo.
NeMo, NeMo Retriever y los modelos de referencia de NVIDIA están disponibles con la plataforma de software NVIDIA AI Enterprise.
Disponibilidad
Los modelos Llama Nemotron y Cosmos Nemotron estarán disponibles pronto como interfaces de programación de aplicaciones alojadas y para descarga. Las empresas pueden ejecutar microservicios Llama Nemotron y Cosmos Nemotron NIM en producción con la plataforma de software NVIDIA AI Enterprise en infraestructuras de datos acelerados y en la nube.
Los detalles sobre la disponibilidad serán anunciados más adelante.