Desarrollando aplicaciones con microservicios NIM de IA soberana

Los desarrolladores pueden desplegar fácilmente los modelos de IA soberana, empaquetados como microservicios NIM, en producción, logrando un rendimiento mejorado.

Los microservicios, disponibles con NVIDIA AI Enterprise, están optimizados para inferencia con la biblioteca de código abierto NVIDIA TensorRT-LLM.

Los microservicios NIM para Llama 3 70B, que se utilizó como modelo base para los nuevos Llama–3-Swallow-70B y Llama-3-Taiwan-70B, pueden proporcionar hasta 5 veces más rendimiento. Esto reduce el costo total de funcionamiento de los modelos en producción y brinda una mejor experiencia al usuario al disminuir la latencia.

Los nuevos microservicios NIM están disponibles como interfaces de programación de aplicaciones (APIs) hospedadas.

Utilizando NVIDIA NIM para resultados generativos de IA más rápidos y precisos

Los microservicios NIM aceleran los despliegues, mejoran el rendimiento general y proporcionan la seguridad necesaria para organizaciones en diversas industrias globales, incluyendo salud, finanzas, manufactura, educación y legal.

El Instituto Tecnológico de Tokio ajustó Llama-3-Swallow 70B utilizando datos en japonés.

“Los LLM no son herramientas mecánicas que brindan el mismo beneficio para todos. Son, más bien, herramientas intelectuales que interactúan con la cultura y creatividad humanas. La influencia es mutua, donde no solo los modelos se ven afectados por los datos en los que se entrenan, sino que nuestra cultura y los datos que generamos también son influenciados por los LLM”, dijo Rio Yokota, profesor en el Centro Global de Información Científica y Computación del Instituto Tecnológico de Tokio. “Por lo tanto, es de suma importancia desarrollar modelos de IA soberana que se adhieran a nuestras normas culturales. La disponibilidad de Llama-3-Swallow como microservicio NIM de NVIDIA permitirá a los desarrolladores acceder y desplegar el modelo para aplicaciones japonesas en diversas industrias.”

Por ejemplo, una compañía de IA japonesa, Preferred Networks, utiliza el modelo para desarrollar un modelo específico para el cuidado de la salud, llamado Llama3-Preferred-MedSwallow-70B, que obtiene los mejores puntajes en el Examen Nacional de Japón para Médicos.

El Chang Gung Memorial Hospital (CGMH), uno de los hospitales más destacados en Taiwán, está construyendo un Servicio de Inferencia de IA (AIIS) personalizado para centralizar todas las aplicaciones de LLM dentro del sistema hospitalario. Utilizando Llama 3-Taiwan 70B, mejora la eficiencia del personal médico en la primera línea con un lenguaje médico más matizado que los pacientes pueden entender.

“Al proporcionar orientación instantánea y apropiada al contexto, las aplicaciones de IA construidas con LLMs en idiomas locales optimizan los flujos de trabajo y sirven como una herramienta de aprendizaje continuo para apoyar el desarrollo del personal y mejorar la calidad de la atención al paciente”, dijo el Dr. Changfu Kuo, director del Centro de Inteligencia Artificial en Medicina en el CGMH, sucursal de Linko. “NVIDIA NIM está simplificando el desarrollo de estas aplicaciones, permitiendo un fácil acceso y despliegue de modelos entrenados en idiomas regionales con una experiencia de ingeniería mínima.”

Pegatron, un fabricante de dispositivos electrónicos con sede en Taiwán, adoptará el microservicio Llama 3-Taiwan 70B NIM para aplicaciones internas y externas. Lo ha integrado con su Sistema de IA Agentic PEGAAi para automatizar procesos, mejorando la eficiencia en manufactura y operaciones.

Llama-3-Taiwan 70B NIM también está siendo utilizado por el fabricante petroquímico global Chang Chun Group, la empresa líder mundial en placas de circuito impreso Unimicron, la empresa de medios enfocada en tecnología TechOrange, la compañía de servicios de contratos en línea LegalSign.ai, y la startup de IA generativa APMIC. Estas empresas también están colaborando en el modelo abierto.

Creando modelos empresariales personalizados con NVIDIA AI Foundry

Si bien los modelos de IA regionales pueden proporcionar respuestas culturalmente matizadas y localizadas, las empresas aún necesitan ajustarlos para sus procesos comerciales y experiencia en el dominio.

NVIDIA AI Foundry es una plataforma y servicio que incluye modelos de fundación populares, NVIDIA NeMo para ajuste fino, y capacidad dedicada en NVIDIA DGX Cloud para ofrecer a los desarrolladores una solución de pila completa para crear un modelo de fundación personalizado empaquetado como un microservicio NIM.

Además, los desarrolladores que utilizan NVIDIA AI Foundry tienen acceso a la plataforma de software NVIDIA AI Enterprise, que proporciona seguridad, estabilidad y soporte para despliegues en producción.

NVIDIA AI Foundry proporciona a los desarrolladores las herramientas necesarias para construir y desplegar fácilmente sus propios microservicios NIM personalizados en idiomas regionales, potenciando aplicaciones de IA y asegurando resultados cultural y lingüísticamente apropiados para sus usuarios.

- A word from our sposor -

NVIDIA lanza microservicios NIM para IA generativa en Japón y Taiwán

11

26/08/2024

Artículo anterior

Tee Grizzley lanza nuevo video oficial de «Detroit» junto a 42 Dugg

Artículo siguiente

Feid y Maisak sorprenden con el video oficial de «Se me Olvida»

IHG Expande su Marca Voco con Seis Nuevos Hoteles en México

Kimpton KAFD Riyadh: Un vistazo al primer hotel de lujo en el Medio Oriente

Volkswagen revela su emocionante futuro eléctrico en IAA MOBILITY 2025