Las empresas que buscan aprovechar el poder de la IA necesitan modelos personalizados adaptados a las necesidades específicas de su industria. NVIDIA AI Foundry es un servicio que permite a las empresas utilizar datos, computación acelerada y herramientas de software para crear y desplegar modelos personalizados que pueden potenciar sus iniciativas de IA generativa.
Innovación en la industria impulsada por líderes
Los líderes del sector, como Amdocs, Capital One, Getty Images, KT, Hyundai Motor Company, SAP, ServiceNow y Snowflake, fueron de los primeros en utilizar NVIDIA AI Foundry. Estos pioneros establecieron las bases para una nueva era de innovación impulsada por IA en el software empresarial, la tecnología, las comunicaciones y los medios de comunicación.
“Las organizaciones que implementan IA pueden obtener una ventaja competitiva con modelos personalizados que incorporan conocimientos de la industria y del negocio,” comentó Jeremy Barnes, vicepresidente de Producto IA en ServiceNow. “ServiceNow utiliza NVIDIA AI Foundry para ajustar y desplegar modelos que puedan integrarse fácilmente en los flujos de trabajo existentes de los clientes.”
Los pilares de NVIDIA AI Foundry
NVIDIA AI Foundry se apoya en pilares clave como modelos fundamentales, software empresarial, computación acelerada, soporte experto y un amplio ecosistema de socios.
Su software incluye modelos fundamentales de IA de NVIDIA y de la comunidad de IA, así como la completa plataforma de software NVIDIA NeMo para acelerar el desarrollo de modelos.
La fuerza computacional de NVIDIA AI Foundry es NVIDIA DGX Cloud, una red de recursos de computación acelerada co-diseñada con las principales nubes públicas del mundo — Amazon Web Services, Google Cloud y Oracle Cloud Infrastructure. Con DGX Cloud, los clientes de AI Foundry pueden desarrollar y ajustar aplicaciones de IA generativa personalizadas con una facilidad y eficiencia sin precedentes, y escalar sus iniciativas de IA según sea necesario sin inversiones iniciales significativas en hardware. Esta flexibilidad resulta esencial para las empresas que buscan mantenerse ágiles en un mercado en rápida evolución.
Si un cliente de NVIDIA AI Foundry necesita asistencia, expertos en AI de NVIDIA están disponibles para ayudar. Los expertos de NVIDIA pueden guiar a los clientes a través de cada uno de los pasos necesarios para construir, ajustar y desplegar sus modelos con datos privados, asegurando que los modelos se alineen estrechamente con sus requisitos comerciales.
Los clientes de NVIDIA AI Foundry tienen acceso a un ecosistema global de socios que pueden ofrecer una gama completa de soporte. Accenture, Deloitte, Infosys y Wipro son algunos de los socios de NVIDIA que ofrecen servicios de consultoría de AI Foundry que abarcan el diseño, la implementación y la gestión de proyectos de transformación digital impulsados por IA. Accenture fue el primero en ofrecer su propia propuesta basada en AI Foundry para el desarrollo de modelos personalizados, el marco Accenture AI Refinery.
Además, socios de entrega de servicios como Data Monsters, Quantiphi, Slalom y SoftServe ayudan a las empresas a navegar por las complejidades de integrar la IA en sus infraestructuras de TI existentes, asegurando que las aplicaciones de IA sean escalables, seguras y alineadas con los objetivos del negocio.
Los clientes pueden desarrollar modelos de NVIDIA AI Foundry para producción utilizando plataformas AIOps y MLOps de los socios de NVIDIA, que incluyen Cleanlab, DataDog, Dataiku, Dataloop, DataRobot, Domino Data Lab, Fiddler AI, New Relic, Scale y Weights & Biases.
Los clientes pueden exportar sus modelos de AI Foundry como microservicios de inferencia NVIDIA NIM — que incluyen el modelo personalizado, motores optimizados y una API estándar — para ejecutarse en su infraestructura acelerada preferida.
Las soluciones de inferencia como NVIDIA TensorRT-LLM ofrecen mayor eficiencia para los modelos Llama 3.1 al minimizar la latencia y maximizar el rendimiento. Esto permite a las empresas generar tokens más rápidamente mientras reduce el costo total de operar los modelos en producción. Un soporte y seguridad de nivel empresarial se proporcionan a través de la suite de software NVIDIA AI Enterprise.
NVIDIA NeMo acelera y simplifica el desarrollo de modelos personalizados
Con NVIDIA NeMo integrado en AI Foundry, los desarrolladores cuentan con las herramientas necesarias para curar datos, personalizar modelos fundamentales y evaluar el rendimiento. Las tecnologías de NeMo incluyen:
- NeMo Curator es una biblioteca de curaduría de datos acelerada por GPU que mejora el rendimiento de los modelos de IA generativa al preparar conjuntos de datos a gran escala y de alta calidad para el preentrenamiento y ajuste fino.
- NeMo Customizer es un microservicio escalable de alto rendimiento que simplifica el ajuste y la alineación de LLMs para casos de uso específicos de dominio.
- NeMo Evaluator proporciona una evaluación automática de modelos de IA generativa en función de benchmarks académicos y personalizados en cualquier nube acelerada o centro de datos.
- NeMo Guardrails orquesta la gestión del diálogo, apoyando la precisión, la adecuación y la seguridad en aplicaciones inteligentes con grandes modelos de lenguaje para proporcionar salvaguardias a las aplicaciones de IA generativa.
Utilizando la plataforma NeMo en NVIDIA AI Foundry, las empresas pueden crear modelos de IA personalizados que están precisamente adaptados a sus necesidades. Esta personalización permite una mejor alineación con los objetivos estratégicos, una mayor precisión en la toma de decisiones y una eficiencia operativa mejorada. Por ejemplo, las empresas pueden desarrollar modelos que comprendan jerga específica de la industria, cumplan con normativas y se integren sin problemas con flujos de trabajo existentes.
“Como siguiente paso de nuestra asociación, SAP planeaba utilizar la plataforma NeMo de NVIDIA para ayudar a las empresas a acelerar la productividad impulsada por IA en SAP Business AI,” dijo Philipp Herzig, director de IA en SAP.
Las empresas pueden desplegar sus modelos personalizados de IA en producción con microservicios de inferencia NVIDIA NeMo Retriever NIM. Estos ayudan a los desarrolladores a obtener datos privados para generar respuestas informadas para sus aplicaciones de IA con generación aumentada por recuperación (RAG).
“Una IA segura y confiable es indispensable para las empresas que aprovechan la IA generativa, ya que la precisión en la recuperación impacta directamente la relevancia y calidad de las respuestas generadas en los sistemas RAG,” comentó Baris Gultekin, jefe de IA en Snowflake. “Snowflake Cortex AI aprovecha NeMo Retriever, un componente de NVIDIA AI Foundry, para proporcionar a las empresas respuestas fáciles, eficientes y confiables utilizando sus datos personalizados.”
Modelos personalizados impulsan la ventaja competitiva
Una de las ventajas clave de NVIDIA AI Foundry es su capacidad para abordar los desafíos únicos que enfrentan las empresas al adoptar la IA. Los modelos de IA genéricos pueden no cumplir con las necesidades comerciales específicas y los requisitos de seguridad de datos. En cambio, los modelos de IA personalizados ofrecen una flexibilidad, adaptabilidad y rendimiento superiores, lo que los hace ideales para empresas que buscan obtener una ventaja competitiva.
Descubre más sobre cómo NVIDIA AI Foundry permite a las empresas aumentar su productividad e innovación.