Las tecnologías nativas de la nube han adquirido una gran importancia para que los desarrolladores creen e implementen aplicaciones escalables en dinámicos entornos en la nube. Esta semana, en KubeCon + CloudNativeCon Norteamérica 2024, una de las conferencias más concurridas centradas en tecnologías de código abierto, Chris Lamb, vice presidente de plataformas de software de computación en NVIDIA, ofreció una conferencia que delineaba los beneficios del código abierto para desarrolladores y empresas; además, NVIDIA ofreció cerca de 20 sesiones interactivas con ingenieros y expertos.
Fomentando ecosistemas nativos de la nube
La Cloud Native Computing Foundation (CNCF), parte de la Fundación Linux y anfitriona de KubeCon, se encuentra en la vanguardia de la promoción de un robusto ecosistema que fomente la colaboración entre líderes de la industria, desarrolladores y usuarios finales. Como miembro de la CNCF desde 2018, NVIDIA ha estado trabajando en la comunidad de desarrolladores para contribuir y sostener proyectos de código abierto nativos de la nube. Nuestro software de código abierto y más de 750 proyectos de código abierto liderados por NVIDIA ayudan a democratizar el acceso a herramientas que aceleran el desarrollo e innovación en inteligencia artificial.
Desarrollo de Kubernetes y recursos dinámicos
NVIDIA ha obtenido beneficios de los numerosos proyectos de código abierto bajo la CNCF y ha realizado contribuciones a docenas de ellos durante la última década. Estas acciones ayudan a los desarrolladores a construir aplicaciones y arquitecturas de microservicios alineadas con la gestión de cargas de trabajo de inteligencia artificial y aprendizaje automático.
Kubernetes, la piedra angular de la computación nativa de la nube, ha comenzado a transformarse para enfrentar los desafíos de las cargas de trabajo de inteligencia artificial y aprendizaje automático. Con la adopción creciente de modelos de lenguaje grande y otras tecnologías de inteligencia artificial por parte de las organizaciones, se vuelve fundamental contar con una infraestructura sólida.
NVIDIA ha estado colaborando estrechamente con la comunidad de Kubernetes para abordar estos desafíos. Esto incluye:
- El trabajo en la asignación dinámica de recursos (DRA), que permite una gestión de recursos más flexible y matizada. Esto es esencial para las cargas de trabajo de IA, que a menudo requieren hardware especializado. Los ingenieros de NVIDIA desempeñaron un papel clave en el diseño e implementación de esta función.
- Encabezar esfuerzos en KubeVirt, un proyecto de código abierto que extiende Kubernetes para gestionar máquinas virtuales junto a contenedores. Esto proporciona un enfoque unificado y nativo de la nube para gestionar infraestructuras híbridas.
- Desarrollar el NVIDIA GPU Operator, que automatiza la gestión del ciclo de vida de las GPU de NVIDIA en clústeres de Kubernetes. Este software simplifica el despliegue y la configuración de controladores de GPU, herramientas de tiempo de ejecución y monitoreo, permitiendo a las organizaciones centrarse en la construcción de aplicaciones de IA en lugar de gestionar la infraestructura.
Compromiso con la comunidad
Los esfuerzos de código abierto de NVIDIA se extienden más allá de Kubernetes hacia otros proyectos de la CNCF:
- NVIDIA es un contribuyente clave a Kubeflow, un conjunto integral de herramientas que facilita a los científicos de datos e ingenieros construir y gestionar sistemas de ML en Kubernetes. Kubeflow reduce la complejidad en la gestión de infraestructuras y permite a los usuarios centrarse en el desarrollo y mejora de modelos de ML.
- NVIDIA ha contribuido al desarrollo de CNAO, que gestiona el ciclo de vida de redes de host en clústeres de Kubernetes.
- NVIDIA también ha añadido al Node Health Check, que proporciona alta disponibilidad para máquinas virtuales.
NVIDIA ha colaborado en proyectos que abordan la observabilidad, el rendimiento y otras áreas importantes de la computación nativa de la nube, como:
- Prometheus: Mejora de las capacidades de monitoreo y alerta.
- Envoy: Mejora del rendimiento del proxy distribuido.
- OpenTelemetry: Avance de la observabilidad en sistemas distribuidos complejos.
- Argo: Facilitación de flujos de trabajo nativos de Kubernetes y gestión de aplicaciones.
NVIDIA interactúa con el ecosistema nativo de la nube participando en eventos y actividades de la CNCF, incluyendo:
- Colaboración con proveedores de servicios en la nube para ayudarles a incorporar nuevas cargas de trabajo.
- Participación en grupos de interés y grupos de trabajo de la CNCF sobre discusiones de IA.
- Participación en eventos de la industria como KubeCon + CloudNativeCon, donde comparte ideas sobre la aceleración GPU para cargas de trabajo de IA.
- Colaboración con proyectos adyacentes a la CNCF en la Fundación Linux, así como con muchos socios.
Esto se traduce en beneficios extendidos para los desarrolladores, como la mejora de la eficiencia en la gestión de cargas de trabajo de IA y ML; la escalabilidad y rendimiento mejorados de las aplicaciones nativas de la nube; una mejor utilización de recursos, lo que puede conducir a ahorros de costos; y una simplificación en el despliegue y la gestión de infraestructuras complejas de IA.
A medida que la inteligencia artificial y el aprendizaje automático continúan transformando las industrias, NVIDIA ayuda a avanzar en tecnologías nativas de la nube para soportar cargas de trabajo computacionales intensivas. Esto incluye facilitar la migración de aplicaciones heredadas y apoyar el desarrollo de nuevas.
Estas contribuciones a la comunidad de código abierto ayudan a los desarrolladores a aprovechar todo el potencial de las tecnologías de IA y fortalecen a Kubernetes y otros proyectos de la CNCF como las herramientas de elección para las cargas de trabajo de computación de IA.