La próxima gran oportunidad en la inteligencia artificial está a la vista. En la actualidad, hay más de 1.5 mil millones de cámaras empresariales desplegadas en todo el mundo, generando aproximadamente 7 billones de horas de video al año. Sin embargo, solo se analiza una fracción de este contenido. Se estima que menos del 1% de los videos de cámaras industriales son visualizados en vivo por humanos, lo que significa que incidentes operativos importantes pueden pasar desapercibidos.
El costo de la inacción
Esto tiene un alto costo. Por ejemplo, los fabricantes pierden billones de dólares anualmente debido a la mala calidad de los productos o defectos que podrían haber sido detectados o incluso predichos antes, utilizando agentes de IA capaces de percibir y analizar para ayudar a los humanos a tomar decisiones.
Agentes de IA interactivos
Los agentes de IA interactivos con capacidades de percepción visual pueden actuar como analistas de video permanentes, ayudando a las fábricas a operar de manera más eficiente, mejorar la seguridad de los trabajadores, mantener el tráfico en movimiento e incluso optimizar el rendimiento de los atletas. Para acelerar la creación de estos agentes, NVIDIA anunció el acceso anticipado a una nueva versión del NVIDIA AI Blueprint para la búsqueda y resumido de videos. Este marco, respaldado por modelos de lenguaje de visión y de lenguaje grande de NVIDIA, proporciona a los desarrolladores las herramientas necesarias para construir y desplegar agentes de IA que pueden analizar grandes volúmenes de contenido en video e imagen.
Integración y beneficios tecnológicos
El diseño se integra con la plataforma de software NVIDIA AI Enterprise, que incluye microservicios para modelos de visión y lenguaje, así como marcos de IA avanzados para generación aumentada de datos, permitiendo un procesamiento por lotes de video 30 veces más rápido que verlo en tiempo real. Además, el blueprint cuenta con características de IA como razonamiento encadenado, planificación de tareas y llamada a herramientas, que pueden ayudar a los desarrolladores a crear agentes visuales potentes y diversos para abordar una variedad de problemas.
Aplicaciones en negocios industriales
Los agentes de IA con habilidades de percepción y análisis visual pueden ajustarse para ayudar a las empresas en operaciones industriales mediante:
-
Incremento de la productividad y reducción de desperdicios: Garantizando que se sigan procedimientos operativos estándar durante procesos complejos como el ensamblaje de productos.
-
Mejor gestión de activos: Optimizando el almacenamiento de inventarios en almacenes mediante estimaciones volumétricas en 3D.
-
Mejora de la seguridad: Generando automáticamente informes de incidentes y resúmenes que procesan grandes volúmenes de video.
-
Prevención de accidentes y problemas de producción: Identificando actividades atípicas para mitigar rápidamente riesgos operativos y de seguridad.
- Aprendizaje del pasado: Buscando en archivos de video de operaciones información relevante que pueda ser utilizada para resolver problemas o crear nuevos procesos.
Analistas de video para deportes y entretenimiento
Otra industria donde los agentes de IA para análisis de video pueden marcar la diferencia es en el deporte, un mercado de 500 mil millones de dólares a nivel mundial. Entrenadores, equipos y ligas dependen del análisis de video para evaluar y mejorar el rendimiento de los jugadores, priorizar la seguridad y aumentar la participación de los aficionados mediante plataformas de análisis de jugadores y visualización de datos.
Durante su keynote de apertura de CES, Jensen Huang, fundador y CEO de NVIDIA, demostró un agente de análisis de video que evaluó las habilidades de lanzamiento de un jugador de béisbol amateur en comparación con un profesional. Mediante el video capturado del primer lanzamiento ceremonial que Huang hizo para los San Francisco Giants, el agente de análisis de video pudo sugerir áreas de mejora.
La industria de medios y entretenimiento, valorada en 3 billones de dólares, también se beneficiará de estos agentes, permitiendo la creación de contenido más inteligente y adaptado a las preferencias individuales de los espectadores.
Adopción y disponibilidad global
Socios de todo el mundo están integrando el blueprint para construir agentes de IA para el análisis de video en sus propios flujos de trabajo de desarrollo, incluyendo empresas como Accenture, Deloitte e Infosys.