Leave a reply

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

NVIDIA lanza un enorme conjunto de datos para el desarrollo de inteligencia artificial física

NVIDIA ha anunciado la liberación de un vasto conjunto de datos de código abierto diseñado para facilitar a investigadores y desarrolladores la creación de robots y vehículos autónomos que interactúan con el mundo físico de manera eficiente. Este lanzamiento se realizó durante la conferencia global de inteligencia artificial, NVIDIA GTC, que tiene lugar esta semana en San José, California.

El conjunto de datos, que ha sido prevalidado para uso comercial, ayuda a acelerar el inicio de proyectos de inteligencia artificial física, que de otro modo podrían ser extremadamente difíciles de abordar sin una base de datos adecuada. Los desarrolladores pueden utilizarlo para la preentrenamiento de modelos, así como para la validación y prueba, o durante el post-entrenamiento para mejorar modelos de base mundial, agilizando así su implementación.

Datos disponibles y su evolución

El conjunto de datos inicial ya está disponible en Hugging Face y ofrece a los desarrolladores 15 terabytes de información, que incluyen más de 320,000 trayectorias para formación robótica y hasta 1,000 activos de Descripción de Escena Universal (OpenUSD), que incluyen una colección SimReady. En breve, se lanzarán datos específicos para el desarrollo de vehículos autónomos, que incluirán clips de 20 segundos representando diversos escenarios de tráfico en más de 1,000 ciudades de Estados Unidos y en una veintena de países europeos.

A lo largo del tiempo, se espera que este conjunto se expanda y se convierta en el más grande y unificado para el desarrollo de inteligencia artificial física. Los posibles usos de estos datos son vastos, desde optimizar robots para operar en entornos de almacenes hasta mejorar los vehículos autónomos en el manejo de situaciones complejas, como zonas de construcción.

Desde su lanzamiento, el conjunto de datos ha atraído la atención de instituciones académicas como el Centro Berkeley DeepDrive en la Universidad de California, Berkeley, así como el Laboratorio de Seguridad en Inteligencia Artificial de Carnegie Mellon y el Instituto de Robótica Contextual en la Universidad de California, San Diego.

El director de varios laboratorios de robótica y vehículos autónomos en UCSD, Henrik Christensen, destacó: “Con este conjunto de datos, podemos entrenar modelos de IA predictiva que ayudan a los vehículos autónomos a rastrear mejor el movimiento de usuarios vulnerables en las vías, como los peatones, mejorando así la seguridad”.

Impulsando el desarrollo de modelos de IA

El NVIDIA Physical AI Dataset puede resultar especialmente útil en escalamiento de la IA durante las fases de preentrenamiento y post-entrenamiento al ofrecer una gran diversidad de datos. La recopilación y anotación de datos que reflejen escenarios diversos y representativos de la física del mundo real es un proceso que requiere mucho tiempo y que puede representar un obstáculo para muchos desarrolladores. Principalmente, las pequeñas empresas y los investigadores académicos enfrentan grandes retos al intentar reunir datos a través de flotas de vehículos.

Esta nueva base de datos será un recurso esencial para la construcción de modelos comerciales más seguros y precisos. Los modelos robóticos de NVIDIA Isaac, por ejemplo, requieren miles de horas de grabación para el post-entrenamiento, mientras que el modelo de IA para vehículos autónomos NVIDIA DRIVE AV necesita decenas de miles de horas de datos de conducción para su desarrollo.

Además, al utilizar el NVIDIA Physical AI Dataset, los desarrolladores pueden optimizar aún más el entrenamiento de modelos con herramientas como NVIDIA NeMo Curator, que permite procesar vastas cantidades de datos de manera eficiente.

Los laboratorios de robótica en UCSD, que abarcan aplicaciones médicas y tecnología asistencial en el hogar, están planeando aplicar este conjunto de datos para desarrollar modelos de IA semántica que entiendan contextos específicos como casas, habitaciones de hoteles y hospitales. Christensen expresó su aspiración de alcanzar un nivel de entendimiento donde robots puedan realizar tareas domésticas básicas como organizar la despensa.

Las aplicaciones del conjunto de datos también se extienden al campo de vehículos autónomos, permitiendo a los investigadores simular casos especiales y condiciones climáticas desafiantes. Esto podría ser clave para entrenar modelos de conducción autónoma en situaciones poco comunes en entornos reales.

Con el NVIDIA Physical AI Dataset, se abre un nuevo camino para avanzar en la investigación y desarrollo de inteligencia artificial en diversas aplicaciones, incluyendo la seguridad en entornos urbanos y la innovación en la robótica.

- A word from our sposor -

spot_img

NVIDIA Lanza un Dataset Abierto de IA Física para Revolucionar la Robótica