Un comité de expertos de los principales centros médicos e institutos de investigación de EE. UU. está utilizando el aprendizaje federado potenciado por NVIDIA para evaluar el impacto del aprendizaje federado y la anotación asistida por IA en el entrenamiento de modelos de IA para la segmentación de tumores.
Desarrollo del Aprendizaje Federado
El aprendizaje federado es una técnica para desarrollar modelos de IA más precisos y generalizables, entrenados en datos de diversas fuentes sin comprometer la seguridad o privacidad de los datos. Permite a varias organizaciones colaborar en el desarrollo de un modelo de IA sin que los datos sensibles salgan de sus servidores.
“Debido a las restricciones de privacidad y gestión de datos, se está volviendo cada vez más complicado compartir datos de un sitio a otro y agregarlos en un solo lugar, y la IA en imágenes se está desarrollando más rápido de lo que los institutos de investigación pueden establecer contratos de compartir datos”, comentó John Garrett, profesor asociado de radiología en la Universidad de Wisconsin-Madison. “Adoptar el aprendizaje federado para construir y probar modelos en múltiples sitios simultáneamente es la única forma, hablando prácticamente, de mantener el ritmo. Es una herramienta indispensable”.
Garrett forma parte del Subcomité de Herramientas de Aprendizaje Automático y Investigación de la Sociedad para la Informática de Imágenes y Medicina (SIIM), un grupo de clínicos, investigadores e ingenieros que busca avanzar en el desarrollo y aplicación de la IA para la imagenología médica. NVIDIA es miembro de SIIM y ha estado colaborando con el comité en proyectos de aprendizaje federado desde 2019.
“Las técnicas de aprendizaje federado permiten una mayor privacidad y seguridad de los datos en cumplimiento con regulaciones de privacidad como GDPR, HIPAA y otras”, dijo el presidente del comité, Khaled Younis. “Además, observamos una mejora en la precisión y generalización del modelo”.
Para apoyar su último proyecto, el equipo —que incluye colaboradores de Case Western, la Universidad de Georgetown, la Clínica Mayo, la Universidad de California, San Diego, la Universidad de Florida y la Universidad de Vanderbilt— utilizó NVIDIA FLARE (NVFlare), un marco de trabajo de código abierto que incluye características de seguridad robustas, técnicas avanzadas de protección de la privacidad y una arquitectura de sistema flexible.
A través del Programa de Subvenciones Académicas de NVIDIA, el comité recibió cuatro NVIDIA RTX A5000 GPUs, que se distribuyeron entre los institutos de investigación participantes para establecer sus estaciones de trabajo para el aprendizaje federado. Colaboradores adicionales usaron GPUs de NVIDIA en la nube y en servidores locales, destacando la flexibilidad de NVFLARE.
Descifrando el Código del Aprendizaje Federado
Cada uno de los seis centros médicos participantes proporcionó datos de aproximadamente 50 estudios de imagenología médica para el proyecto, enfocado en el carcinoma de células renales, un tipo de cáncer de riñón.
“La idea del aprendizaje federado es que durante el entrenamiento intercambiamos el modelo en lugar de intercambiar los datos”, explicó Yuankai Huo, profesor asistente de ciencias de la computación y director del laboratorio de Representación y Aprendizaje de Datos Biomédicos en la Universidad de Vanderbilt.
En un marco de aprendizaje federado, un modelo global inicial transmite parámetros del modelo a los servidores de los clientes. Cada servidor utiliza esos parámetros para establecer una versión local del modelo que se entrena con los datos propietarios de la organización. Luego, los parámetros actualizados de cada uno de los modelos locales se envían de vuelta al modelo global, donde se agregan para producir un nuevo modelo global. El ciclo se repite hasta que las predicciones del modelo no mejoran con cada ronda de entrenamiento.
El grupo experimentó con arquitecturas de modelos y hiperparámetros para optimizar la velocidad de entrenamiento, la precisión y la cantidad de estudios de imagen requeridos para entrenar el modelo al nivel de precisión deseado.
Anotación Asistida por IA con NVIDIA MONAI
En la primera fase del proyecto, los datos de entrenamiento utilizados para el modelo fueron etiquetados manualmente. Para la siguiente fase, el equipo está utilizando NVIDIA MONAI para la anotación asistida por IA, con el fin de evaluar cómo el rendimiento del modelo difiere con los datos de entrenamiento segmentados con la ayuda de IA en comparación con los métodos de anotación tradicionales.
“El mayor desafío con las actividades de aprendizaje federado es que generalmente los datos en diferentes sitios no son uniformes. Las personas utilizan diferentes equipos de imagenología, tienen diferentes protocolos y simplemente etiquetan sus datos de manera diferente”, afirmó Garrett. “Al entrenar el modelo de aprendizaje federado una segunda vez con la adición de MONAI, nuestro objetivo es determinar si eso mejora la precisión general de la anotación”.
El equipo está utilizando MONAI Label, una herramienta de etiquetado de imágenes que permite a los usuarios desarrollar aplicaciones personalizadas de anotación de IA, reduciendo el tiempo y esfuerzo necesarios para crear nuevos conjuntos de datos. Los expertos validarán y refinarán las segmentaciones generadas por IA antes de que sean utilizadas para el entrenamiento del modelo.
Los datos para ambas fases, la manual y la asistida por IA, se alojan en Flywheel, una plataforma líder en datos de imagenología médica e IA que ha integrado NVIDIA MONAI en sus ofertas.
Una vez que el proyecto esté completo, el equipo planeaba publicar su metodología, conjuntos de datos anotados y un modelo preentrenado para apoyar trabajos futuros.
“Estamos interesados en no solo explorar estas herramientas”, dijo Garrett, “sino también en publicar nuestro trabajo para que otros puedan aprender y utilizar estas herramientas en todo el campo médico”.
Solicita una Subvención Académica de NVIDIA
El Programa de Subvenciones Académicas de NVIDIA avanza la investigación académica al proporcionar acceso y recursos informáticos de clase mundial a los investigadores. Las solicitudes están abiertas para miembros de facultad a tiempo completo en instituciones académicas acreditadas que estén utilizando tecnología de NVIDIA para acelerar proyectos en simulación y modelado, inteligencia artificial generativa y modelos de lenguaje de gran tamaño.
Los futuros ciclos de solicitudes se enfocarán en proyectos en ciencia de datos, gráficos y visión, e IA en el borde, incluyendo el aprendizaje federado.