El Wellcome Sanger Institute, un importante contribuyente al Proyecto Internacional del Genoma Humano, se ha orientado hacia la computación acelerada de NVIDIA para ahorrar energía mientras se salvan vidas.
Avances en la secuenciación genómica
Con una de las instalaciones de secuenciación más grandes del mundo, el instituto, ubicado en el Reino Unido, ha leído más de 48 petabases —o 48 cuatrillones de pares de bases— de secuencias de ADN y ARN para descubrir insights valiosos sobre la salud y las enfermedades. Su programa de Cáncer, Envejecimiento y Mutación Somática (CASM) secuencia y analiza decenas de miles de genomas de cáncer al año para estudiar los procesos de mutación que impulsan la formación de cáncer, así como las variaciones genéticas que determinan la efectividad del tratamiento.
Reducción del tiempo de análisis y consumo energético
Para abordar iniciativas a gran escala, el Sanger Institute está explorando el uso de un sistema NVIDIA DGX junto con NVIDIA Parabricks, un conjunto de software escalable para análisis genómico que utiliza la computación acelerada para procesar datos en minutos. “El Sanger Institute maneja cientos de miles de muestras somáticas anualmente”, afirmó Jingwei Wang, desarrollador principal de software para CASM en el Wellcome Sanger Institute. “La computación acelerada de NVIDIA y Parabricks nos ahorrarán un tiempo, costo y energía considerable al analizar muestras, y estamos entusiasmados por explorar arquitecturas avanzadas de NVIDIA, como NVIDIA Grace y Grace Hopper, para un rendimiento y eficiencia aún mayores”.
El Sanger Institute desarrolla modelos de alta capacidad de procesamiento de muestras de cáncer para pantallas funcionales a nivel genómico y pruebas de fármacos. La computación acelerada de NVIDIA y el software reducen drásticamente el tiempo de análisis y el consumo de energía por genoma. Para acelerar el análisis genómico con Burrows-Wheeler Aligner (BWA), un paquete de software para mapear secuencias de ADN contra un gran genoma de referencia, Sanger utiliza su flujo de trabajo propietario CaVEMan corriendo en CPUs y está utilizando Parabricks en GPUs de NVIDIA.
El instituto redujo el tiempo de ejecución en 1.6x, los costos en 24x y el consumo de energía hasta en 42x al utilizar un sistema NVIDIA DGX en comparación con 128 servidores CPU de doble zócalo. Aproximadamente 125 millones de horas de CPU se consumen por cada 10,000 genomas secuenciados anualmente por el instituto. Esto significa que el Sanger Institute podría, cada año, ahorrar un millón de dólares y 1,000 megavatios-hora al cambiar a BWA con Parabricks en GPUs. Esa cantidad de energía es equivalente a la necesaria para abastecer a un hogar estadounidense promedio durante un siglo.
Colaboración con líderes de la industria
El laboratorio de secuenciación acelerado por NVIDIA del Sanger Institute puede considerarse una fábrica de inteligencia artificial, donde los datos ingresan y la inteligencia sale. Estas fábricas de IA son centros de datos de próxima generación que albergan plataformas avanzadas de computación acelerada para las tareas más intensivas en recursos computacionales.
Mientras explora preguntas científicas significativas para descubrir nuevos genes del cáncer y procesos de mutación, el Sanger Institute está mejorando la eficiencia operativa y energética al utilizar la infraestructura de NVIDIA para su fábrica de IA. Además, empresas y organizaciones que construyen fábricas de IA están participando en colaboraciones entre industrias con líderes como Schneider Electric, una compañía de gestión de energía y automatización, para optimizar el diseño de centros de datos para ejecutar cargas de trabajo exigentes de la manera más eficiente en energía posible.
El Sanger Institute está colaborando con Schneider Electric para minimizar el tiempo de inactividad de los centros de datos y equipar el centro de datos del laboratorio de secuenciación de ADN con sistemas de alimentación ininterrumpida y equipos de refrigeración, entre otras tecnologías esenciales para reducir el consumo de energía. En la conferencia de NVIDIA GTC, Schneider Electric anunció que está ayudando a organizaciones de diversas industrias a optimizar la infraestructura al lanzar diseños de referencia para centros de datos de IA adaptados para clústeres de computación acelerada de NVIDIA.
Los diseños de referencia —construidos para procesamiento de datos, simulación de ingeniería, automatización del diseño electrónico, diseño asistido por computadora para fármacos y generación de IA— se enfocan en la distribución de alta potencia, sistemas de refrigeración líquida y otros aspectos de centros de datos escalables, de alto rendimiento y sostenibles. En un panel de la Semana Climática de NYC, los representantes de Sanger, Schneider Electric y NVIDIA hablarán sobre su trabajo.