Los modelos de generación de imágenes, un popular subconjunto de IA generativa, pueden analizar y comprender el lenguaje escrito para luego traducir palabras en imágenes en prácticamente cualquier estilo. Representando lo más avanzado en generación de imágenes, una nueva serie de modelos de Black Forest Labs, ahora disponibles para probar en PC y estaciones de trabajo, funcionan más rápido en GeForce RTX y NVIDIA RTX GPUs.
Capacidades Fluxible
FLUX.1 AI es un conjunto de modelos de generación de texto a imagen desarrollado por Black Forest Labs. Los modelos están construidos sobre la arquitectura de transformador de difusión (DiT), lo que permite a los modelos con un alto número de parámetros mantener la eficiencia. Los modelos de Flux están entrenados con 12 mil millones de parámetros para la generación de imágenes de alta calidad.
Los modelos DiT son eficientes y requieren un alto poder computacional, siendo esencial el uso de GPUs NVIDIA RTX para manejar estos nuevos modelos, los más grandes de los cuales no podían funcionar en GPUs que no fueran RTX sin ajustes significativos. Los modelos Flux ahora soportan el kit de desarrollo de software NVIDIA TensorRT, que mejora su rendimiento hasta en un 20%. Los usuarios pueden probar Flux y otros modelos con TensorRT en ComfyUI.
Atractivo de Flux
FLUX.1 sobresale al generar imágenes de alta calidad y diversidad con una excepcional adherencia a las instrucciones, lo que se refiere a cuán precisamente la IA interpreta y ejecuta las órdenes. Una alta adherencia a las instrucciones significa que la imagen generada coincide estrechamente con los elementos, estilo y atmósfera descritos en el texto. Una baja adherencia resulta en imágenes que pueden desviarse parcial o completamente de las instrucciones proporcionadas.
FLUX.1 es reconocido por su capacidad para representar de manera precisa la anatomía humana, incluso en características complejas y desafiantes como manos y rostros. FLUX.1 también mejora significativamente la generación de texto legible dentro de las imágenes, abordando otro desafío común en los modelos de texto a imagen. Esto hace que los modelos FLUX.1 sean adecuados para aplicaciones que requieren representación precisa del texto, como materiales promocionales y portadas de libros.
FLUX.AI está disponible en tres variantes, ofreciendo a los usuarios opciones que se ajustan mejor a sus flujos de trabajo sin sacrificar calidad:
- FLUX.1 pro: Calidad de última generación para usuarios empresariales; accesible a través de una interfaz de programación de aplicaciones.
- FLUX.1 dev: Una versión destilada y gratuita de FLUX.1 pro que aún proporciona alta calidad.
- FLUX.1 schnell: El modelo más rápido, ideal para desarrollo local y uso personal; tiene una licencia permisiva Apache 2.0.
Los modelos dev y schnell son de código abierto, y Black Forest Labs proporciona acceso a sus pesos en la popular plataforma Hugging Face. Esto fomenta la innovación y colaboración dentro de la comunidad de generación de imágenes al permitir que investigadores y desarrolladores puedan construir y mejorar los modelos.
Adopción por parte de la comunidad
Las variantes dev y schnell de los modelos Flux fueron descargadas más de 2 millones de veces en HuggingFace en menos de tres semanas desde su lanzamiento. Los usuarios han elogiado a FLUX.1 por su capacidad para producir imágenes visualmente impactantes con un detalle y realismo excepcionales, así como por procesar instrucciones complejas sin requerir ajustes extensos de parámetros.
Comienza a usarlo
Los usuarios pueden acceder a FLUX.1 mediante páginas comunitarias populares como ComfyUI. La wiki de ComfyUI incluye instrucciones paso a paso para comenzar. Muchos creadores de YouTube también ofrecen tutoriales en video sobre los modelos Flux. Comparte tus imágenes generadas en redes sociales utilizando el hashtag #fluxRTX para tener la oportunidad de ser destacado en los canales de NVIDIA AI.
La IA generativa está transformando los videojuegos, videoconferencias y experiencias interactivas de todo tipo.