Qwen-VLo: así es el nuevo modelo de IA de Alibaba para crear y editar imágenes

Última actualización: 30 de junio de 2025
  • Qwen-VLo es el nuevo modelo multimodal de inteligencia artificial de Alibaba capaz de generar y modificar imágenes a partir de texto.
  • Permite visualizar en tiempo real el proceso de creación de imágenes mediante una técnica de generación progresiva.
  • El modelo soporta múltiples idiomas y puede aplicar diversos estilos, modificar fondos o detalles y adaptarse a las peticiones del usuario.
  • Qwen-VLo compite con modelos internacionales y nacionales, destacando en eficiencia y disponibilidad para distintos dispositivos.

Modelo de IA Qwen-VLo de Alibaba

La llegada de Qwen-VLo marca un nuevo paso en la apuesta de Alibaba por la inteligencia artificial. El gigante tecnológico chino ha anunciado un modelo de IA capaz de producir y modificar imágenes partiendo de descripciones escritas o de archivos visuales, brindando más opciones creativas tanto para usuarios individuales como para empresas.

Esta nueva solución integra capacidades avanzadas para la comprensión y generación multimodal, abarcando no solo texto e imágenes, sino también audio y vídeo. Con su lanzamiento, Alibaba busca posicionarse frente a pesos pesados del sector, aportando una alternativa que destaca por su técnica de generación progresiva. Esta innovación permite a los usuarios observar, en tiempo real, cómo se da forma a una imagen: primero se dibujan las líneas básicas, después se añaden colores y, finalmente, se incorporan detalles y texturas.

Cómo funciona Qwen-VLo y qué lo diferencia de otras IAs

Funcionamiento de Qwen-VLo de Alibaba

La particularidad de Qwen-VLo reside en su enfoque para crear imágenes desde cero o editar fotos existentes. El usuario puede solicitar, por ejemplo, que la IA genere una ilustración de un animal o que transforme una imagen ya existente con instrucciones específicas, como añadir nuevos elementos o cambiar su estilo visual a lo Pixar o Ghibli. Gracias a la generación progresiva, este proceso se puede observar paso a paso, lo que aporta mayor control y claridad sobre el resultado final.

  Google Project Astra: El asistente de IA que lo ve todo

En comparación con otras herramientas del mercado como DALL-E o Stable Diffusion, que utilizan técnicas de difusión basadas en ruido aleatorio, Qwen-VLo muestra de forma transparente cómo va construyendo la imagen. De izquierda a derecha y de arriba abajo, la imagen va evolucionando, lo que permite modificar detalles durante la creación sin necesidad de reiniciar todo el proceso. Esta flexibilidad aumenta las posibilidades de personalización y edición creativa.

Otra ventaja destacada es la amplia compatibilidad lingüística del modelo. Qwen-VLo permite interactuar en varios idiomas, entre ellos español, inglés y chino, facilitando así el acceso a usuarios de diferentes regiones y eliminando barreras idiomáticas. Alibaba afirma que su IA es capaz de captar instrucciones complejas y entregar imágenes acordes a las expectativas, adaptándose a las preferencias de cada usuario.

Más allá de la mera generación de imágenes, la IA permite cambiar fondos, alterar el estilo visual, añadir o quitar elementos y transferir estilos artísticos. Todo ello mediante comandos en lenguaje natural, lo que simplifica su uso tanto para entusiastas como para profesionales del diseño.

Qwen-VLo frente al auge de la inteligencia artificial multimodal

Alibaba ha redoblado su apuesta por la IA en los últimos tiempos. La actualización de su serie Qwen pretende mantenerse al ritmo de una competencia feroz, tanto dentro como fuera de China. Firmas como OpenAI, con sus famosos sistemas de IA, y competidores locales como DeepSeek, han impulsado el desarrollo de modelos cada vez más potentes y asequibles.

Qwen-VLo forma parte de una estrategia más amplia para acercar la IA de alto rendimiento y bajo coste a dispositivos variados, desde teléfonos móviles hasta portátiles. La integración de estas capacidades en aplicaciones propias, como Quark, refuerza la posición de Alibaba en el sector y amplía el abanico de servicios inteligentes para usuarios y empresas.

  Cómo usar DeepSeek R1 en español: Guía completa y gratuita

En el contexto global, Alibaba busca diferenciarse ofreciendo un motor creativo que, además de generar imágenes, pueda entender y procesar información visual compleja, como la identificación y manipulación de objetos dentro de una escena o la combinación de múltiples fuentes de entrada.

Actualmente, Qwen-VLo se encuentra en fase de vista previa. Esto significa que el modelo todavía puede mostrar limitaciones, especialmente en imágenes hiperrealistas, que pueden presentar algunos detalles poco definidos. Sin embargo, la empresa asegura que seguirá ajustando su funcionamiento a partir de la experiencia de los usuarios y de su propio aprendizaje automático, con el objetivo de mejorar la precisión y versatilidad del sistema.

Este avance representa otro hito importante en el desarrollo de la inteligencia artificial aplicada a la creatividad visual, con nuevas capacidades para crear y modificar imágenes de forma interactiva, en un enfoque progresivo y compatible con varios idiomas, consolidándose como una de las propuestas más innovadoras en este ámbito.

janus pro-2
Artículo relacionado:
Janus Pro: el modelo de IA de DeepSeek que revoluciona la generación de imágenes