- ChatGPT Images estrena un nuevo modelo más rápido y preciso, capaz de seguir mejor las instrucciones del usuario.
- La actualización se centra en la edición avanzada, los estilos predefinidos y las transformaciones creativas a partir de fotos reales.
- El sistema mejora el texto dentro de las imágenes, la coherencia en las ediciones y reduce el aspecto "amarillento" de versiones anteriores.
- La nueva versión se integra en ChatGPT y está disponible globalmente para cuentas gratuitas y de pago.

Hace no tanto, medio internet se puso a jugar a ser director de películas de animación al estilo Studio Ghibli con la ayuda de ChatGPT. Las redes sociales se llenaron de escenas oníricas, personajes entrañables y fondos con ese toque japonés tan reconocible. Detrás de aquella fiebre estaba el modelo de generación de imágenes de OpenAI integrado en ChatGPT, que convirtió a cualquiera en pseudoilustrador sin necesidad de saber dibujar.
Sin embargo, el mundo de la inteligencia artificial generativa va tan acelerado que aquella moda duró dos telediarios. Poco después, la conversación se desplazó hacia otras propuestas como Nano Banana Pro y los nuevos modelos de Google, capaces de producir imágenes tan realistas que costaba distinguirlas de una foto, o herramientas como MidJourney que convierten texto en imágenes. Ante ese panorama, OpenAI no se ha quedado quieta: ha presentado una nueva versión de ChatGPT Images que llega para plantar cara, con más velocidad, mejor comprensión de instrucciones y un salto importante en edición avanzada.
Qué es la nueva versión de ChatGPT Images y qué la hace diferente
OpenAI ha anunciado oficialmente la nueva generación de ChatGPT Images coincidiendo con el lanzamiento de GPT-5.2, su modelo de lenguaje más reciente. Ambos movimientos forman parte de la misma estrategia: responder de forma directa a la ofensiva de Google con modelos como Gemini 3 Pro y demostrar que siguen compitiendo al máximo nivel en texto e imagen.
En esta nueva etapa, ChatGPT Images funciona sobre el modelo GPT Image 1.5, diseñado específicamente para generar y editar imágenes con más control y más rapidez que en versiones anteriores. La propia compañía asegura que ahora el sistema es capaz de producir resultados hasta cuatro veces más rápido, algo que se nota especialmente en el móvil, donde antes era habitual que el proceso se interrumpiese si el usuario cambiaba de aplicación a mitad de la generación.
La comparación con el modelo anterior es clara: donde antes había tiempos de espera largos y cierta sensación de lentitud, ahora la experiencia es más parecida a un estudio digital en tiempo real. En las pruebas que se han ido compartiendo, las imágenes aparecen de forma mucho más fluida, con menos bloqueos y sin esa impresión de que la app se ha quedado colgada mientras el servidor calcula.
Además de la velocidad, OpenAI sitúa la precisión y el respeto por las instrucciones del usuario como el gran salto cualitativo. El objetivo es que ChatGPT Images deje de ser un generador “caprichoso” que interpreta a su manera los prompts y pase a comportarse como una herramienta más fiable para flujos creativos y profesionales; por eso es clave saber cómo escribir prompts para diseño gráfico.

Edición avanzada: cambiar solo lo que quieres sin destrozar la imagen
Uno de los talones de Aquiles tradicionales de los generadores de imágenes ha sido la edición localizada de elementos concretos. Si querías retocar una chaqueta, cambiar el fondo o ajustar la iluminación, a menudo el modelo “reimaginaba” toda la escena y terminabas con un resultado completamente distinto a lo que pretendías.
La nueva versión de ChatGPT Images se centra precisamente en resolver ese problema. OpenAI afirma que ahora el sistema es capaz de modificar solo las partes que el usuario indique, manteniendo intacto el resto de la imagen. Esto incluye desde objetos específicos (un coche, una señal de tráfico, una prenda de ropa) hasta aspectos globales como la luz, el encuadre o la composición general, pero sin perder la coherencia del conjunto.
La compañía explica que el modelo ha sido entrenado para:
- Modificar únicamente los elementos solicitados, respetando al máximo el contexto original.
- Mantener el resto de la imagen sin cambios, evitando que aparezcan detalles nuevos no deseados.
- Conservar la coherencia entre la imagen original, las salidas generadas y las ediciones sucesivas que vayas aplicando.
Esto se nota sobre todo en los flujos de trabajo iterativos, donde vas haciendo pequeños ajustes en varias rondas. En otros modelos, tras unas cuantas ediciones la imagen empezaba a deformarse o a perder calidad: caras que cambiaban, fondos que se volvían irreconocibles, detalles que desaparecían. Con ChatGPT Images, la idea es que puedas retocar, revertir cambios, afinar detalles y combinar versiones sin que el resultado final se vaya degradando.
Un buen ejemplo es el tipo de prompt que OpenAI ha mostrado: partir de una misma escena urbana, por ejemplo un paisaje de Los Ángeles con una persona en patinete, y pedir cambios muy concretos: “haz que su camisa sea roja, su gorra amarilla, la señal de límite de velocidad marque 15 y convierte el camión en un camión de bomberos”. El modelo, en vez de regenerar todo desde cero, ajusta solo esos detalles, manteniendo el encuadre, la atmósfera y el estilo fotográfico original.

Un “estudio creativo de bolsillo” para crear y reimaginar escenas
OpenAI describe la nueva versión como una especie de estudio creativo portátil integrado directamente en ChatGPT. La idea es que, tanto si empiezas desde cero como si trabajas a partir de una foto real, puedas dirigir el resultado de forma mucho más fina, casi como lo harías con un equipo de diseño pero dentro de una conversación.
El modelo destaca especialmente en tareas como añadir o eliminar elementos de una escena. Por ejemplo, puedes pedir que desaparezca un objeto que estorba, insertar un personaje adicional, sumar un coche aparcado al fondo o quitar personas de un paisaje sin dejar rastros evidentes de edición. El sistema se encarga de reconstruir el fondo y ajustar sombras, reflejos y luz para que la manipulación no se note.
También se ha potenciado la capacidad de combinar y fusionar imágenes. Esto permite, por ejemplo, coger la foto de una persona y otra de un entorno completamente distinto y generar una escena creíble que mezcle ambos elementos. O unir sujetos de varias fotografías independientes en una misma composición coherente, algo muy útil para hacer montajes “imposibles” pero verosímiles.
Otra función relevante es la opción de reorganizar composiciones completas. A través de un prompt, puedes pedir que se cambien de sitio ciertos elementos del encuadre, que la cámara se acerque o se aleje, que el plano se convierta en un detalle o en una panorámica, o que la escena se reinterprete en otro momento del día. Todo ello intentado preservar las características visuales que hacían reconocible la imagen de partida.
Por último, se ha afinado bastante la transposición de estilos y estructuras. Esto significa que puedes aplicar la composición, paleta de color o iluminación de una foto de referencia a otra imagen, manteniendo la estructura de la escena original pero con otra atmósfera. Es el tipo de operación que permite pasar de una escena realista a una estética cinematográfica de los años 2000, o a una fotografía callejera documental de finales de los 90 con película de 35 mm y grano marcado.
Transformaciones creativas con tus propias fotos
Un área donde el nuevo ChatGPT Images destaca especialmente es en las transformaciones creativas a partir de imágenes reales. Basta con subir una foto tuya (o de otra persona para la que tengas permiso) y acompañarla de un prompt relativamente sencillo para obtener en cuestión de segundos resultados que, en muchos casos, resultan sorprendentemente creíbles.
Esta idea no es del todo nueva: modelos como Nano Banana ya habían puesto mucho énfasis en esta capacidad, permitiendo convertir retratos reales en campañas publicitarias, pósters o escenas extremadamente estilizadas. Lo que hace ahora OpenAI es llevar ese enfoque directamente a ChatGPT, con un sistema que entiende mejor la intención del usuario y conserva más fielmente los rasgos del sujeto original.
Entre los ejemplos más llamativos están promts del tipo: “Crea una imagen de este hombre, pero en Times Square en invierno de 2025”. El modelo adapta la ropa, el entorno, la iluminación nocturna y los elementos urbanos para que encajen con la estética de Nueva York en esa época del año, pero manteniendo el gesto, la postura general y los rasgos faciales del sujeto de origen, y permite incluso convertir la imagen en formatos como stickers de WhatsApp.
Otro uso habitual es el de “viajar” visualmente: puedes pedir algo como “Sitúa a esta persona a cuerpo completo en una ciudad japonesa durante una noche lluviosa, con neones, reflejos en el suelo y estética cyberpunk”. El sistema genera una escena con luces de neón, charcos en el asfalto y edificios típicos, integrando a la persona dentro de ese universo como si estuviera realmente allí, sin que parezca un simple recorte pegado sobre un fondo.
Para quienes prefieren algo más fantasioso, se pueden hacer transformaciones estilo “Convierte a este hombre en un samurái japonés con armadura tradicional y katanas, en un entorno histórico realista sin elementos modernos”. Aquí ChatGPT Images reinterpreta la ropa, la postura y el contexto, pero mantiene cierta continuidad facial para que sigas reconociendo al sujeto. El resultado puede recordar a una mezcla entre ilustración histórica y fotografía recreada.
También hay espacio para los guiños nostálgicos. Un caso que OpenAI ha mostrado es el de pedir: “Usa la imagen de este hombre para crear un anuncio europeo de los años 90 a cuerpo completo”. El modelo ajusta la paleta de color, el tipo de encuadre, la pose y el fondo para acercarse al estilo de la publicidad noventera: ropa de la época, tipografía característica integrada en la escena y ese aire ligeramente desfasado que cualquiera que haya visto anuncios de la época reconoce al instante.
Mejor seguimiento de instrucciones y texto más legible en las imágenes
Otro salto importante del nuevo ChatGPT Images tiene que ver con la capacidad de seguir instrucciones al pie de la letra. Antes era habitual pedir algo muy concreto y recibir un resultado que se le parecía, pero que fallaba en detalles clave: colores incorrectos, objetos ausentes o cambios que no se habían pedido.
Según OpenAI, parte de ese problema queda atrás. Si proporcionas indicaciones detalladas, el modelo debería ser capaz de respetarlas con mucha mayor fidelidad. Esto se aplica tanto a la generación desde cero como a la edición de una imagen subida: especificar número de personas, tipos de planos, colores concretos, estilo fotográfico o ilustrativo, época histórica, ropa, clima, etc., tiene ahora más impacto real en el resultado final.
La compañía también subraya mejoras específicas en el renderizado de texto dentro de las imágenes. Históricamente, escribir palabras legibles en carteles, rótulos, anuncios o portadas era una de las tareas más complicadas para los modelos generativos, que a menudo devolvían caracteres deformados, mezclas de idiomas o palabras sin sentido.
Con esta nueva versión, ChatGPT Images es más competente a la hora de generar tipografías coherentes y mensajes correctos, algo clave si quieres usar la herramienta para crear carteles, piezas promocionales, banners para redes sociales o materiales de marketing donde el texto es tan importante como la imagen de fondo.
Además, se han trabajado casos que suelen ser especialmente complicados, como las escenas con múltiples rostros pequeños. En versiones anteriores, cuando aparecían muchas personas en segundo plano o en grupos grandes, era fácil que las caras quedaran deformadas, repetidas o con rasgos irreales. El nuevo modelo mejora el tratamiento de estos detalles, ofreciendo resultados más naturales incluso en planos generales o multitudes.
Adiós (casi) definitivo al tono amarillento de las primeras versiones
Durante una buena temporada, una de las formas más sencillas de detectar si una imagen se había generado con ChatGPT era su estética característica algo cálida y cremosa. Muchas de estas creaciones compartían una paleta con predominio de amarillos y naranjas, luces suaves y un aire “cinematográfico” que terminó convirtiéndose en una especie de marca de la casa, tanto para bien como para mal.
Con la nueva versión, OpenAI parece haber querido romper con ese sello visual involuntario. En las comparativas que la compañía ha publicado, el nuevo modelo se aleja de manera notable de esas tonalidades amarillentas por defecto, salvo que el usuario las pida explícitamente en el prompt. Las imágenes tienden ahora a una representación de color más neutra o más fiel a la indicación del usuario, sin imponer un estilo tan marcado de serie.
Esto tiene ventajas evidentes para usos profesionales: si quieres un anuncio limpio, un mockup de producto o una escena fotorrealista, no te interesa que el modelo aplique un filtro semipermanente con esa apariencia cálida que hace que todas las imágenes parezcan primos hermanos. La nueva aproximación permite variar mucho más el aspecto visual sin tener que luchar contra un estilo base demasiado dominante.
En la práctica, esto significa que ahora es más fácil lograr resultados muy distintos entre sí: desde imágenes frías y desaturadas hasta estéticas muy coloridas, pasando por estilos vintage, tonos pastel, fotografía documental o publicidad hiperbrillante. El modelo se muestra más flexible a la hora de adaptarse al contexto y tono que pidas en tus instrucciones.
Estilos predefinidos y sugerencias: crear sin romperte la cabeza con el prompt
Una de las novedades más agradecidas para quienes no quieren pelearse con prompts complejos es la llegada de estilos y conceptos predefinidos dentro de ChatGPT Images. En lugar de redactar descripciones exhaustivas con parámetros técnicos, puedes elegir directamente un enfoque visual ya preparado y dejar que el sistema rellene los detalles.
Estos estilos preestablecidos están pensados para ahorrar tiempo tanto a usuarios ocasionales como a profesionales que necesitan consistencia entre distintas piezas. Por ejemplo, puedes seleccionar una estética concreta para una campaña y reutilizarla en varias imágenes sin tener que recordar el prompt exacto cada vez.
Además, dentro de la sección de imágenes en la app de ChatGPT encontrarás una serie de sugerencias listas para usar. Puedes arrancar el proceso eligiendo un estilo, subiendo una foto o incluso haciéndote un selfie directamente desde la aplicación, y permitir que la IA proponga transformaciones creativas sin que tú tengas que pensar demasiado el texto inicial.
Esto rebaja bastante la barrera de entrada para quienes no están acostumbrados a hablar “el idioma de los prompts”. En vez de obsesionarte con describirlo todo al milímetro, puedes empezar con una base razonable y luego sí, ir pidiendo ajustes más concretos a medida que vas viendo los resultados.
En la práctica, ChatGPT funciona aquí como un asistente creativo interactivo: puede sugerirte variantes, proponerte cambios de estilo, ajustes de encuadre o ideas nuevas relacionadas con la imagen que ya tienes, de forma que el proceso acaba pareciéndose menos a una simple generación puntual y más a un trabajo conjunto de dirección de arte.
Dónde usar ChatGPT Images y cómo se integra en la app
La nueva versión de ChatGPT Images está siendo desplegada globalmente para todos los usuarios, incluyendo quienes utilizan cuentas gratuitas. OpenAI no ha anunciado restricciones regionales específicas, así que la idea es que cualquier persona con acceso a ChatGPT pueda aprovechar las nuevas capacidades de generación y edición de imágenes.
Si utilizas la aplicación móvil, lo más probable es que ya hayas recibido un aviso al abrirla invitándote a empezar a crear imágenes. Además, la interfaz incorpora un nuevo apartado llamado “Images” en la barra lateral, desde el que puedes consultar todas las creaciones que has ido generando ordenadas en un mismo lugar.
Esta sección no solo sirve como galería personal, sino también como centro de control para gestionar tus proyectos visuales. Desde ahí puedes retomar imágenes antiguas para editarlas de nuevo, duplicar resultados, comparar versiones o partir de una creación previa para experimentar con estilos totalmente distintos sin perder la original.
Lo realmente interesante es que toda esta funcionalidad está integrada dentro de la propia experiencia de ChatGPT. No necesitas abrir herramientas externas ni exportar imágenes a otros servicios de edición para hacer cambios puntuales: puedes pedir ajustes por texto directamente en la conversación, revisar el resultado, volver a iterar y así sucesivamente.
Al final, el nuevo ChatGPT Images convierte a la app en algo más que un simple chatbot: se transforma en una plataforma completa de creación multimodal donde texto, imagen y edición se mezclan de forma bastante fluida, con un enfoque claro en cubrir tanto usos lúdicos como flujos de trabajo más serios, desde campañas publicitarias rápidas hasta prototipos de producto o bocetos visuales para presentaciones.
Con esta actualización, OpenAI busca reforzar su posición en la carrera por la generación visual avanzada, respondiendo a los avances de Google y otros actores con un paquete que combina más velocidad, mejor precisión, mayor control creativo y una integración muy cómoda dentro de ChatGPT. Para el usuario de a pie, el resultado es una herramienta con la que experimentar, probar ideas y producir imágenes cada vez más pulidas sin salir del mismo chat donde ya conversa, programa o redacta a diario.
Tabla de Contenidos
- Qué es la nueva versión de ChatGPT Images y qué la hace diferente
- Edición avanzada: cambiar solo lo que quieres sin destrozar la imagen
- Un “estudio creativo de bolsillo” para crear y reimaginar escenas
- Transformaciones creativas con tus propias fotos
- Mejor seguimiento de instrucciones y texto más legible en las imágenes
- Adiós (casi) definitivo al tono amarillento de las primeras versiones
- Estilos predefinidos y sugerencias: crear sin romperte la cabeza con el prompt
- Dónde usar ChatGPT Images y cómo se integra en la app