- ChatGPT Images estrena un nou model més ràpid i precís, capaç de seguir millor les instruccions de lusuari.
- L´actualització se centra en l´edició avançada, els estils predefinits i les transformacions creatives a partir de fotos reals.
- El sistema millora el text dins de les imatges, la coherència a les edicions i redueix l'aspecte "groguenc" de versions anteriors.
- La nova versió s'integra a ChatGPT i està disponible globalment per a comptes gratuïts i de pagament.

Fa no tant, mig internet es va posar a jugar a ser director de pel·lícules d'animació a l'estil Studio Ghibli amb lajuda de ChatGPT. Les xarxes socials es van omplir d'escenes oníriques, personatges entranyables i fons amb aquest toc japonès tan reconeixible. Darrere d'aquella febre hi havia el model de generació d'imatges d'OpenAI integrat a ChatGPT, que va convertir qualsevol en pseudoil·lustrador sense necessitat de saber dibuixar.
No obstant això, el món de la intel·ligència artificial generativa va tan accelerat que aquella moda va durar dos telenotícies. Poc després, la conversa es va desplaçar cap a altres propostes com Nano Banana Pro i els nous models de Google, capaços de produir imatges tan realistes que costava distingir-les d'una foto o eines com Mitjan viatge que converteixen text en imatges. Davant aquest panorama, OpenAI no s'ha quedat quieta: n'ha presentat una nova versió de ChatGPT Images que arriba per plantar cara, amb més velocitat, millor comprensió d´instruccions i un salt important en edició avançada.
Què és la nova versió de ChatGPT Images i què la fa diferent
OpenAI ha anunciat oficialment la nova generació de ChatGPT Images coincidint amb el llançament de GPT-5.2, el model de llenguatge més recent. Tots dos moviments formen part de la mateixa estratègia: respondre directament a l'ofensiva de Google amb models com Gemini 3 Pro i demostrar que continuen competint al màxim nivell en text i imatge.
En aquesta nova etapa, ChatGPT Images funciona sobre el model GPT Image 1.5, dissenyat específicament per generar i editar imatges amb més control i més rapidesa que en versions anteriors. La pròpia companyia assegura que ara el sistema és capaç de produir resultats fins quatre vegades més ràpid, cosa que es nota especialment al mòbil, on abans era habitual que el procés s'interrompés si l'usuari canviava d'aplicació a meitat de la generació.
La comparació amb el model anterior és clara: on abans hi havia temps d'espera llargs i certa sensació de lentitud, ara l'experiència és més semblant a un estudi digital en temps real. A les proves que s'han anat compartint, les imatges apareixen de manera molt més fluida, amb menys bloquejos i sense aquesta impressió que l'app s'ha quedat penjada mentre el servidor calcula.
A més de la velocitat, OpenAI situa la precisió i el respecte per les instruccions de l'usuari com el gran salt qualitatiu. L'objectiu és que ChatGPT Images deixi de ser un generador “capritxós” que interpreta a la seva manera els prompts i passi a comportar-se com una eina més fiable per a fluxos creatius i professionals; per això és clau saber com escriure prompts per a disseny gràfic.

Edició avançada: canviar només allò que vols sense destrossar la imatge
Un dels talons d'Aquil·les tradicionals dels generadors d'imatges ha estat la edició localitzada d'elements concrets. Si volies retocar una jaqueta, canviar el fons o ajustar la il·luminació, sovint el model “reimaginava” tota l'escena i acabaves amb un resultat completament diferent del que pretenies.
La nova versió de ChatGPT Images se centra precisament a resoldre aquest problema. OpenAI afirma que ara el sistema és capaç de modificar només les parts que l'usuari indiqui, mantenint intacte la resta de la imatge. Això inclou des d'objectes específics (un cotxe, un senyal de trànsit, una peça de roba) fins a aspectes globals com la llum, l'enquadrament o la composició general, però sense perdre la coherència del conjunt.
La companyia explica que el model ha estat entrenat per a:
- Modificar únicament els elements sol·licitats, respectant al màxim el context original.
- Mantenir la resta de la imatge sense canvis, evitant que apareguin detalls nous no desitjats.
- Conservar la coherència entre la imatge original, les sortides generades i les edicions successives que vagis aplicant.
Això es nota sobretot als fluxos de treball iteratius, on vas fent petits ajustaments en diverses rondes. En altres models, després d'unes quantes edicions la imatge començava a deformar-se oa perdre qualitat: cares que canviaven, fons que es tornaven irreconeixibles, detalls que desapareixien. Amb ChatGPT Images, la idea és que puguis retocar, revertir canvis, afinar detalls i combinar versions sense que el resultat final es vagi degradant.
Un bon exemple és el tipus de prompt que ha mostrat OpenAI: partir d'una mateixa escena urbana, per exemple un paisatge de Los Angeles amb una persona en patinet, i demanar canvis molt concrets: “fes que la camisa sigui vermella, la gorra groga, el senyal de límit de velocitat marqui 15 i converteix el camió en un camió de bombers”. El model, en comptes de regenerar-ho tot des de zero, ajusta només aquests detalls, mantenint l'enquadrament, l'atmosfera i l'estil fotogràfic original.

Un “estudi creatiu de butxaca” per crear i reimaginar escenes
OpenAI descriu la nova versió com una mena de estudi creatiu portàtil integrat directament a ChatGPT. La idea és que, tant si comences des de zero com si treballes a partir d'una foto real, puguis dirigir el resultat de manera molt més fina, gairebé com ho faries amb un equip de disseny però dins una conversa.
El model destaca especialment en tasques com afegir o eliminar elements una escena. Per exemple, podeu demanar que desaparegui un objecte que destorba, inserir un personatge addicional, sumar un cotxe aparcat al fons o treure persones d'un paisatge sense deixar rastres evidents d'edició. El sistema sencarrega de reconstruir el fons i ajustar ombres, reflexos i llum perquè la manipulació no es noti.
També s'ha potenciat la capacitat de combinar i fusionar imatges. Això permet, per exemple, agafar la foto d'una persona i una altra d'un entorn completament diferent i generar una escena creïble que barregi tots dos elements. O unir subjectes de diverses fotografies independents en una mateixa composició coherent, una cosa molt útil per fer muntatges “impossibles” però versemblants.
Una altra funció rellevant és l'opció de reorganitzar composicions completes. A través d'un prompt, pots demanar que es canviïn de lloc certs elements de l'enquadrament, que la càmera s'acosti o s'allunyi, que el pla es converteixi en un detall o una panoràmica, o que l'escena es reinterpreti en un altre moment del dia. Tot això intentant preservar les característiques visuals que feien reconeixible la imatge de partida.
Finalment, s'ha afinat força la transposició d'estils i estructures. Això significa que podeu aplicar la composició, paleta de color o il·luminació d'una foto de referència a una altra imatge, mantenint l'estructura de l'escena original però amb una altra atmosfera. És el tipus d'operació que permet passar d'una escena realista a una estètica cinematogràfica dels anys 2000, oa una fotografia de carrer documental de finals dels 90 amb pel·lícula de 35 mm i gra marcat.
Transformacions creatives amb les teves pròpies fotos
Una àrea on el nou ChatGPT Images destaca especialment és a les transformacions creatives a partir d'imatges reals. Només cal pujar una foto teva (o d'una altra persona per a qui tinguis permís) i acompanyar-la d'un prompt relativament senzill per obtenir en qüestió de segons resultats que, en molts casos, resulten sorprenentment creïbles.
Aquesta idea no és del tot nova: models com Nano Banana ja havien posat molt èmfasi en aquesta capacitat, permetent convertir retrats reals en campanyes publicitàries, pòsters o escenes extremadament estilitzades. El que ara fa OpenAI és portar aquest enfocament directament a ChatGPT, amb un sistema que entén millor la intenció de l'usuari i conserva més fidelment els trets del subjecte original.
Entre els exemples més cridaners estan promts del tipus: Crea una imatge d'aquest home, però a Times Square a l'hivern del 2025. El model adapta la roba, l'entorn, la il·luminació nocturna i els elements urbans perquè encaixin amb l'estètica de Nova York en aquella època de l'any, però mantenint el gest, la postura general i els trets facials del subjecte d'origen, i fins i tot permet convertir la imatge en formats com stickers de WhatsApp.
Un altre ús habitual és el de “viatjar” visualment: pots demanar alguna cosa com “Situa aquesta persona a cos complet en una ciutat japonesa durant una nit plujosa, amb neons, reflexos a terra i estètica cyberpunk”. El sistema genera una escena amb llums de neó, bassals a l'asfalt i edificis típics, integrant la persona dins aquest univers com si estigués realment allà, sense que sembli una simple retallada enganxada sobre un fons.
Per als que prefereixen una mica més fantasiós, es poden fer transformacions estil “Converteix aquest home en un samurai japonès amb armadura tradicional i katanes, en un entorn històric realista sense elements moderns”. Aquí ChatGPT Images reinterpreta la roba, la postura i el context, però manté certa continuïtat facial perquè segueixis reconeixent el subjecte. El resultat pot recordar una barreja entre il·lustració històrica i fotografia recreada.
També hi ha espai per a les picades d'ullet nostàlgica. Un cas que OpenAI ha mostrat és demanar: "Fes servir la imatge d'aquest home per crear un anunci europeu dels anys 90 a cos complet". El model ajusta la paleta de color, el tipus d'enquadrament, el posat i el fons per acostar-se a l'estil de la publicitat noventera: roba de l'època, tipografia característica integrada a l'escena i aquell aire lleugerament desfasat que qualsevol que hagi vist anuncis de l'època reconeix a l'instant.
Millor seguiment d'instruccions i text més llegible a les imatges
Un altre salt important del nou ChatGPT Images té a veure amb la capacitat de seguir instruccions al peu de la lletra. Abans era habitual demanar una cosa molt concreta i rebre un resultat que se li assemblava, però que fallava en detalls clau: colors incorrectes, objectes absents o canvis que no s'havien demanat.
Segons OpenAI, part del problema queda enrere. Si proporcioneu indicacions detallades, el model hauria de ser capaç de respectar-les amb molta més fidelitat. Això s'aplica tant a la generació des de zero com a l'edició d'una imatge pujada: especificar nombre de persones, tipus de plànols, colors concrets, estil fotogràfic o il·lustratiu, època històrica, roba, clima, etc., ara té més impacte real en el resultat final.
La companyia també subratlla millores específiques al renderitzat de text dins de les imatges. Històricament, escriure paraules llegibles en cartells, rètols, anuncis o portades era una de les tasques més complicades per als models generatius, que sovint tornaven caràcters deformats, barreges d'idiomes o paraules sense sentit.
Amb aquesta nova versió, ChatGPT Images és més competent a l'hora de generar tipografies coherents i missatges correctes, alguna cosa clau si vols fer servir l'eina per crear cartells, peces promocionals, banners per a xarxes socials o materials de màrqueting on el text és tan important com la imatge de fons.
A més, s'han treballat casos que solen ser especialment complicats, com les escenes amb múltiples cares petites. En versions anteriors, quan apareixien moltes persones en segon pla o en grups grans, era fàcil que les cares quedessin deformades, repetides o amb trets irreals. El nou model millora el tractament d'aquests detalls i ofereix resultats més naturals fins i tot en plànols generals o multituds.
Adéu (gairebé) definitiu al to groguenc de les primeres versions
Durant una bona temporada, una de les maneres més senzilles de detectar si una imatge s'havia generat amb ChatGPT era la seva estètica característica una mica càlida i cremosa. Moltes d'aquestes creacions compartien una paleta amb predomini de grocs i taronges, llums suaus i un aire “cinematogràfic” que va acabar convertint-se en una mena de marca de la casa, tant per bé com per mal.
Amb la nova versió, OpenAI sembla haver volgut trencar amb aquest segell visual involuntari. A les comparatives que la companyia ha publicat, el nou model s'allunya de manera notable d'aquestes tonalitats groguenques per defecte, llevat que l'usuari les demani explícitament al prompt. Les imatges tendeixen ara a una representació de color més neutra o més fidel a la indicació de lusuari, sense imposar un estil tan marcat de sèrie.
Això té avantatges evidents per a usos professionals: si vols un anunci net, un mockup de producte o una escena fotorealista, no t'interessa que el model apliqui un filtre semipermanent amb aquesta aparença càlida que fa que totes les imatges semblin cosins germans. La nova aproximació permet variar molt més l'aspecte visual sense haver de lluitar contra un estil base massa dominant.
A la pràctica, això significa que ara és més fàcil aconseguir resultats molt diferents entre si: des d'imatges fredes i desaturades fins a estètiques molt acolorides, passant per estils vintage, tons pastís, fotografia documental o publicitat hiperbrillant. El model es mostra més flexible a l'hora d'adaptar-se al context i al to que demanis a les teves instruccions.
Estils predefinits i suggeriments: crear sense trencar-te el cap amb el prompt
Una de les novetats més agraïdes per als que no es volen barallar amb prompts complexos és l'arribada de estils i conceptes predefinits dins de ChatGPT Images. En lloc de redactar descripcions exhaustives amb paràmetres tècnics, pots triar directament un enfocament visual ja preparat i deixar que el sistema empleni els detalls.
Aquests estils preestablerts estan pensats per estalviar temps tant a usuaris ocasionals com a professionals que necessiten consistència entre diferents peces. Per exemple, podeu seleccionar una estètica concreta per a una campanya i reutilitzar-la en diverses imatges sense haver de recordar el prompt exacte cada vegada.
A més, dins de la secció d'imatges a l'app de ChatGPT trobaràs una sèrie de suggeriments llistes per utilitzar. Pots arrencar el procés triant un estil, pujant una foto o fins i tot fent-te un selfie directament des de l'aplicació, i permetre que la IA proposi transformacions creatives sense que tu hagis de pensar gaire el text inicial.
Això rebaixa força la barrera d'entrada per als que no estan acostumats a parlar “l'idioma dels prompts”. En comptes d'obsessionar-te amb descriure-ho tot al mil·límetre, pots començar amb una base raonable i després sí, anar demanant ajustaments més concrets a mesura que vas veient els resultats.
A la pràctica, ChatGPT funciona aquí com un assistent creatiu interactiu: us pot suggerir variants, proposar-vos canvis d'estil, ajustaments d'enquadrament o idees noves relacionades amb la imatge que ja teniu, de manera que el procés acaba semblant menys a una simple generació puntual i més a un treball conjunt de direcció d'art.
On utilitzar ChatGPT Images i com s'integra a l'app
La nova versió de ChatGPT Images està sent desplegada globalment per a tots els usuaris, incloent els que utilitzen comptes gratuïts. OpenAI no ha anunciat restriccions regionals específiques, així que la idea és que qualsevol persona amb accés a ChatGPT pugui aprofitar les noves capacitats de generació i d'edició d'imatges.
Si utilitzes l'aplicació mòbil, el més probable és que ja hagis rebut un avís en obrir-la convidant-te a començar a crear imatges. A més, la interfície incorpora un nou apartat anomenat “Imatges” a la barra lateral, des del qual pots consultar totes les creacions que has anat generant ordenades en un mateix lloc.
Aquesta secció no només serveix com a galeria personal, sinó també com centre de control per gestionar els teus projectes visuals. Des d'aquí podeu reprendre imatges antigues per editar-les de nou, duplicar resultats, comparar versions o partir d'una creació prèvia per experimentar amb estils totalment diferents sense perdre l'original.
El que és realment interessant és que tota aquesta funcionalitat està integrada dins de la pròpia experiència de ChatGPT. No cal obrir eines externes ni exportar imatges a altres serveis d'edició per fer canvis puntuals: pots demanar ajustaments per text directament a la conversa, revisar el resultat, tornar a iterar i així successivament.
Al final, el nou ChatGPT Images converteix l'app en alguna cosa més que un simple chatbot: es transforma en una plataforma completa de creació multimodal on text, imatge i edició es barregen de forma força fluida, amb un enfocament clar a cobrir tant usos lúdics com fluxos de treball més seriosos, des de campanyes publicitàries ràpides fins a prototips de producte o esbossos visuals per a presentacions.
Amb aquesta actualització, OpenAI busca reforçar la seva posició a la carrera per la generació visual avançada, responent als avenços de Google i altres actors amb un paquet que combina més velocitat, millor precisió, major control creatiu i una integració molt còmoda dins de ChatGPT. Per a l'usuari corrent, el resultat és una eina amb què experimentar, provar idees i produir imatges cada cop més polides sense sortir del mateix xat on ja conversa, programa o redacta diàriament.
Taula de Continguts
- Què és la nova versió de ChatGPT Images i què la fa diferent
- Edició avançada: canviar només allò que vols sense destrossar la imatge
- Un “estudi creatiu de butxaca” per crear i reimaginar escenes
- Transformacions creatives amb les teves pròpies fotos
- Millor seguiment d'instruccions i text més llegible a les imatges
- Adéu (gairebé) definitiu al to groguenc de les primeres versions
- Estils predefinits i suggeriments: crear sense trencar-te el cap amb el prompt
- On utilitzar ChatGPT Images i com s'integra a l'app