
La nuova versione di ChatGPT Images, basata sul modello GPT-Image-1.5, è la risposta naturale di Open AI a Nano Banana Pro, strumento di generazione immagini di Google che ha segnato decisamente un passo avanti nell’ambito in termini di velocità e precisione. Open AI lo racconta come qualcosa di ben lontano da un semplice miglioramento estetico: introduce cambiamenti che possono incidere in modo significativo sui workflow marketing, soprattutto nelle fasi di test, adattamento creativo e produzione ripetibile.
Vediamo cosa cambia davvero lato marketer e quali sono i limiti di questo nuovo strumento, secondo i miei test.
Editing più preciso: meno rifacimenti, più controllo… ma non sempre!

La prima novità rilevante riguarda l’editing mirato delle immagini.
Il modello segue le istruzioni in modo più affidabile, modificando ciò che viene richiesto e mantenendo coerenti elementi come illuminazione, composizione e aspetto dei soggetti. Per quanto mi riguarda, la promessa viene abbastanza mantenuta quando si parla di modifiche di ambienti e inserimento di persone in contesti diversi o anche semplici cambi di outfit.
Diverso è quando si richiede la modifica di oggetti che contengono testi o molti dettagli, come bottiglie di vino e prodotti cosmetici che riportano piccoli testi nel packaging: in questo caso, come succede anche per Nano Banana Pro, il sistema inserisce diversi micro-typo nell’elaborazione che non riescono a venir corretti nemmeno a seguito di richiesta specifica o rielaborazione dell’immagine (semplicemente ne aggiunge altri).
Ottimo quindi per inserimento di prodotti “semplici” in contesti e sfondi diversi e per modifiche di outfit o inserimento di persone in ambienti differenti, meno per modifiche e generazioni di varianti in caso di prodotti con testo e dettagli.
Esempio pratico d’uso
Hai una foto prodotto – senza scritte piccole e troppi dettagli – che funziona in ADV ma vuoi:
- cambiare contesto
- adattarla a una stagione diversa
- inserirla in un ambiente lifestyle
Con GPT-Image-1.5 è molto più probabile ottenere una modifica puntuale senza alterare prodotto, scritte o branding, rispetto alle versioni precedenti. La verifica finale resta necessaria, ma il punto di partenza è decisamente più solido.
Coerenza visiva: un passo avanti per i workflow di brand
Uno dei limiti storici delle immagini generate con AI era la perdita di coerenza tra una versione e l’altra. Qui il miglioramento è evidente.
Il modello mostra una migliore preservazione di loghi, key visual ed elementi ricorrenti – anche se non sempre perfetta -, rendendolo più compatibile con workflow di brand e marketing, in particolare per:
- concept creativi
- adattamenti visual
- produzione rapida di varianti
Non si parla di “garanzia”, ma di affidabilità aumentata, che riduce il lavoro correttivo a valle.
Trasformazioni creative: dal concept all’adattamento
Un altro aspetto interessante riguarda le creative transformations.
Il modello non applica solo filtri, ma gestisce trasformazioni concettuali mantenendo l’essenza dell’immagine originale.
Questo apre possibilità concrete per:
- trasformare una foto in un visual ADV
- adattare uno stesso soggetto a più formati
- creare declinazioni per social, landing e campagne
In pratica, uno stesso asset può diventare la base per più output, con richieste testuali semplici e ripetibili.
Testi dentro le immagini: miglioramento reale, non miracoloso

GPT-Image-1.5 compie un passo avanti anche nel text rendering, riuscendo a gestire testi più piccoli e layout più densi rispetto al passato.
Per chi lavora con:
- infografiche
- visual educativi
- creatività con copy integrato
è un miglioramento concreto. Non elimina la necessità di revisione grafica, ma riduce gli errori grossolani che rendevano questi output inutilizzabili.
Le infografiche vengono decisamente generate in modo più rapido ed efficace di prima rispettando gli stili richiesti – es. pop – ma si trovano ancora spesso, anche se non sempre, micro-typo che faticano a essere corretti anche attraverso le interazioni successive.
Su questo decisamente continuo a preferire Nano Banana Pro.
Velocità fino a 4×: impatto sulle fasi di test
La generazione delle immagini è dichiarata fino a 4 volte più veloce.
Dal punto di vista operativo questo significa:
- più varianti testabili
- meno attese tra un’iterazione e l’altra
- maggiore fluidità nella fase di sperimentazione creativa
In ottica performance marketing, è un vantaggio soprattutto nelle fasi di test e pre-produzione. Va detto che effettivamente il sistema di generazione immagini è più veloce di prima, ma dai miei test non è ancora paragonabile alla velocità di Nano Banana Pro. Un passo avanti in generale, ma anche di qualche passo indietro rispetto al principale competitor in particolare.
Nuovo spazio Images: meno attrito iniziale
ChatGPT introduce anche uno spazio Images dedicato, con preset e prompt suggeriti.
È un’esperienza più guidata, pensata per ridurre l’attrito iniziale e facilitare l’esplorazione creativa, soprattutto per utenti meno tecnici.
Tra le novità in rollout è prevista anche la possibilità di caricare una likeness riutilizzabile, utile per creator e personal brand che lavorano con format ricorrenti.
Limiti ancora presenti
OpenAI stessa lo dichiara in modo esplicito: i risultati non sono perfetti.
Nonostante i miglioramenti evidenti, il modello continua a mostrare alcune difficoltà quando si lavora con stili particolarmente complessi, con scene che includono molti volti o con contenuti multilingua articolati e, come abbiamo visto, spesso si inceppa quando si tratta di testo.
È un passo avanti importante, ma non tale da eliminare il bisogno di controllo umano, soprattutto in contesti professionali e brand-sensitive.
La mia conclusione
ChatGPT Images 1.5 si avvicina molto di più a una vera e propria pipeline di produzione visuale assistita. Se inserito nel modo corretto all’interno del workflow, può aiutare a ridurre i tempi operativi, migliorare la coerenza tra le diverse varianti creative e rendere più rapide le fasi di test e adattamento dei contenuti.
La differenza, però, come sempre, non la fa il tool in sé.
La fa chi sa cosa chiedere, perché farlo e in quale momento del processo utilizzare lo strumento.
E, soprattutto, la fa la nostra capacità di controllo e verifica.
