Midjourney vs. DALL-E 3 in ChatGPT Qual’intelligenza artificiale festeggia meglio Halloween?

Midjourney contro DALL-E 3 in ChatGPT quale intelligenza artificiale celebra meglio Halloween?

datacenter-incubo

Nelle ultime settimane, ci siamo impegnati ad esplorare l’implementazione di DALL-E 3 all’interno di ChatGPT Plus. Incorporando lo strumento di testo-immagine in ChatGPT, l’intelligenza artificiale rende incredibilmente facile la creazione di immagini.

Ma ero curioso. Come si confrontano queste immagini con Midjourney? Ho fatto molte cose con Midjourney e l’ho conosciuto abbastanza bene. Ha più funzionalità di personalizzazione rispetto all’implementazione di DALL-E in ChatGPT, ma come si comporta direttamente al primo utilizzo?

In più: Ancora più divertimento con DALL-E 3 in ChatGPT: può disegnare una maglietta?

Quindi, facciamo una sfida all’italiana all’AI. Metteremo DALL-E 3 in ChatGPT contro Midjourney in otto test di confronto delle immagini. E dato che è la stagione di Halloween, ecco il tema. Ogni prompt include uno stile artistico o di presentazione e un’immagine da creare.

Per testare, ho dato prompt identici ad entrambe le IA. Ho dovuto aggiungere /immagine davanti a tutti i prompt per Midjourney e “immagine di” per DALL-E, ma per il resto i prompt erano identici. Midjourney genera automaticamente quattro immagini, mentre DALL-E ne crea due. Ho eseguito il prompt due volte con DALL-E in modo da avere quattro immagini tra cui scegliere per entrambe le IA.

Successivamente, ho messo tutte le immagini in Photoshop in modo da poterle visualizzare tutte e otto affiancate. I criteri di valutazione sono i seguenti:

  • Come si comporta l’IA con lo stile specificato?
  • L’IA incorpora gli elementi di immagine specificati?
  • Quale immagine è la preferita di mia moglie e quale IA l’ha creata?
  • Quale immagine è la mia preferita e quale IA l’ha creata?

In più: Come ho utilizzato ChatGPT e gli strumenti artistici dell’IA per avviare rapidamente la mia attività su Etsy

Alla fine, sommerò i risultati e dichiarerò un vincitore. E con questo, iniziamo la sfida AI di Halloween!

Strega amichevole

Ecco il nostro prompt:

Strega allegra e amichevole in stile fotorealista a 35mm, di fronte alla porta di una casa di periferia, che distribuisce dolcetti durante Halloween

Ecco cosa hanno creato le due IA. I risultati di Midjourney sono a sinistra. I risultati di DALL-E 3 sono a destra. Puoi cliccare sul piccolo rettangolo nell’angolo in alto a destra per ingrandire l’immagine.

Qui il mio prompt non era preciso come avrebbe potuto essere. Volevo qualcuno in una porta, che guardava fuori dalla casa. Ma non l’ho specificato, quindi ho ottenuto alcune immagini che guardavano dentro la casa e alcune che guardavano fuori.

Midjourney non ha colto l’obiettivo, non offrendo realmente dolcetti in nessuna delle immagini. Sembravano tutte un po’ strane. Cosa sta tenendo in mano la strega nella #4? È un telefono, un rasoio, un tricorder? Sicuramente non è un dolcetto.

DALL-E 3 ha fatto un ottimo lavoro. Tutte e quattro le sue proposte avevano dolcetti, anche se la strega con i biscotti probabilmente non sta fornendo un dolcetto pratico nello stile del trick-or-treat.

In più: ChatGPT vs Bing Chat vs Google Bard: quale è il miglior chatbot dell’IA?

Ero un po’ indeciso nel scegliere il mio preferito dall’insieme di DALL-E. Ma mi piace di più il n. 1. Non risponde alla porta, ma assomiglia molto a quello che avevo in mente quando ho dato l’input. Mia moglie Denise preferisce il n. 3, affermando che sembra davvero coinvolta nella festività, ha chiaramente una ciotola di dolcetti e sembra una vera e propria strega gentile, non solo qualcuno con un costume da strega economico.

  • Stile specificato: legame, entrambe le immagini presentano uno stile fotografico
  • Includi gli elementi specificati: DALL-E, senza dubbio
  • Preferito di Denise: DALL-E n. 3
  • Preferito di David: DALL-E n. 1

Per questa volta, DALL-E è il chiaro vincitore.

Snoopy e la Grande Zucca

Ecco l’input:

Cartone animato in stile anni ’60, la grande zucca di Halloween, con un cane felice simile a Snoopy

Devo ammettere che le rappresentazioni di DALL-E mi hanno sorpreso. DALL-E non ha prodotto un cane simile a Snoopy, ha praticamente prodotto Snoopy. Anche l’immagine DALL-E n. 1 ha Charlie Brown sullo sfondo. Chiaramente, ci sono questioni di trademark qui. Stiamo riproducendo queste immagini solo per mostrarvi cosa riesce a produrre DALL-E, come sforzo giornalistico, ma non potreste usarle, ad esempio, su una maglietta o in un’opera d’arte destinata alla vendita o all’uso commerciale in qualsiasi modo.

D’altro canto, Midjourney ha prodotto piccoli cani bianchi, anche se nessuna delle zucche è abbastanza grande da essere considerata una Grande Zucca (che è, in sé, un marchio registrato di Peanuts Worldwide LLC).

Inoltre: I migliori generatori d’arte AI: DALL-E 2 e divertenti alternative da provare

Senza considerare la questione del marchio registrato e basandomi solo sulla preferenza, Denise preferisce DALL-E n. 3. Per me, DALL-E n. 2 è quasi esattamente ciò che avevo immaginato nella mia testa quando ho creato l’input, ma speravo in qualcosa di più ispirato a Snoopy che una semplice clonazione di Snoopy. Quindi, dovrei dire che mi piacciono molto sia il n. 3 che il n. 4 di Midjourney. I piccoli cappelli sono molto carini. Nel complesso, la mia scelta preferita di Midjourney è il n. 4 perché ha un cane bianco sorridente con un collare a osso e una serie di zucche abbastanza grandi.

  • Stile specificato: DALL-E, perché ha prodotto un cartone piatto molto più nello stile degli anni ’60
  • Includi gli elementi specificati: Midjourney, perché DALL-E è stata una copia diretta, non simile a Snoopy
  • Preferito di Denise: DALL-E n. 3
  • Preferito di David: Midjourney n. 4

Per questa volta, devo dare la vittoria a Midjourney. DALL-E ha prodotto cartoni di Snoopy, ma perché ha prodotto cartoni di Snoopy così precisamente, inclusa Charlie Brown sullo sfondo, tutte e quattro le entrate devono essere squalificate come non utilizzabili senza autorizzazione.

Gatto di Halloween

Ecco l’input:

<p<realismo di="" felice="" gatto="" haker,="" halloween,="" in="" iperrealistico="" luna="" matthias="" nero="" notte="" p="" piena</p

Matthias Haker è un fotografo tedesco che crea arte con immagini architettoniche che hanno un senso di grandiosità e spettralità, oltre a colori vivaci. Volevo vedere cosa sarebbe successo se chiedessi il suo stile, ma per un gatto. Non avevo mai sentito parlare prima di Haker, ma mi è piaciuto quello che ho visto quando ho cercato stili d’arte in Midjourney, nel database di stili d’arte Midlibrary.

Prima di analizzare quei risultati, parliamo un attimo della questione dell’utilizzo dello stile di un artista in un’interpretazione AI. Gli artisti trascorrono una vita intera a creare stili distintivi e c’è qualcosa di inquietante nel fornire il loro nome a un’AI e guardare la macchina sfornare un clone quasi perfetto.

Da un lato, utilizzare un artista per specificare uno stile può essere una forma di abbreviazione per far capire all’AI cosa si desidera. D’altro canto, si afferisce e si appropria dello stile dell’artista.

Inoltre: Non siamo pronti per l’impatto dell’IA generativa sulle elezioni

Qui, nel nostro esempio, è abbastanza improbabile che Haker crei un gatto di Halloween e sto fornendo link che promuovono il suo sito web, ma dovremmo sostenere l’uso dello stile di un artista da parte dell’IA? Fatecelo sapere nei commenti qui sotto. Ho anche contattato direttamente Hacker per conoscere le sue opinioni e, se otterrò una risposta, aggiornerò questo articolo.

Oh, e mentre DALL-E era perfettamente in grado di riprodurre esattamente Snoopy e Charlie Brown, non gli è piaciuta la query su Matthias Haker, restituendo questo:

Mi scuso, ma a causa delle restrizioni delle politiche sui contenuti, non sono stato in grado di generare immagini basate sulla descrizione fornita. Fatemi sapere se avete altre richieste o se posso aiutarvi in altro modo!

Quindi, invece, il prompt di DALL-E è diventato questo:

Gatto nero di Halloween iperrealistico, felice, notte di luna piena

Ecco il risultato:

Sia Midjourney che DALL-E hanno prodotto belle immagini, anche se nessuno è riuscito a presentare un gatto felice. Il mio preferito è Midjourney n. 3, che ha colori meravigliosamente vividi e un ottimo contrasto tra la luna luminosa, la casa infestata sullo sfondo e il gatto. L’unico aspetto negativo è che il gatto mostra solo un occhio.

Non sono riuscito a far decidere a Denise un’immagine preferita. Le sono piaciute Midjourney n. 1 e DALL-E n. 3 allo stesso modo, specificamente per come le IA hanno presentato i volti e le diverse atmosfere e colori.

  • Stile specificato: Midjourney perché DALL-E ha rifiutato di accettare “Matthias Haker” nel prompt
  • Include gli elementi specificati: Pareggio, anche se tutti i gatti sembrano un po’ più irritati che felici
  • Preferito di Denise: Midjourney n. 1 e DALL-E n. 3
  • Preferito di David: Midjourney n. 3

Entrambe le IA si sono comportate egregiamente in questa sfida, ma darei il premio a Midjourney perché ha introdotto colori più vividi, che è l’effetto che volevo ottenere specificando uno stile artistico di Matthias Haker.

Mostri 8-bit

Ecco il prompt:

Vampiri, mummie, costumi di mostro Frankenstein 8-bit di Halloween

Ecco cosa abbiamo ottenuto:

È chiaro che DALL-E ha rispettato alla lettera la legge, producendo immagini 8-bit che potrebbero essere state estratte da un videogioco 8-bit. D’altra parte, mentre Midjourney n. 3 soddisfaceva quel criterio, ha prodotto immagini che non erano, rigorosamente parlando, immagini 8-bit. Invece, ha creato immagini ispirate allo stile 8-bit.

Inoltre: Come ottenere uno swap perfetto del volto usando Midjourney AI

Non era quello che mi sarei aspettato dal mio prompt, ma mi piace. Anche Denise l’ha adorato. Entrambi abbiamo amato alla follia Midjourney n. 1. Ma Denise ha scelto DALL-E n. 2 perché ha realizzato i mostri nel modo giusto ed erano chiaramente in stile 8-bit.

  • Stile specificato: DALL-E, perché tutti derivano da veri videogiochi 8-bit
  • Include gli elementi specificati: DALL-E, perché i mostri erano esattamente come specificato
  • Preferito di Denise: DALL-E n. 2
  • Preferito di David: Midjourney n. 1

Tecnicamente, DALL-E ha vinto questa sfida. Ma sono stato molto più affascinato dai risultati di Midjourney. In questo round do il mio voto a DALL-E perché ha rispettato le regole tecniche. Ma Midjourney è stato molto più di mio favore.

Casa infestata

Ecco il prompt:

Stile fotorealista, stile Graciela Iturbide, casa stregata per Halloween

Come con il gatto, ho usato lo stile di un artista specifico nel prompt. Graciela Iturbide è una fotografa messicana che cattura scene di vita domestica utilizzando uno stile bianco e nero abbastanza marcato e ad alto contrasto che ho pensato potesse tradursi bene in una scena di casa stregata. Inoltre, non avevo mai sentito parlare di Iturbide, ma mi è piaciuto ciò che ho visto quando ho nuovamente cercato stili artistici su Midjourney, nel database di stili artistici di Midlibrary.

Come ho fatto con Matthias Haker, sono entrato in contatto con Graciela Iturbide per chiedere cosa ne pensa dell’uso di AI che si ispirano al suo stile. Aggiornerò questo articolo se riceverò una risposta.

Ecco il risultato:

Una delle cose che adoro delle AI testo-immagine è che il risultato può essere inaspettato. Il mio indiscusso preferito è Midjourney n. 3, che nemmeno ha una casa, ma trasmette una sensazione terrificante così intensa che mi piace moltissimo. Denise ha preferito DALL-E n. 1, dicendo che spiccava come una grande casa stregata invitante e spaventosa di quelle fatte per attirarti e intrappolarti con illusioni di intimità, anche se non aveva niente a che fare con lo stile specificato.

  • Stile specificato: Midjourney, utilizzando l’immagine in bianco e nero marcato dell’artista
  • Includendo gli elementi specificati: DALL-E ha disegnato la classica casa stregata
  • Preferito di Denise: DALL-E n. 1
  • Preferito di David: Midjourney n. 3

Wow. Entrambe le AI hanno prodotto immagini meravigliose. Devo dare il mio voto a DALL-E perché se stavi cercando specificamente un’immagine di una casa stregata, l’output di DALL-E è molto più simile a quello che ti aspetteresti. Detto questo, personalmente amo ciò che Midjourney ha creato da un punto di vista artistico.

Bambini in costume

Ecco il prompt:

Bambini che fanno “trick-or-treat” in stile Pixar con costumi di Halloween

Non sono affatto sicuro di cosa Midjourney stia cercando di fare. I suoi bambini sembrano un misto tra cartoni animati e bambini reali. I bambini di DALL-E sembrano usciti da un cartone animato Pixar.

Questo è una vittoria facile per DALL-E. Denise ha adorato i visi sorridenti e super eccitati di DALL-E n. 1, inclusa la dinosaurina. A me è piaciuto molto DALL-E n. 3, soprattutto il piccolo alieno.

  • Stile specificato: DALL-E
  • Includendo gli elementi specificati: DALL-E
  • Preferito di Denise: DALL-E n. 1
  • Preferito di David: DALL-E n. 3

Fantasma amichevole

Ecco il prompt:

Fantasma amichevole in stile Disney con lanterna di Halloween spaventosa

Per essere chiari, il personaggio classico di Casper il Fantasma Amichevole non è mai stato di proprietà di Disney. Era una proprietà della Paramount che è finita sotto l’ombrello di Dreamworks sia per l’animazione che per i fumetti.

Detto ciò, volevo un fantasma amichevole, non necessariamente Casper. E volevo che avesse una jack-o’-lantern decisamente meno amichevole e sperabilmente spaventosa. Con lo stile Disney, speravo in uno stile animato più moderno, piuttosto che qualcosa che sembrasse essere stato tratto da un disegno fatto a mano su pellicola di un artista Disney d’epoca.

Ecco cosa abbiamo ottenuto:

Midjourney ha un po’ mancato il punto, confondendo in qualche modo lo stile di Nightmare Before Christmas (questo è il nostro prossimo tema) con le immagini degli spiriti. Inoltre, gli spiriti sono un po’ spaventosi e la zucca di Halloween meno.

Denise ed io preferivamo entrambi le grafiche del DALL-E, anche se ha detto che l’arte non era proprio uno stile Disney. Il suo preferito era il DALL-E n. 1, con il n. 2 al secondo posto. Il mio preferito era il DALL-E n. 1, senza dubbio. Mi piaceva lo spirito amichevole e la zucca di Halloween aveva un certo pericolo – esattamente la giustapposizione di umori che volevo quando ho scritto quel tema.

  • Stile specificato: DALL-E
  • Includi gli elementi specificati: DALL-E
  • Preferito di Denise: DALL-E n. 1 o n. 2
  • Preferito di David: DALL-E n. 1

Inoltre: Gli strumenti IA di terze parti sono responsabili del 55% dei fallimenti dell’IA nelle aziende

Il vincitore qui è DALL-E. Entrambi hanno disegnato belle immagini cartoonesche, ma DALL-E ha colto l’intenzione e ha creato uno spirito amichevole con una zucca spaventosa. Midjourney ha fatto esattamente il contrario, mancando il punto del tema.

Nightmare datacenter

Questo è probabilmente il mio preferito tra tutti i temi. Ecco cosa ho inserito negli AI:

Stile di Nightmare Before Christmas, stile di Tim Burton, professionista IT in un data center

Li adoro. Tutti quanti. Ancora una volta, DALL-E ha utilizzato l’immagine di riferimento effettiva, mentre Midjourney ne è stato più ispirato. Voglio dire, non c’è praticamente alcun dubbio che Jack Skellington si sia in qualche modo trovato dentro un data center nelle immagini DALL-E.

Le immagini di Midjourney mostrano persone dell’IT, ma non un vero e proprio data center. Detto questo, il preferito di Denise è Midjourney n. 1, perché lì c’è esattamente ciò che lei immagina se dovesse entrare nelle viscere di un’azienda per cercare il temibile tizio dell’IT (cosa che non fa, perché il suo tizio dell’IT è seduto accanto a lei sul divano ogni giorno).

La mia immagine preferita assoluta è il DALL-E n. 4. Sì, è indubbiamente Jack Skellington, ma il design del data center è perfetto e mi piace davvero. La metterei sulla parete del mio ufficio, davvero. Detto questo, dobbiamo ancora affrontare problemi di licenze (Jack Skellington è un marchio Disney), quindi le immagini di Midjourney potrebbero essere più utilizzabili se volessi metterle su una maglietta o qualcosa del genere.

  • Stile specificato: Midjourney ha riprodotto correttamente lo stile colorato di Nightmare Before Christmas
  • Includi gli elementi specificati: Pareggio. DALL-E ha fatto i data center, Midjourney no. Ma Midjourney ha creato personaggi unici senza semplicemente clonare Jack Skellington.
  • Preferito di Denise: Midjourney n. 1
  • Preferito di David: DALL-E n. 4

In questa selezione, devo dare ragione a Midjourney – per lo stesso motivo per cui Midjourney ha vinto il round in stile Snoopy sopra. DALL-E ha creato cartoni di Jack Skellington, ma perché ha riprodotto Jack Skellington in modo così preciso, tutte e quattro le immagini devono essere squalificate come non utilizzabili senza licenza. Si potrebbe argomentare che il DALL-E n. 1 non è esattamente Jack Skellington, ma stiamo facendo casini considerando che gli altri sono fedeli a Skellington.

Quale IA celebra meglio Halloween?

Wow, è una scelta difficile. Se si sommano le vittorie, DALL-E 3 in ChatGPT ha vinto cinque dei otto concorsi, mentre Midjourney ne ha vinti tre su otto. Quindi, suppongo che DALL-E sia il vincitore.

Inoltre: Come l’IA mi ha aiutato a far arrivare la mia musica su tutti i principali servizi di streaming

DALL-E ha perso punti per alcune delle sue migliori opere, perché ha completamente clonato Snoopy e Jack Skellington anziché prenderli come ispirazione. Midjourney a volte ha completamente perso di vista l’obiettivo dell’incarico, ma almeno non ha restituito risultati che avrebbero creato problemi di licenze. Non è il tipo di incubo che volevo evocare in queste immagini.

Ho qualche raccomandazione di acquisto basata su questi test? No. Trovo che Midjourney offra un ottimo rapporto qualità-prezzo e una certa flessibilità, ma – come la maggior parte degli artisti – ha una mente propria. DALL-E 3, all’interno di ChatGPT, è un bonus gratuito dato che sto già pagando per ChatGPT Plus. Devo dire che sono rimasto piacevolmente sorpreso dalla qualità dei risultati di DALL-E, ma un po’ spaventato dalla sua tendenza a clonare proprietà con licenza.

Cosa ne pensi? Quali sono le tue immagini preferite? Chi pensi che abbia vinto la nostra competizione? Fateci sapere nei commenti qui sotto.


Puoi seguire gli aggiornamenti quotidiani dei miei progetti sui social media. Assicurati di iscriverti alla mia newsletter settimanale di aggiornamenti su Substack, e seguimi su Twitter su @DavidGewirtz, su Facebook su Facebook.com/DavidGewirtz, su Instagram su Instagram.com/DavidGewirtz, e su YouTube su YouTube.com/DavidGewirtzTV.