L’intelligenza artificiale generativa ha appena superato un nuovo livello di creatività, almeno per la persona media. Questo studio sulla creatività dell’intelligenza artificiale ha confrontato i risultati di oltre 100.000 persone con diversi modelli linguistici di grandi dimensioni, tra cui ChatGPT, Claude e Gemini, e ha scoperto che alcuni modelli possono superare un tipico essere umano in un compito di creatività standardizzato.
Ma il soffitto sembra ancora umano. Lo studio riporta che la metà più creativa dei partecipanti ha sovraperformato ogni modello di intelligenza artificiale testato e il 10% più alto ha ampliato ulteriormente il vantaggio.
L’intelligenza artificiale sta migliorando nel portare a termine i compiti creativi di base, mentre l’eccezionale produzione umana mantiene un divario difficile da cancellare.
La prova dietro l’affermazione
I ricercatori si sono affidati al Divergent Affiliation Job, un rapido suggerimento che richiede dieci parole il più possibile non correlate tra loro. I punteggi aumentano quando quelle parole sono semanticamente più distanti e la maggior parte delle persone finisce in pochi minuti.
Questa semplicità è il motivo per cui il group ha potuto eseguire un confronto così ampio. Aiuta anche a spiegare il risultato del titolo, i modelli possono essere ottimizzati per generare scelte di parole advert ampio raggio su richiesta, che si adattano perfettamente a ciò che DAT premia.
Tuttavia, il DAT misura una fetta di creatività, la capacità di produrre un linguaggio divergente. Non misura il gusto, l’impatto emotivo o se un’concept è quella giusta per un pubblico specifico.
Dove gli umani mantengono un vantaggio
Il segnale più forte nei risultati non è un singolo vincitore, è lo unfold. Alcuni sistemi di intelligenza artificiale possono battere la metà del gruppo, ma gli esseri umani con punteggi elevati si separano e la separazione cresce nella fascia più alta.
In termini quotidiani, i modelli eccellono in termini di quantity. Se hai bisogno di dieci direzioni velocemente, può fornirti. Ciò che non può fare in modo affidabile è la parte selettiva, scegliendo l’unica direzione che vale la pena perseguire, modellandola secondo i vincoli e facendola sembrare intenzionale anziché semplicemente plausibile.
Questo è anche il motivo per cui il risultato non dovrebbe essere letto come un verdetto sulle carriere inventive. Il benchmark mostra l’intervallo di ideazione. Non mostra giudizio sotto pressione, o il tipo di originalità che cambia ciò che il pubblico si aspetta.
Cosa farne?
Il group ha anche confrontato persone e modelli su attività di stile di scrittura creativa, inclusi haiku, riassunti della trama e racconti, che assomigliano meglio a quante persone usano ChatGPT. Anche lì, i migliori creatori umani hanno mantenuto il vantaggio.
Se utilizzi l’intelligenza artificiale al lavoro, trattala come un acceleratore di ideazione. Usalo per generare ampiezza, quindi applica la parte che ancora ti separa, decidi cosa si adatta alla tua voce, cosa corrisponde al temporary e cosa vale la pena spedire.
Tieni d’occhio i follow-up che fissano le versioni esatte dei modelli e le date dei check, perché questo tipo di classifica può spostarsi rapidamente man mano che i modelli cambiano.












