Home Tecnologia GPT-5.3 Immediate riduce le allucinazioni del 26,8% poiché OpenAI sposta l’attenzione dalla...

GPT-5.3 Immediate riduce le allucinazioni del 26,8% poiché OpenAI sposta l’attenzione dalla velocità alla precisione

34
0

GPT-5.3 Immediate di OpenAI, il modello più utilizzato dall’azienda, riduce le allucinazioni fino al 26,8% rispetto al suo predecessore, dando priorità alla precisione e all’affidabilità della conversazione rispetto ai guadagni di prestazioni, afferma OpenAI.

GPT-5.3 Immediate, che è essenzialmente l’impostazione predefinita ed è il modello più utilizzato per gli utenti ChatGPT, migliora anche il tono, la pertinenza e la conversazione con meno rifiuti. È disponibile sia su ChatGPT che sull’API.

Al momento, solo il modello Immediate verrà aggiornato alla 5.3, ma la società ha affermato che sta lavorando per aggiornare gli altri modelli sotto ChatGPT, Pondering e Professional alla 5.3 “presto”.

GPT-5.3 Immediate riduce le allucinazioni fino al 26,8%

OpenAI ha condotto due valutazioni interne: una in ambiti di maggiore interesse, tra cui medicina, finanza e diritto; l’altro attingendo al suggestions degli utenti.

Sulla base di valutazioni di alto livello condotte dall’azienda, GPT-5.3 Immediate riduce le allucinazioni del 26,8% durante l’utilizzo del net. Migliora l’affidabilità del 19,7% quando si fa affidamento sulla sua conoscenza interna. Il suggestions degli utenti ha mostrato una diminuzione del 22,5% delle allucinazioni quando si risponde a domande utilizzando la ricerca sul net.

La società ha affermato che GPT-5.3 Immediate è più affidabile perché ha migliorato il modo in cui bilancia le informazioni provenienti da Web con la propria formazione e ragionamento interni.

“Più in generale, GPT-5.3 Immediate ha meno probabilità di sovraindicizzare i risultati net, cosa che in precedenza poteva portare a lunghi elenchi di collegamenti o informazioni vagamente collegate. Fa un lavoro più efficace nel riconoscere il sottotesto delle domande e nel far emergere le informazioni più importanti, soprattutto in anticipo, risultando in risposte più pertinenti e immediatamente utilizzabili, senza sacrificare velocità o tono”, ha affermato la società.

Un esempio fornito da OpenAI è quando un utente chiede informazioni sul più grande acquisto nella Main League Baseball e sul suo impatto. Il modello precedente, GPT-5.2, spesso per impostazione predefinita riassumeva i risultati della ricerca.

La precisione supera le prestazioni come punto di forza di OpenAI

Con questa nuova versione, prima sul modello più utilizzato, OpenAI vuole che i clienti aziendali e gli altri utenti di ChatGPT comprendano che il fronte della battaglia non riguarda solo le prestazioni di un modello, ma anche la sua capacità di aderire alle informazioni reali. Invece di concentrarsi su parametri prestazionali come velocità e risparmio di token, l’azienda si sta concentrando maggiormente sull’affidabilità di GPT-5.3 Immediate.

Anche concorrenti come Google e Anthropic promuovono una maggiore precisione nei loro nuovi modelli. Anthropic ha affermato che il suo nuovo Claude Sonnet 4.6 ha meno allucinazioni, mentre Google è stata costretta a ritirare il suo modello Gemma 3 dopo aver avuto allucinazioni su false informazioni su un deputato.

GPT-5.3 Richiama istantaneamente i rifiuti e il tono “rabbrividire”.

“Questo aggiornamento si concentra sugli aspetti dell’esperienza ChatGPT che le persone sperimentano ogni giorno: tono, pertinenza e flusso di conversazione. Si tratta di problemi sfumati che non sempre vengono visualizzati nei benchmark, ma determinano se ChatGPT risulta utile o frustrante. GPT-5.3 Immediate riflette direttamente il suggestions degli utenti in queste aree,” OpenAI ha detto in un post sul blog.

GPT-5.3 Immediate ha uno stile di conversazione più naturale, allontanandosi da quello che OpenAI sosteneva fosse un tono di “rabbrividimento” che risultava prepotente e faceva supposizioni sull’intento dell’utente. La società ha notato che garantirà che la personalità della piattaforma di chat sia più coerente tra gli aggiornamenti in modo che gli utenti non sperimentino un cambiamento di tono quando conversano con il modello.

Il nuovo modello riduce notevolmente i rifiuti. OpenAI ha affermato che il modello precedente spesso si rifiutava di rispondere alle domande, anche quando non violavano alcun guardrail. A volte, il modello precedente risponde “in modi che sembrano eccessivamente cauti o predicatori, in particolare su argomenti delicati”.

L’azienda promette che GPT-5.3 non farà lo stesso e attenuerà i “preamboli eccessivamente difensivi o moralistici”. Ciò significa che il modello risponderà direttamente, senza avvertimenti, in modo che gli utenti non terminino le conversazioni senza una risposta alla loro domanda.

Nonostante ciò, GPT-5.3 Immediate deve ancora affrontare alcune limitazioni, soprattutto in alcune lingue come il coreano e il giapponese, dove le risposte sembrano ancora artificiose.

La scheda di sicurezza mostra regressioni nelle categorie di contenuti sessuali e autolesionismo

Il nuovo modello non supporta i contenuti per adulti, secondo un portavoce di OpenAI in un’e-mail a VentureBeat, poiché la società sta ancora cercando di capire “come massimizzare la libertà dell’utente mantenendo il nostro elevato livello di sicurezza”. OpenAI non ha una tempistica per quando rilascerà story funzionalità.

OpenAI ha condotto un benchmarking di sicurezza sul nuovo modello, rilevandone carta di sicurezza che, sebbene abbia funzionato bene rispetto ai contenuti non consentiti, non corrispondeva ancora al livello di GPT-5.2 Immediate. Tuttavia, OpenAI ha notato che questi risultati potrebbero cambiare dopo il lancio.

“GPT-5.3 Immediate mostra regressioni relative a GPT-5.2 Immediate e GPT-5.1 Immediate per contenuti sessuali non consentiti e relative a GPT-5.2 Immediate per autolesionismo sia su valutazioni customary che dinamiche”, ha affermato la società.

In altre categorie, OpenAI ha affermato che il modello funziona alla pari o meglio rispetto alle versioni precedenti e ha notato che le regressioni per la violenza grafica e il comportamento illecito violento hanno una bassa significatività statistica.

Aspettatevi presto un nuovo modello?

Dopo aver annunciato GPT-5.3 Immediate e notato che gli aggiornamenti per Pondering e Professional arriveranno presto, OpenAI ha anticipato che anche questo nuovo modello potrebbe andare in pensione.

Nell’a posta su XOpenAI ha affermato che GPT-5.4 arriverà “prima di quanto pensi”.

OpenAI non ha spiegato quali modifiche, se presenti, possiamo aspettarci con GPT-5.4 e quali modalità lo otterranno per prime.

GPT-5.2 Immediate, il modello precedente, rimarrà disponibile nel selettore di modelli ChatGPT fino al 3 giugno, quando verrà ritirato.

fonte