Home Tecnologia OpenAI, nel disperato bisogno di una vittoria, lancia GPT-5.4

OpenAI, nel disperato bisogno di una vittoria, lancia GPT-5.4

40
0

Sulla scia della tanto diffamata decisione di fare affari con il Dipartimento della Difesa, OpenAI sta cercando di correggere la rotta e riconquistare il pubblico con la rilascio di GPT-5.4l’ultimo modello dell’azienda. OpenAI chiamato il modello è il “modello di frontiera più capace ed efficiente per il lavoro professionale” e ha affermato di riunire i suoi progressi nel ragionamento, nella codifica e nei flussi di lavoro degli agenti in un unico modello unificato.

GPT-5.4 verrà lanciato a partire da oggi e sarà disponibile in ChatGPT, Codex e API di OpenAI. GPT-5.4 Considering sarà disponibile per gli utenti Plus, Groups e Professional, mentre GPT-5.4 Professional sarà disponibile tramite l’API, nonché per gli abbonati ChatGPT Enterprise ed Edu.

Secondo OpenAI, GPT-5.4 è il primo modello di uso generale rilasciato dall’azienda con funzionalità native di utilizzo del pc, il che significa che è in grado di funzionare autonomamente su various applicazioni su una macchina per conto dell’utente. La società ha affermato che il modello è in grado di scrivere codice per operare ed eseguire attività sui pc, nonché di impartire comandi da tastiera e mouse per navigare nel sistema operativo.

Ciò segna un aggiornamento degno di nota per quanto riguarda l’intelligenza artificiale degli agenti e l’azienda sta pubblicizzando i suoi ultimi benchmark per dimostrarlo. Secondo quanto riferito, la società ha conquistato il primo posto nella classifica dei benchmark APEX-Brokers di Mercor, che testa le prestazioni di un modello per il lavoro dei servizi professionali. La società ha inoltre affermato di aver conquistato il primo posto nei check di benchmarking OSWorld-Verified e WebArena Verified, che si concentrano sulle prestazioni di utilizzo del pc di un modello.

Per quanto riguarda gli usi più generici con cui è più probabile che l’utente medio di ChatGPT interagisca, come porre domande, OpenAI afferma che il modello più recente offre prestazioni migliori anche lì. L’azienda afferma che le risposte individuali di GPT-5.4 hanno il 33% in meno di probabilità di contenere errori rispetto alle risposte di GPT-5.2, e il nuovo modello ha il 18% in meno di probabilità di commettere errori nel complesso. L’azienda ha inoltre affermato che le allucinazioni sono meno probabili con GPT-5.4.

L’azienda dovrà sperare che i presunti miglioramenti siano sufficienti a riportare l’interesse su ChatGPT. La piattaforma secondo quanto riferito, ha perso circa 1,5 milioni di utenti dopo che OpenAI ha annunciato che avrebbe offerto i suoi servizi al Dipartimento della Difesa in seguito al rifiuto pubblico del rivale Anthropic di abbandonare le sue garanzie per compiacere il Pentagono. La decisione non ha prodotto solo reazioni pubbliche, ma anche problemi interni, con alcuni dipendenti manifestando apertamente la propria contrarietà a lavorare con il Dipartimento della Difesa. Sfortunatamente, meno errori nelle risposte di ChatGPT probabilmente non garantiranno meno errori nel giudizio di Sam Altman.

fonte

LEAVE A REPLY

Please enter your comment!
Please enter your name here