Segui ZDNET: Aggiungici come fonte preferita su Google.
I principali punti salienti di ZDNET
- Gemini 3.1 Professional è ora disponibile.
- Si basa sul progresso benchmark Gemini 3 stabilito per Google.
- Le capacità del modello sono in definitiva relative, ha detto un esperto.
Un’altra settimana, un altro modello “più intelligente” – questa volta da Google, che ha appena rilasciato Gemini 3.1 Professional.
Gemini 3 ha sovraperformato diversi modelli della concorrenza sin dal suo rilascio a novembre, battendo Copilot in alcuni dei nostri take a look at interni e in generale ha ricevuto elogi dagli utenti. Google ha affermato che l’ultimo modello Gemini, annunciato giovedì, ha ottenuto “più del doppio delle prestazioni di ragionamento di 3 Professional” nei take a look at, sulla base del punteggio del 77,1% sul benchmark ARC-AGI-2 per “modelli logici completamente nuovi”.
Inoltre: Gemini vs. Copilot: ho confrontato gli strumenti di intelligenza artificiale su 7 attività quotidiane e c’è un chiaro vincitore
L’ultimo modello segue un “importante aggiornamento” di Gemini 3 Deep Suppose della scorsa settimana, che vantava nuove capacità in chimica e fisica insieme a nuovi risultati in matematica e programmazione, secondo Google. L’azienda disse l’aggiornamento Gemini 3 Deep Suppose è stato creato per affrontare “sfide di ricerca difficili, dove i problemi spesso mancano di barriere chiare o di un’unica soluzione corretta e i dati sono spesso disordinati o incompleti”. Google ha affermato che Gemini 3.1 Professional sostiene questo investimento pesante dal punto di vista scientifico, definendo il modello “l’intelligenza di base aggiornata che rende possibili tali scoperte”.
Alla effective dello scorso anno, Gemini 3 ha segnato un nuovo massimo del 38,3% tra tutti i modelli attualmente disponibili nel take a look at benchmark Humanity’s Final Examination (HLE). Sviluppato per contrastare benchmark customary di settore sempre più superabili e misurare meglio i progressi del modello rispetto alle capacità umane, l’HLE è pensato per essere un take a look at più rigoroso, sebbene i benchmark da soli non siano sufficienti per determinare le prestazioni.
Secondo Google, Gemini 3.1 Professional ora supera quel punteggio con il 44,4%. L’aggiornamento Deep Suppose tecnicamente ha ottenuto un punteggio più alto, pari al 48,4%, ma è una modalità, piuttosto che un modello di intelligenza artificiale in sé, e quindi sfrutta tempi di inferenza più lunghi per prestazioni di ragionamento più forti. Allo stesso modo, l’aggiornamento Deep Suppose ha ottenuto un punteggio dell’84,6% – superiore al già citato 77,1% di 3.1 Professional – sul benchmark logico ARC-AGI-2.
Inoltre: La realizzazione di Gemini 3: come l’approccio lento e costante di Google ha vinto la corsa all’intelligenza artificiale (per ora)
Poiché 3.1 Professional è progettato per l’uso quotidiano, i suoi parametri di riferimento sono ancora notevoli se confrontati con quelli di Deep Suppose, considerando che la modalità è per attività scientifiche e ingegneristiche più pesanti.
Detto questo, Claude Opus 4.6 di Anthropic è ancora in cima alla capacità di testo del Middle for AI Security (CAIS) classifica (per ragionamenti e altre question basate su testo), che calcola la media di altri punteggi di benchmark rilevanti al di fuori dell’HLE. Opus 4.5, Sonnet 4.5 e Opus 4.6 di Anthropic battono Gemini 3 anche in termini di sicurezza, secondo la classifica di valutazione del rischio CAIS.
Gestione dell’hype
A parte i document di benchmark, il ciclo di vita di un modello non termina con un rilascio clamoroso. Al ritmo attuale di sviluppo dell’intelligenza artificiale, i nuovi modelli sono impressionanti solo in termini relativi alla concorrenza: il tempo e i take a look at diranno dove il 3.1 Professional eccelle o fallisce. Gemini 3 fornisce al nuovo modello una solida base, ma ciò potrebbe durare solo fino a quando il prossimo laboratorio non rilascerà un aggiornamento all’avanguardia.
Inoltre: all’interno del piano AI di Google per porre effective alla fatica degli sviluppatori Android e accelerare l’innovazione
“I numeri dei take a look at sembrano implicare che ci siano miglioramenti sostanziali rispetto a Gemini 3, e Gemini 3 period abbastanza buono, ma non penso che lo sapremo davvero subito, e non è ancora disponibile tranne che per i piani più costosi,” ha detto David Gewirtz, redattore senior di ZDNET, del rilascio. “La scarpa non è ancora caduta nemmeno su GPT 5.3, e penso che quando lo farà, avremo una serie di aggiornamenti più universali a cui possiamo rivolgerci.”
Mentre aspettiamo che quel modello venga abbandonato, Gewirtz ha esaminato GPT-5.3-Codex, la versione più recente specifica per la codifica di OpenAI, che notoriamente ha contribuito a costruirsi da sola.
Provalo tu stesso
Gli sviluppatori possono accedere a Gemini 3.1 Professional in anteprima oggi tramite l’API in AI Studio di Google, Android Studio, Google Antigravity e Gemini CLI. I clienti aziendali possono provarlo in Vertex AI e Gemini Enterprise, mentre gli utenti regolari possono trovarlo in NotebookLM e nell’app Gemini.












