Home Tecnologia Prime impressioni su Google Gemini 3.1 Professional: un ‘Deep Assume Mini’ con...

Tecnologia

Prime impressioni su Google Gemini 3.1 Professional: un ‘Deep Assume Mini’ con ragionamento regolabile su richiesta

20 Febbraio 2026

Negli ultimi tre mesi, Gemini 3 Professional di Google si è affermato come uno dei modelli di frontiera più capaci disponibili. Ma nel mondo in rapida evoluzione dell’intelligenza artificiale, tre mesi sono una vita e i concorrenti non sono rimasti fermi.

Oggi, Google ha rilasciato Gemelli 3.1 Proun aggiornamento che apporta un’innovazione chiave al modello di potenza dell’azienda: tre livelli di pensiero regolabile che lo trasformano di fatto in una versione leggera del sistema di ragionamento specializzato Deep Assume di Google.

Il rilascio segna la prima volta che Google ha rilasciato un aggiornamento “punto uno” per un modello Gemini, segnalando un cambiamento nella strategia di rilascio dell’azienda da lanci periodici della versione completa advert aggiornamenti incrementali più frequenti. Ancora più importante per i workforce di intelligenza artificiale aziendali che valutano il proprio stack di modelli, il nuovo sistema di pensiero a tre livelli di 3.1 Professional – basso, medio e alto – offre agli sviluppatori e ai chief IT un unico modello in grado di scalare il proprio sforzo di ragionamento in modo dinamico, dalle risposte rapide per domande di routine fino a sessioni di ragionamento approfondito di più minuti per problemi complessi.

Il modello è ora disponibile in anteprima nell’API Gemini tramite Studio sull’intelligenza artificiale di GoogleGemini CLI, la piattaforma di sviluppo agenti di Google Antigravity, Vertex AI, Gemini Enterprise, Android Studio, l’app client Gemini e NotebookLM.

L’effetto ‘Deep Assume Mini’: ragionamento adattabile su richiesta

La caratteristica più importante di Gemini 3.1 Professional non è un singolo numero di riferimento: è l’introduzione di un sistema di livelli di pensiero a tre livelli che offre agli utenti un controllo dettagliato sulla quantità di sforzo computazionale che il modello investe in ciascuna risposta.

Gemini 3 Professional offriva solo due modalità di pensiero: bassa e alta. Il nuovo 3.1 Professional aggiunge un’impostazione media (simile alla precedente alta) e, in modo critico, rivede il significato di “alto”. Se impostato su alto, 3.1 Professional si comporta come una “versione mini di Gemini Deep Assume”, il modello di ragionamento specializzato dell’azienda che period aggiornato proprio la settimana scorsa.

Le implicazioni per l’implementazione aziendale potrebbero essere significative. Invece di instradare le richieste a diversi modelli specializzati in base alla complessità dell’attività – un modello comune ma operativamente oneroso – le organizzazioni possono ora utilizzare un unico endpoint del modello e adattare la profondità del ragionamento in base all’attività da svolgere. Il riepilogo di routine dei documenti può essere eseguito con un pensiero basso con tempi di risposta rapidi, mentre compiti analitici complessi possono essere elevati a un pensiero elevato per un ragionamento di calibro Deep Assume.

Prestazioni di riferimento: ragionamento più che raddoppiato rispetto a 3 Professional

I benchmark pubblicati da Google raccontano una storia di notevoli miglioramenti, in particolare nelle aree affiliate al ragionamento e alla capacità di agire.

Grafico benchmark di Google Gemini 3.1 Professional. Credito: Google

SU ARC-AGI-2un benchmark che valuta la capacità di un modello di risolvere nuovi modelli di ragionamento astratto, ha ottenuto un punteggio di 3.1 Professional 77,1% — più del doppio del 31,1% ottenuto da Gemini 3 Professional e sostanzialmente davanti a Sonnet 4.6 di Anthropic (58,3%) e Opus 4.6 (68,8%). Questo risultato eclissa anche il GPT-5.2 di OpenAI (52,9%).

I guadagni si estendono su tutta la linea. SU L’ultimo esame dell’umanitàun rigoroso punto di riferimento del ragionamento accademico, 3.1 Professional ha ottenuto il 44,4% senza strumenti, rispetto al 37,5% di 3 Professional e davanti sia a Claude Sonnet 4.6 (33,2%) che a Opus 4.6 (40,0%). SU Diamante GPQAuna valutazione delle conoscenze scientifiche, 3.1 Professional ha raggiunto il 94,3%, superando tutti i concorrenti elencati.

Il punto in cui i risultati diventano particolarmente rilevanti per i workforce di intelligenza artificiale aziendali è nei benchmark degli agenti, le valutazioni che misurano il rendimento dei modelli quando vengono forniti strumenti e attività in più fasi, il tipo di lavoro che definisce sempre più le implementazioni di intelligenza artificiale in produzione.

SU Terminale-Bench 2.0che valuta la codifica del terminale agente, 3.1 Professional ha ottenuto un punteggio del 68,5% rispetto al 56,9% del suo predecessore. SU Atlante MCPun benchmark che misura i flussi di lavoro in più fasi utilizzando il Mannequin Context Protocol, 3.1 Professional ha raggiunto il 69,2%: un miglioramento di 15 punti rispetto al 54,1% di 3 Professional e quasi 10 punti in più rispetto sia a Claude che a GPT-5.2. E così by way of SfogliaCompche mette alla prova la capacità di ricerca net degli agenti, 3.1 Professional ha raggiunto l’85,9%, superando il 59,2% di 3 Professional.

Perché Google ha scelto la versione “0.1” e cosa segnala

La decisione relativa al controllo delle versioni è di per sé degna di nota. Le versioni precedenti di Gemini seguivano uno schema di anteprime datate: più anteprime 2.5, advert esempio, prima di raggiungere la disponibilità generale. La scelta di designare questo aggiornamento come 3.1 piuttosto che come un’altra anteprima di 3 Professional suggerisce che Google considera i miglioramenti sufficientemente sostanziali da giustificare un incremento di versione, mentre l’inquadramento del “punto uno” stabilisce le aspettative che si tratti di un’evoluzione, non di una rivoluzione.

Il publish sul weblog di Google afferma che 3.1 Professional si basa direttamente sulle lezioni della serie Gemini Deep Assume, incorporando tecniche sia delle versioni precedenti che di quelle più recenti. I benchmark suggeriscono fortemente che l’apprendimento per rinforzo ha svolto un ruolo centrale nei guadagni, in particolare su compiti come ARC-AGI-2, benchmark di codifica e valutazioni di agenti – esattamente i domini in cui gli ambienti di formazione basati su RL possono fornire chiari segnali di ricompensa.

Il modello viene rilasciato in anteprima piuttosto che come lancio di disponibilità generale, con Google che afferma che continuerà a fare progressi in aree come i flussi di lavoro degli agenti prima di passare alla versione GA completa.

Implicazioni aggressive per lo stack AI aziendale

Per i decisori IT che valutano i fornitori di modelli di frontiera, il rilascio di Gemini 3.1 Professional deve non solo indurli a riconsiderare quali modelli scegliere, ma anche a come adattarsi a un ritmo di cambiamento così rapido per i propri prodotti e servizi.

La domanda ora è se questo rilascio scatenerà una risposta da parte dei concorrenti. Il lancio originale di Gemini 3 Professional lo scorso novembre ha dato il by way of a un’ondata di rilasci di modelli sia negli ecosistemi proprietari che in quelli open-weight.

Con 3.1 Professional che rivendica la management nei benchmark in various categorie critiche, la pressione è su Anthropic, OpenAI e sulla comunità open-weight affinché rispondano – e nell’attuale panorama dell’IA, story risposta è probabilmente misurata in settimane, non in mesi.

Disponibilità

Gemini 3.1 Professional è ora disponibile in anteprima tramite il API Gemelli in Google AI Studio, Gemini CLI, Google Antigravity e Android Studio per gli sviluppatori. I clienti aziendali possono accedervi tramite IA del vertice E Impresa Gemelli. I consumatori con piani Google AI Professional e Extremely possono accedervi tramite l’app Gemini e NotebookLM.

fonte

Prime impressioni su Google Gemini 3.1 Professional: un ‘Deep Assume Mini’ con ragionamento regolabile su richiesta

L’effetto ‘Deep Assume Mini’: ragionamento adattabile su richiesta

Prestazioni di riferimento: ragionamento più che raddoppiato rispetto a 3 Professional

Perché Google ha scelto la versione “0.1” e cosa segnala

Implicazioni aggressive per lo stack AI aziendale

Disponibilità

LEAVE A REPLY Cancel reply

Posta recente

Sinner esce dal Qatar Open mentre l’Alcaraz passa alle semifinali

Il proiettile scoperto su un aereo commerciale in un importante aeroporto...

Trae Younger più vicino al debutto dei Wizards, Anthony Davis in...

Una taglia di 10.000 dollari attende chiunque riesca advert hackerare le...

L’Iran ha più esercitazioni con la Russia

Senza la stella più grande, i Bucks cercano di continuare a...

Trailer di Toy Story 5: Woody e Buzz si riuniscono per...

Il vincitore del Grammy porta il nation tradizionale a un nuovo...

Wooden: la rivincita di Warrington potrebbe essere il mio ultimo incontro

Helen Flanagan cube che “la vita amorosa è a brandelli” mentre...