Giovedì Google ha rilasciato il suo ultimo modello di ragionamento principale, Gemini 3.1 Professional. Google afferma che Gemini 3.1 Professional ha raggiunto il doppio delle prestazioni verificate di 3 Professional su ARC-AGI-2, un benchmark popolare che misura il ragionamento logico di un modello.
Google ha originariamente rilasciato Gemini 3 e 3 Professional a novembre e questa nuova versione mostra la velocità con cui le aziende di intelligenza artificiale stanno introducendo modelli nuovi e aggiornati. Gemini 3.1 Professional è il nuovo modello core alla base di Gemini e di vari strumenti di intelligenza artificiale di Google, come Gemini 3 Deep Suppose. Google afferma che è progettato per fornire soluzioni più inventive.
“3.1 Professional è progettato per attività in cui una semplice risposta non è sufficiente, prendendo ragionamenti avanzati e rendendoli utili per le sfide più difficili,” a Post del blog di Google stati. “Questa intelligenza migliorata può aiutare nelle applicazioni pratiche, sia che tu stia cercando una spiegazione visiva chiara di un argomento complesso, un modo per sintetizzare i dati in un’unica visualizzazione o dare vita a un progetto creativo.”
GPT-5.2 vs Gemini 3: confronto tra i due modelli più pesanti in termini di benchmark, prezzo e set di funzionalità
Ecco tutto ciò che sappiamo finora su Gemini 3.1 Professional, incluso come si confronta con gli ultimi modelli di Anthropic e OpenAI e come provarlo tu stesso.
Come provare Gemini 3.1 Professional
A partire da oggi, Google distribuirà Gemini 3.1 Professional nell’app Gemini, Gemini APIA e in Pocket book LM. Gli utenti gratuiti potranno provare 3.1 Professional nell’app Gemini, ma gli utenti a pagamento sui piani Google AI Professional e AI Extremely avranno tassi di utilizzo più elevati. All’interno di Pocket book LM, solo gli utenti a pagamento avranno accesso almeno alla versione 3.1 Professional, per ora. I programmatori e gli utenti aziendali possono anche accedere al nuovo modello principale tramite gli sviluppatori e le aziende possono accedere alla versione 3.1 tramite AI Studio, Antigravity, Vertex AI, Gemini Enterprise, Gemini CLI e Android Studio.
Velocità della luce mashable
Gemini 3.1 Professional period già disponibile per gli editor Mashable che utilizzavano Gemini. Per provarlo tu stesso, vai su Gemelli sul desktop oppure apri l’app cellular Gemini.
Sinistra:
Due risultati della stessa richiesta di animazione.
Credito: Google
Giusto:
Credito: Google
Perché Gemini 3.1 Professional è importante
Quando Google ha rilasciato Gemini 3 Professional a novembre, il modello period così impressionante che presumibilmente ha indotto il CEO di OpenAI Sam Altman a dichiarare un codice rosso. Quando Gemini 3 Professional è salito in cima alle classifiche AI, secondo quanto riferito OpenAI ha iniziato a perdere utenti ChatGPT a favore di Gemini. L’ultimo modello principale di ChatGPT, GPT-5.2, è crollato nelle classifiche classifiche come Arena (precedentemente noto come LMArena), perdendo terreno significativo rispetto a concorrenti come Google, Anthropic e xAI.
Questo Tweet non è al momento disponibile. Potrebbe essere in fase di caricamento o è stato rimosso.
Gemini 3 Professional stava già superando GPT-5.2 su molti benchmark e, con un modello di pensiero più avanzato, Gemini potrebbe andare ancora più avanti.
Gemini 3.1 Professional: prestazioni di riferimento
Google ha rilasciato dati di riferimento sulle prestazioni che mostrano che Gemini 3.1 Professional supera i precedenti modelli Gemini, Claude Sonnet 4.6, Claude Opus 4.6 e GPT-5.2. Tuttavia, secondo Google stesso, il nuovo modello di codifica di OpenAI, GPT-5.3-Codex, ha battuto Gemini 3.1 Professional nel benchmark verificato SWE-Bench Professional.
I punti salienti dei risultati benchmark di Gemini 3.1 Professional includono:
-
44,4% all’ultimo esame dell’Umanitàrispetto al 40,0% di Claude Opus 4.6 e al 34,5% di GPT-5.2
-
77,1% su ARC-AGI-2rispetto al 31,1% di Gemini 3 Professional, al 68,8% di Claude Opus 4.6 e al 52,9% di GPT-5.2
-
94,3% su GPQA Diamondrispetto al 91,9% di Gemini 3 Professional, al 91,3% di Claude Opus 4.6 e al 92,4% di GPT-5.2
-
80,6% su SWE-Bench Verificatorispetto al 76,2% di Gemini 3 Professional, all’80,8% di Claude Opus 4.6 e all’80,0% di GPT-5.2
-
54,2% su SWE-Bench Professional (pubblico)rispetto al 43,3% di Gemini 3 Professional, al 55,6% di GPT-5.2 e al 56,8% di GPT-5.3-Codex
-
92,6% su MMLUrispetto al 91,1% di Claude Opus 4.6 e all’89,6% di GPT-5.2
Google ha rilasciato un’immagine che mostra i risultati completi dei benchmark per Gemini 3.1 Professional:
Questo Tweet non è al momento disponibile. Potrebbe essere in fase di caricamento o è stato rimosso.
Divulgazione: Ziff Davis, la società madre di Mashable, nell’aprile 2025 ha intentato una causa contro OpenAI, sostenendo di aver violato i diritti d’autore di Ziff Davis nella formazione e nel funzionamento dei suoi sistemi di intelligenza artificiale.











