Home Tecnologia Google rilascia Gemini 3.1 Professional: benchmark delle prestazioni, come provarlo

Tecnologia

Google rilascia Gemini 3.1 Professional: benchmark delle prestazioni, come provarlo

19 Febbraio 2026

Giovedì Google ha rilasciato il suo ultimo modello di ragionamento principale, Gemini 3.1 Professional. Google afferma che Gemini 3.1 Professional ha raggiunto il doppio delle prestazioni verificate di 3 Professional su ARC-AGI-2, un benchmark popolare che misura il ragionamento logico di un modello.

Google ha originariamente rilasciato Gemini 3 e 3 Professional a novembre e questa nuova versione mostra la velocità con cui le aziende di intelligenza artificiale stanno introducendo modelli nuovi e aggiornati. Gemini 3.1 Professional è il nuovo modello core alla base di Gemini e di vari strumenti di intelligenza artificiale di Google, come Gemini 3 Deep Suppose. Google afferma che è progettato per fornire soluzioni più inventive.

“3.1 Professional è progettato per attività in cui una semplice risposta non è sufficiente, prendendo ragionamenti avanzati e rendendoli utili per le sfide più difficili,” a Post del blog di Google stati. “Questa intelligenza migliorata può aiutare nelle applicazioni pratiche, sia che tu stia cercando una spiegazione visiva chiara di un argomento complesso, un modo per sintetizzare i dati in un’unica visualizzazione o dare vita a un progetto creativo.”

VEDI ANCHE:

GPT-5.2 vs Gemini 3: confronto tra i due modelli più pesanti in termini di benchmark, prezzo e set di funzionalità

Ecco tutto ciò che sappiamo finora su Gemini 3.1 Professional, incluso come si confronta con gli ultimi modelli di Anthropic e OpenAI e come provarlo tu stesso.

Come provare Gemini 3.1 Professional

A partire da oggi, Google distribuirà Gemini 3.1 Professional nell’app Gemini, Gemini APIA e in Pocket book LM. Gli utenti gratuiti potranno provare 3.1 Professional nell’app Gemini, ma gli utenti a pagamento sui piani Google AI Professional e AI Extremely avranno tassi di utilizzo più elevati. All’interno di Pocket book LM, solo gli utenti a pagamento avranno accesso almeno alla versione 3.1 Professional, per ora. I programmatori e gli utenti aziendali possono anche accedere al nuovo modello principale tramite gli sviluppatori e le aziende possono accedere alla versione 3.1 tramite AI Studio, Antigravity, Vertex AI, Gemini Enterprise, Gemini CLI e Android Studio.

Velocità della luce mashable

Gemini 3.1 Professional period già disponibile per gli editor Mashable che utilizzavano Gemini. Per provarlo tu stesso, vai su Gemelli sul desktop oppure apri l’app cellular Gemini.

Sinistra:
Due risultati della stessa richiesta di animazione.
Credito: Google

Giusto:
Credito: Google

Perché Gemini 3.1 Professional è importante

Quando Google ha rilasciato Gemini 3 Professional a novembre, il modello period così impressionante che presumibilmente ha indotto il CEO di OpenAI Sam Altman a dichiarare un codice rosso. Quando Gemini 3 Professional è salito in cima alle classifiche AI, secondo quanto riferito OpenAI ha iniziato a perdere utenti ChatGPT a favore di Gemini. L’ultimo modello principale di ChatGPT, GPT-5.2, è crollato nelle classifiche classifiche come Arena (precedentemente noto come LMArena), perdendo terreno significativo rispetto a concorrenti come Google, Anthropic e xAI.

Questo Tweet non è al momento disponibile. Potrebbe essere in fase di caricamento o è stato rimosso.

Gemini 3 Professional stava già superando GPT-5.2 su molti benchmark e, con un modello di pensiero più avanzato, Gemini potrebbe andare ancora più avanti.

Gemini 3.1 Professional: prestazioni di riferimento

Google ha rilasciato dati di riferimento sulle prestazioni che mostrano che Gemini 3.1 Professional supera i precedenti modelli Gemini, Claude Sonnet 4.6, Claude Opus 4.6 e GPT-5.2. Tuttavia, secondo Google stesso, il nuovo modello di codifica di OpenAI, GPT-5.3-Codex, ha battuto Gemini 3.1 Professional nel benchmark verificato SWE-Bench Professional.

I punti salienti dei risultati benchmark di Gemini 3.1 Professional includono:

44,4% all’ultimo esame dell’Umanitàrispetto al 40,0% di Claude Opus 4.6 e al 34,5% di GPT-5.2
77,1% su ARC-AGI-2rispetto al 31,1% di Gemini 3 Professional, al 68,8% di Claude Opus 4.6 e al 52,9% di GPT-5.2
94,3% su GPQA Diamondrispetto al 91,9% di Gemini 3 Professional, al 91,3% di Claude Opus 4.6 e al 92,4% di GPT-5.2
80,6% su SWE-Bench Verificatorispetto al 76,2% di Gemini 3 Professional, all’80,8% di Claude Opus 4.6 e all’80,0% di GPT-5.2
54,2% su SWE-Bench Professional (pubblico)rispetto al 43,3% di Gemini 3 Professional, al 55,6% di GPT-5.2 e al 56,8% di GPT-5.3-Codex
92,6% su MMLUrispetto al 91,1% di Claude Opus 4.6 e all’89,6% di GPT-5.2

Google ha rilasciato un’immagine che mostra i risultati completi dei benchmark per Gemini 3.1 Professional:

Questo Tweet non è al momento disponibile. Potrebbe essere in fase di caricamento o è stato rimosso.

Divulgazione: Ziff Davis, la società madre di Mashable, nell’aprile 2025 ha intentato una causa contro OpenAI, sostenendo di aver violato i diritti d’autore di Ziff Davis nella formazione e nel funzionamento dei suoi sistemi di intelligenza artificiale.

fonte

Google rilascia Gemini 3.1 Professional: benchmark delle prestazioni, come provarlo

Come provare Gemini 3.1 Professional

Perché Gemini 3.1 Professional è importante

Gemini 3.1 Professional: prestazioni di riferimento

LEAVE A REPLY Cancel reply

Posta recente

Come guardare Stati Uniti vs Slovacchia nell’hockey su ghiaccio maschile on-line...

La star di Gray’s Anatomy Patrick Dempsey spiega perché ha lasciato...

Rick Scott afferma che il principe Andrea dovrà “assolutamente” affrontare il...

Gli alunni del Quebec non sono obbligati a guardare l’hockey del...

Puoi ottenere un nuovo iPhone 13 per soli $ 99 su...

L’attore di Gray’s Anatomy Patrick Dempsey riflette sull’abbandono del dramma medico...

57 chief, un campus: il PSMO Faculty ospita uncommon riunioni politiche

Il Canada perde contro gli Stati Uniti nella finale di hockey...

Come guardare WrestleMania 41 e altri dettagli chiave sulle partite WWE...

Cosa ha scatenato i “Larry Wheels Recordsdata”? Dentro la controversia tra...