Durante il tremendous settimana, Neel Somani, ingegnere del software program, ex ricercatore quantistico e fondatore di startup, stava testando le abilità matematiche del nuovo modello di OpenAI quando ha fatto una scoperta inaspettata. Dopo aver incollato il problema in ChatGPT e averlo lasciato riflettere per 15 minuti, è tornato a una soluzione completa. Ha valutato la dimostrazione e l’ha formalizzata con uno strumento chiamato Harmonic, ma tutto ha funzionato.
“Ero curioso di stabilire un punto di riferimento per quando gli LLM sono effettivamente in grado di risolvere problemi di matematica aperti rispetto a quelli in cui hanno difficoltà”, ha detto Somani. La sorpresa è stata che, utilizzando l’ultimo modello, la frontiera ha iniziato advert avanzare un po’.
ChatGPT catena di pensiero è ancora più impressionante, snocciolando assiomi matematici come La formula di Legendre, Postulato di BertrandE il teorema della Stella di David. Alla tremendous, il modello trovato un post di Math Overflow del 2013dove il matematico di Harvard Noam Elkies aveva dato una soluzione elegante a un problema simile. Ma la dimostrazione finale di ChatGPT differiva dal lavoro di Elkies in modi importanti e ha fornito una soluzione più completa a una versione del problema posto dal leggendario matematico Paul Erdős, la cui vasta raccolta di problemi irrisolti è diventata un banco di prova per l’intelligenza artificiale.
Per chiunque sia scettico nei confronti dell’intelligenza artificiale, è un risultato sorprendente – e non è l’unico. Gli strumenti di intelligenza artificiale sono diventati onnipresenti in matematica, dai LLM orientati alla formalizzazione come Aristotele di Harmonic agli strumenti di revisione della letteratura come la ricerca approfondita di OpenAI. Ma dal rilascio di GPT 5.2 – che Somani descrive come “aneddoticamente più abile nel ragionamento matematico rispetto alle iterazioni precedenti” – l’enorme quantity di problemi risolti è diventato difficile da ignorare, sollevando nuove domande sulla capacità dei grandi modelli linguistici di ampliare le frontiere della conoscenza umana.
Somani stava esaminando i problemi di Erdős, un insieme di oltre mille congetture del matematico ungherese che sono mantenuto in linea. I problemi sono diventati un obiettivo allettante per la matematica basata sull’intelligenza artificiale, variando in modo significativo sia in termini di argomenti che di difficoltà. Il primo lotto di soluzioni autonome è arrivato a novembre da un modello alimentato da Gemini chiamato AlphaEvolve – ma più recentemente, Somani e altri hanno scoperto che GPT 5.2 è straordinariamente abile con la matematica di alto livello.
Da Natale, 15 problemi sono stati spostati da “aperti” a “risolti” sul sito net di Erdős – e 11 delle soluzioni hanno specificamente accreditato i modelli di intelligenza artificiale come coinvolti nel processo.
Il venerato matematico Terence Tao ha uno sguardo più sfumato sul progresso sulla sua pagina GitHubcontando otto diversi problemi in cui i modelli di intelligenza artificiale hanno compiuto progressi autonomi significativi su un problema di Erdős, con altri sei casi in cui i progressi sono stati compiuti individuando e basandosi su ricerche precedenti. C’è molta strada da fare prima che i sistemi di intelligenza artificiale siano in grado di fare calcoli senza l’intervento umano, ma è chiaro che i modelli di grandi dimensioni svolgono un ruolo importante.
Evento Techcrunch
San Francisco
|
13-15 ottobre 2026
Su MastodonteTao ha ipotizzato che la natura scalabile dei sistemi di intelligenza artificiale li renda “più adatti per essere applicati sistematicamente alla ‘coda lunga’ degli oscuri problemi di Erdős, molti dei quali in realtà hanno soluzioni semplici”.
“In quanto tali, molti di questi problemi più semplici di Erdős hanno ora maggiori probabilità di essere risolti con metodi puramente basati sull’intelligenza artificiale che con mezzi umani o ibridi”, ha continuato Tao.
Un’altra forza trainante è il recente spostamento verso la formalizzazione, un compito advert alta intensità di lavoro che rende il ragionamento matematico più facile da verificare ed estendere. La formalizzazione non richiede l’uso dell’intelligenza artificiale e nemmeno dei laptop, ma una nuova serie di strumenti automatizzati ha reso il processo molto più semplice. L'”assistente alle show” open supply Lean, sviluppato presso Microsoft Analysis nel 2013, è diventato ampiamente utilizzato nel settore come modo per formalizzare le show e strumenti di intelligenza artificiale come Aristotele di Harmonic promettono di automatizzare gran parte del lavoro di formalizzazione.
Per il fondatore di Harmonic Tudor Achim, l’improvviso aumento dei problemi di Erdős risolti è meno importante del fatto che i più grandi matematici del mondo stanno iniziando a prendere sul serio questi strumenti. “Mi interessa di più il fatto che i professori di matematica e informatica utilizzino [AI tools]”, ha detto Achim. “Queste persone hanno una reputazione da proteggere, quindi quando dicono di usare Aristotele o di usare ChatGPT, questa è una prova reale.”












