Una svolta significativa nel rapporto tra intelligenza artificiale e ricerca matematica emerge da un articolo di TechCrunch del 14 gennaio 2026: i modelli di AI più recenti, come GPT‑5.2 di OpenAI e AlphaEvolve di Gemini, hanno dimostrato capacità sorprendenti nel risolvere problemi avanzati attribuiti al matematico Paul Erdős, notoriamente complessi e rimasti aperti per anni. Questo segna un cambiamento nel ruolo dei modelli linguistici, che iniziano a esplorare la frontiera dell’alta matematica.

La scoperta di Neel Somani e il software Harmonic

Neel Somani, ingegnere del software e ricercatore quant, racconta di aver testato ChatGPT (usando GPT‑5.2) su un problema matematico aperto: in 15 minuti, il modello aveva prodotto una dimostrazione completa, successivamente verificata con uno strumento chiamato Harmonic. Il modello ha citato teoremi come la formula di Legendre, il teorema di Bertrand e lo “Star of David theorem”. Pur attingendo a una dimostrazione simile su MathOverflow del 2013 ideata da Noam Elkies, la dimostrazione presentata da ChatGPT si distingue per completezza e originalità rispetto alla versione umana. Somani rileva che, da Natale, 15 problemi sull’elenco di Erdős sono passati da “aperti” a “risolti”, e in 11 casi si accredita l’intervento di modelli di AI.

Anche il matematico Terence Tao conferma progressi notevoli: in 8 casi i modelli hanno fatto avanzare autonomamente una dimostrazione, mentre in altri 6 hanno costruito su risultati preesistenti, indicando che l’AI sta diventando un attore sempre più rilevante nella ricerca matematica.

Un contesto ricco di precedenti

Questo sviluppo si inserisce in un contesto già fertile di progressi dell’AI nel calcolo matematico avanzato. Nel luglio 2025, i modelli AI di Google e OpenAI ottennero medaglie d’oro all’Olimpiade Internazionale di Matematica (IMO), ovvero soluzioni corrette a cinque problemi su sei, utilizzando strategie di ragionamento naturale invece di formalismi rigidi. Una pietra miliare nel riconoscimento delle capacità logiche dell’AI anche in ambiti competitivi.

Parallelamente, modelli come AlphaProof di DeepMind, descritto da Phys.org in un articolo pubblicato nel novembre 2025, hanno impiegato reinforcement learning su scala massiva (80 milioni di problemi) e tecniche come Test‑Time RL per apprendere strategie di dimostrazione complesse, con risultati accurati e formalmente verificabili.

Le sfide epistemologiche e le critiche

Non mancano però critiche. Il matematico Joel David Hamkins ha definito l’uso degli LLM in ambito matematico come «garbage», sottolineando l’inattendibilità delle loro risposte in contesti rigorosi. Nel 2025, confronti nel settore evidenziarono che GPT‑5 aveva riprodotto soluzioni umane preesistenti, senza generare scoperte autentiche, una critica mossa anche da Demis Hassabis di DeepMind e Yann LeCun di Meta.

La questione è sfociata in definizioni come “embarrassing”.

Verso un nuovo paradigma della matematica assistita

La convergenza di questi sviluppi trasforma l’AI: da strumento di supporto a parte integrante del processo di scoperta matematica. L’aspetto fondamentale non è solo la risoluzione autonoma, quanto la capacità di formalizzare, verificare, completare e generare dimostrazioni. In particolare, strumenti come Harmonic, Lean, e i metodi di formalizzazione assistiti dall’AI stanno rendendo il processo matematico più collaborativo e affidabile.

A livello strategico, il potenziale è duplice: da un lato l’accelerazione della scoperta, soprattutto nei problemi marginali del “long tail” di Erdős; dall’altro, un cambio di paradigma culturale: il fatto che matematici di grande reputazione utilizzino questi strumenti con fiducia ne rappresenta la legittimazione.

Il percorso non è privo di ostacoli: l’AI resta fragile nelle congetture aperte più complesse, il rischio di plagio mascherato da originalità è concreto, e la verifica formale rimane cruciale: i sistemi devono poter spiegare, non solo eseguire.

In prospettiva, la keyword principale, “AI modelli matematici avanzati”, si afferma sempre più: GPT‑5.2 e AlphaEvolve dimostrano che AI e matematica non solo coesistono, ma stanno convergendo verso una frontiera condivisa. La responsabilità degli sviluppatori, la trasparenza nei processi e la solidità formale delle dimostrazioni saranno i pilastri su cui costruire una matematica davvero assistita, ma non surrogata.

Sempre più, l’AI non è il futuro esterno della matematica, ma un suo compagno di viaggio.