Nel dicembre 2025, la conferenza NeurIPS di San Diego, vetrina autorevole dell’intelligenza artificiale, è stata teatro di una scoperta preoccupante. Un’indagine condotta dalla startup canadese GPTZero ha analizzato 4.841 paper accettati, individuando 100 citazioni “hallucinate” in 51 di essi. Queste citazioni, confermate come inventate, mettono in discussione la solidità del processo accademico, anche ai vertici della ricerca sull'AI.
La scoperta di GPTZero
GPTZero ha esaminato ogni riferimento bibliografico, confrontandolo con banche dati e risorse web.
L'assenza di corrispondenza con autori, titoli, riviste o URL ha fatto scattare un campanello d'allarme. Il risultato è stato la conferma di 100 casi di citazioni false: da paper interamente inventati a modifiche ingannevoli di riferimenti reali, come alterazioni di autori o titoli. Ogni segnalazione è stata valutata manualmente da esperti per evitare falsi positivi.
Il contesto: quantità, velocità e AI
Il problema non sembra isolato. GPTZero aveva già individuato oltre 50 citazioni false nei paper presentati a ICLR 2026, ancora in fase di revisione. L'aumento delle candidature – 21.575 solo per NeurIPS 2025, rispetto alle 15.671 del 2024 e alle 12.343 del 2023 – ha messo a dura prova la peer review, sovraccaricando il sistema.
La risposta di NeurIPS
NeurIPS ha replicato, sottolineando che i revisori sono istruiti a segnalare eventuali “hallucinations” nelle citazioni e che un errore non invalida necessariamente il contenuto del paper. Il board ha osservato che, sebbene solo l’1,1% dei lavori presenti riferimenti errati, il dato resta indicativo della necessità di un’evoluzione delle pratiche.
L'importanza delle citazioni corrette
Le citazioni rappresentano la “moneta” della ricerca, indicando riconoscimento e tracciabilità scientifica. L'utilizzo di lavori inesistenti mina la riproducibilità dei risultati e la trasparenza del metodo. In un contesto in cui l’AI facilita l’output quantitativo, la solidità qualitativa resta il pilastro della reputazione accademica.
La verifica delle fonti è quindi essenziale.
Verso una revisione automatizzata
Il caso evidenzia l’urgenza di integrare strumenti come Hallucination Check nel processo di peer review. GPTZero suggerisce di utilizzarli sin dalla fase di presentazione, per consentire a autori e revisori di correggere errori bibliografici e prevenire il “vibe citing” – citazioni che appaiono reali ma sono frutto di un assemblaggio artificiale.
La sfida è preservare l’efficacia dell’automazione senza sacrificare la credibilità. Se anche ai vertici della ricerca AI si riscontrano errori, è necessaria una risposta coordinata tra conferenze, editori e sviluppatori di strumenti di detection.
La questione è concreta: NeurIPS resta un punto di riferimento per laboratori, aziende e per la disciplina stessa. Forse è il momento di rendere i riferimenti più verificabili che generabili.