Cdc è la sigla di Centers for Disease Control and Prevention. È il principale centro di ricerca statunitense, e forse del mondo, sulle malattie infettive. Tra i suoi compiti c’è anche quello di fornire previsioni sull’evoluzione dell’epidemia di Covid-19, facendosi aiutare da una cinquantina di gruppi di ricerca universitari, agenzie governative, società di consulenza, che ogni lunedì entro le 18 inviano le previsioni su casi positivi, ricoveri e decessi associati al Covid-19 per le settimane successive. Calcolando la media di tutte queste previsioni il Cdc è stato in grado di anticipare l’andamento della pandemia con buona approssimazione.

MA CHI SONO gli scienziati più bravi nelle previsioni, tra quelli consultati dal Cdc? L’esperto di statistica medica Nicholas Reich dell’università del Massachusetts ha confrontato le previsioni inviate al Cdc con i dati reali. Alla fine, il vincitore di questa speciale competizione non è stato un team di ricercatori accademici o un centro studi privato ma il dilettante Youyang Gu, un informatico ventisettenne nato in Cina e arrivato negli Usa all’età di 7 anni, laureato al Mit di Boston e senza alcuna esperienza in campo sanitario. Le sue previsioni non giungevano al Cdc da un laboratorio di ricerca, ma dalla cameretta della casa di Santa Clara dei suoi genitori dove a marzo 2020, dopo un paio d’anni di lavoro come analista finanziario a New York, Gu era stato sorpreso dal lockdown.

In realtà, fino al mese di maggio Gu al Cdc era un perfetto sconosciuto. Inizialmente, i suoi pronostici circolavano solo su Twitter. I suoi follower avevano notato subito che erano più corretti di quelli ufficiali che circolavano sui media. Ad esempio, più di quelli dell’Institute for Health Metrics and Evaluation (Ihme), un centro di ricerca dell’università di Washington nelle cui ottimistiche previsioni Donald Trump confidava molto. Nelle previsioni di aprile, l’Ihme stimava che l’epidemia sarebbe finita entro luglio e che il numero dei morti negli Usa non avrebbe superato quota 80 mila per tutto il 2020. Secondo Gu, invece, per toccare quella soglia bastava attendere il 9 maggio. Non sbagliava: quel giorno i decessi registrati ufficialmente sono stati 79.926.

Dopo le prime previsioni azzeccate, l’interesse intorno al lavoro di Gu è cresciuto fino a raggiungere la comunità scientifica ufficiale: alla fine di aprile il biologo Carl Bergstrom dell’università di Washington e lo stesso Reich hanno suggerito al Cdc di includerlo tra gli esperti da consultare. Entrato nel giro, il giovane informatico ha finito per partecipare regolarmente alle riunioni dei massimi esperti sulla gestione della pandemia anche in campo internazionale: grazie alla sua bravura con i dati, l’Organizzazione Mondiale della Sanità lo ha reclutato nella commissione tecnica incaricata di stimare la mortalità del Covid-19. A fianco a lui, scienziati di livello mondiale che per le loro previsioni si appoggiano a gruppi di ricerca composti da decine di persone. Gu invece dispone di un solo assistente (il suo computer) ma non gli serve molto altro.

IL SUO ALGORITMO, infatti, è piuttosto semplice. Simula una pandemia secondo uno schema classico per l’epidemiologia, il cosiddetto modello Seir in cui ogni individuo è un nodo di una rete e può trovarsi nello stato di “suscettibile” (al virus), “esposto”, “infetto” o “guarito” (in inglese recovered). Fin qui niente di originale: è il metodo più usato nel campo e dipende da una serie di parametri. Per stimarli, però, Youyang Gu si affida al machine learning, e questo rappresenta il segreto del suo successo. «Probabilmente – spiega Gu al manifesto – non ci sono molti esperti di malattie infettive con un’expertise nel campo del machine learning».

Anche il machine learning è un modello: è un’intelligenza artificiale riprodotta al computer che, ispirandosi ai neuroni veri e propri, usa i dati del passato per prevedere quelli futuri. Per la pandemia, Gu non ha usato i dati ufficiali, ma quelli pubblicati dal Covid Tracking Project, un altro progetto animato su base volontaria da centinaia di utenti via internet. Un modello così architettato è in grado di realizzare «calcoli veloci con risorse limitate», come spiega Gu: «Tutte le proiezioni possono essere generate in meno di mezz’ora su un computer portatile». Per chi vuole cimentarsi, tutto il software è open source e gratuitamente scaricabile dal web.

Al sito Bloomberg Businessweek, il direttore dell’Ihme Christopher Murray ha provato a spiegare che il modello di Gu «funziona bene nelle previsioni a breve termine ma non è in grado di capire quello che succede. Gli algoritmi basati sul passato non possono tenere conto delle varianti virali e dell’impatto dei vaccini su di esse». Non è l’unico a pensarla così: in tanti paragonano il machine learning a un oracolo, che azzecca i pronostici ma non consente di capire come funziona il sistema su cui si effettuano le previsioni – nel caso in questione, una pandemia. Sviluppare una teoria scientifica è un’altra cosa? «Gli unici esperti che la pensano così sono quelli che non capiscono il machine learning» taglia corto Gu, con un pizzico di presunzione forse motivata da qualche sassolino rimasto nella scarpa. «Apprezzo moltissimo quando un esperto dà un giudizio positivo al mio lavoro. I commenti peggiori invece vengono da chi mi considera un opportunista che ha sfruttato la pandemia. Cerco di prenderla dal lato positivo: ho visto un’occasione per mettere le mie competenze a disposizione di tutti, e l’ho colta».

NONOSTANTE I SUCCESSI, dopo sei mesi di cifre azzeccate Gu a novembre 2020 ha smesso di pubblicare le sue previsioni perché, semplicemente, non ce n’è più bisogno. «A marzo e aprile 2020 ero stupito dall’assenza di modelli di alta qualità citati sui media. Le previsioni variavano tra i 60 mila e i 2,2 milioni di morti negli Usa entro agosto» ha scritto sul suo blog. «Nei mesi successivi sono emersi diversi altri modelli accurati. Perciò, è il momento giusto per smettere». Anche perché il progetto è nato quasi per hobby. «Per sviluppare il modello ho usato solo un computer portatile, un account su Twitter e venti dollari per comprare il dominio covid19-projections.com». Quando ha chiesto un supporto ai suoi follower, però, ha ricevuto 52 mila dollari di donazioni.

Dopo aver smesso di fare previsioni, Gu si è dedicato a stimare il vero numero di contagiati – anche negli Usa i tamponi ne rivelano solo una piccola parte – e al monitoraggio delle vaccinazioni. Ma il 7 marzo ha interrotto anche questi progetti, con l’ultima previsione di un ritorno alla normalità per gli Usa in estate. «Tocca agli epidemiologi e alla comunità scientifica nel suo complesso sviluppare modelli e previsioni dell’andamento del Covid-19» spiega. Nuovi progetti? «Non so ancora» risponde da New York, dove nel frattempo è tornato. «Mi prenderò del tempo per pensarci».

LA STORIA DI GU sembra perfetta per un film sul sogno americano. Alla televisione Abc ha confessato: «Non riesco a pensare a molti altri paesi in cui il lavoro di un immigrato ventisettenne senza esperienza possa ottenere l’attenzione e il rispetto degli scienziati e del pubblico».

Potrebbe mai succedere in Italia? Il lettore avrà notato le somiglianze con la storia di Alberto Giovanni Gerli, quarantenne esperto di illuminazione stradale e del gioco del bridge catapultato nel comitato tecnico scientifico italiano grazie a modelli matematici spesso sbagliati ma apprezzati dall’amministrazione lombarda per l’inguaribile ottimismo. Entrambi sono stati ammessi al tavolo degli esperti in assenza di curriculum e, con tempi e circostanze diverse, hanno poi fatto un passo indietro. Ma tra i due autodidatti di successo ci sono anche grandi differenze. Gu a quel tavolo si è seduto grazie al riconoscimento della comunità scientifica, che non ha badato al passaporto né a quanto le sue cifre supportassero le politiche della Casa Bianca. Gerli invece è tuttora un perfetto sconosciuto per chi si occupa professionalmente di epidemiologia, e le sue previsioni sono servite soprattutto ad assecondare i piani anti-pandemia di amministratori incapaci.