Lui si chiama Filippo Menolascina, ed è un bioingegnere all’Università di Edinburgo. Insieme ai colleghi del suo gruppo di ricerca ha studiato un disturbo del fegato, la steatoepatite associata a disfunzione metabolica (Mash), cercando di comprendere perché un farmaco usato per il trattamento, il resmetirom, avesse un’efficacia limitata solo su una frazione specifica di pazienti. Il problema è che la letteratura scientifica sul tema è piuttosto vasta e frammentata, e non è facile districarsi e mettere insieme le varie evidenze raccolte finora: a farlo, per Menolascina e colleghi, ci ha pensato Co-Scientist, un sistema basato sull’intelligenza artificiale di Google DeepMind, che ha sintetizzato le evidenze farmacologiche sparse nei database e formulato un’ipotesi molto precisa – per i più curiosi, l’effetto di una molecola, chiamata Nlrp3, che agisce come “ponte” tra infiammazione e metabolismo nella malattia. L’intuizione di Co-Scientist è stata poi verificata sperimentalmente dagli scienziati in carne e ossa, e esemplifica la funzione operativa dello strumento: un motore progettato per supportare gli scienziati nell’individuare collegamenti latenti all’interno di un volume di dati ormai umanamente inafferrabile, e per generare nuove idee sulla base delle evidenze precedenti. Un po’ come se i ricercatori avessero a disposizione un pool di colleghi che scartabellano gli articoli scientifici, si annotano gli spunti più promettenti, si fanno venire in mente idee nuove, le discutono, le valutano, scartano le peggiori e sottopongono le migliori all’attenzione umana.
Come pensa un “co-scienziato”
L’architettura alla base di Co-Scientist è descritta dettagliatamente in un articolo recentemente pubblicato su Nature: il sistema si fonda su una struttura multi-agente alimentata da modelli linguistici di grandi dimensioni (Llm) della famiglia Gemini; ricevuto un obiettivo di ricerca in linguaggio naturale, l’algoritmo riassume lo stato dell’arte e suddivide il carico di lavoro tra agenti specializzati. Anzitutto, un agente di “generazione” esplora la letteratura e formula ipotesi preliminari, e successivamente un agente di “riflessione” funge da revisore paritario indipendente, valutandone in modo rigoroso correttezza, novità e plausibilità logica. Il nucleo logico del sistema è poi valutato da un agente di “ranking”, che organizza un torneo competitivo basato sul sistema di classificazione Elo – quello dei giocatori di scacchi – dove le ipotesi si confrontano sistematicamente attraverso dibattiti scientifici simulati. Infine, un agente di “evoluzione” si occupa di raffinare progressivamente le idee vincitrici: l’aumento mirato delle capacità di calcolo in questa fase iterativa (post-time compute) porta a un incremento quantificabile della qualità e dell’originalità delle proposte finale.
Un algoritmo per il codice
Un secondo studio, sempre pubblicato su Nature, ha presentato un sistema gemello e complementare, denominato Empirical Research Assistance (Era), dedicato invece alla scrittura di codice. Nelle scienze quantitative, lo sviluppo di software personalizzato per analizzare esperimenti computazionali costituisce spesso un grosso collo di bottiglia temporale: Era è progettato per affrontare compiti che possiedono una metrica di valutazione oggettiva (i cosiddetti scorable task) combinando un modello di linguaggio con un algoritmo di ricerca ad albero per esplorare e ottimizzare iterativamente porzioni di codice. I risultati dimostrano che Era è in grado di scrivere software a livello di un esperto di settore, e lo ha dimostrato per esempio nel campo della genomica, dove ha scoperto metodi inediti per l’integrazione di dati di sequenziamento dell’rna a singola cellula, superando le prestazioni degli algoritmi scritti da esseri umani, e dell’epidemiologia, dove ha generato modelli in grado di prevedere le ospedalizzazioni da CoViD-19 rivelatisi più accurati di quelli utilizzati dai Centers for Disease Control and Prevention (Cdc) statunitensi. L’algoritmo, inoltre, ha prodotto soluzioni per l’analisi geospaziale, per la previsione dell’attività neurale nello zebrafish e per la risoluzione numerica di integrali complessi.
Riposizionamento dei farmaci e nuovi bersagli terapeutici
L’architettura di Co-Scientist è stata già sottoposta a verifiche sperimentali in laboratorio (wet-lab) applicate a specifici ambiti biomedici. Nel contesto della ricerca sulla leucemia mieloide acuta, per esempio, il sistema è stato impiegato per il riposizionamento di farmaci, il cosiddetto drug repurposing: Co-Scientist ha individuato candidati autonomi e ha proposto combinazioni sinergiche di molecole che, nei test in vitro su linee cellulari leucemiche, hanno mostrato citotossicità selettiva a concentrazioni clinicamente rilevanti, preservando le cellule sane di controllo. Un’applicazione simile è stata proposta dal gruppo del genetista Gerry Peltz, della Stanford University, per contrastare la fibrosi epatica: su tre farmaci suggeriti dal sistema per bersagliare alterazioni epigenetiche, due hanno dimostrato reale attività anti-fibrotica in organoidi epatici umani, e nelle verifiche di laboratorio hanno bloccato il 91% della risposta cellulare che determina la cicatrizzazione dei tessuti epatici.
Microbiologia, antibiotico-resistenza e biologia dell’invecchiamento
Non finisce qui: le capacità deduttive dell’infrastruttura, infatti, si estendono anche alla biologia di base. In microbiologia, i ricercatori hanno chiesto a Co-Scientist di dedurre il meccanismo molecolare con cui specifiche isole cromosomiche (cf-PICI) riescono a trasferirsi orizzontalmente tra diverse specie batteriche, aggravando il fenomeno dell’antibiotico-resistenza, e senza avere alcun accesso ai risultati sperimentali che erano ancora inediti, Co-Scientist ha correttamente dedotto che i cf-PICI interagiscono con svariate code fagiche per riuscire ad ampliare la gamma di organismi ospiti. Tale ipotesi ha replicato esattamente la scoperta empirica che il team di ricerca indipendente stava per pubblicare nello stesso momento. In campi analoghi, nei laboratori Calico e Abudayyeh-Gootenberg, il sistema ha analizzato vasti screening genetici per proporre fattori in grado di riportare le cellule verso uno stato antecedente alla senescenza; al Mit e ad Harvard, ricercatori come Ritu Raman e Ryan Flynn lo hanno utilizzato per amalgamare dati di ingegneria dei tessuti e biologia dell’rna nella ricerca di approcci innovativi contro la sclerosi laterale amiotrofica. Infine, all’Università di Cambridge, l’immunologa Clare Bryant ha impiegato il sistema IA per restringere in tempi rapidissimi la ricerca delle mutazioni amminoacidiche chiave che permettono il salto di specie dei patogeni animali all’essere umano.
Il ruolo imprescindibile dell’essere umano
Gli autori degli articoli sottolineano categoricamente che lo scopo di queste intelligenze artificiali non è automatizzare l’impresa scientifica, ma integrarsi in un framework collaborativo in cui l’esperto umano mantiene la totale supervisione decisionale, secondo il cosiddetto paradigma scientist-in-the-loop. L’intervento del ricercatore rimane insostituibile nella calibrazione degli obiettivi e, soprattutto, nella validazione sperimentale finale: un’ipotesi formalmente solida in vitro non garantisce l’efficacia in modelli in vivo o la sua traduzione clinica. Occorre evidenziare, infine, anche le criticità intrinseche del sistema: basandosi prettamente sulla letteratura scientifica accessibile in formato open-access, Co-Scientist rischia di omettere studi essenziali chiusi dietro paywall e, inevitabilmente, eredita le distorsioni (bias) della letteratura stessa, come la mancanza cronica di dati negativi o l’inclusione di risultati non riproducibili; non scompare, inoltre, il rischio di “allucinazioni” inerente alla natura stocastica dei modelli linguistici. Ragioni per cui, per preservare le fondamenta del metodo scientifico, resta indispensabile un vaglio critico altrettanto rigoroso da parte dello scienziato in carne e ossa.
Immagine: Nano Banana/Gemini





