“Aprite quelle banche dati”

    Un codice di condotta condiviso da tutti i gestori dei centinaia di archivi genetici oggi disponibili su Internet. Per permettere a tutti di accedere alle informazioni custodite nei data base. È questa la proposta avanzata sull’ultimo numero di Nature da Lincoln Stein, un ricercatore del Cold Spring Harbor Laboratory di Long Island, New York. Secondo lo scienziato, infatti, è tempo che la grande quantità di dati resa disponibile dalla genetica molecolare e dai diversi progetti dedicati allo studio del genoma sia distribuita tra i ricercatori in modo più uniforme e coerente. Così da permettere a tutti l’analisi strutturale e funzionale delle informazioni. È stato proprio lo sviluppo tecnologico ha permettere la crescita quantitativa delle basi di dati disponibili per la ricerca, ora però, arrivato il momento dell’analisi, gli utenti si scontrano con ostacoli insormontabili. Un esempio: il formato digitale dei dati che, nel caso di archivi gestiti dall’industria privata, sono compattati in codici proprietari, impossibili quindi da utilizzare se non da coloro che hanno programmi sviluppati da quella stessa azienda. Secondo il ricercatore americano, se la bioinformatica vuole realizzare le promesse terapeutiche e scientifiche dichiarate, è tempo che elabori strategie efficaci di condivisione dei dati. Per far questo dovrebbe prendere spunto dal World Wide Web, una rete che utilizza protocolli e interfacce condivisi, in cui ogni utente, o ogni azienda, può accedere a informazioni di altri e rendere disponibili le proprie a tutti.

    Nel campo della bioinformatica – la disciplina che unisce le competenze di biologia, matematica, informatica e ingegneria per comprendere, generare, elaborare e distribuire l’informazione biologica – diversi gruppi rivali, tanto pubblici che privati, propongono i propri siti web e archivi, con servizi e formati per l’informazione biologica digitale. Tutti diversi fra loro. Così i ricercatori, per analizzare dati che risiedono su server differenti, con formati e metodi di accesso specifici, elaborano programmi ad hoc che copiano solo alcuni dati, quelli indicati di volta in volta come interessanti, e poi li traducono nel formato scelto dall’utente. Incrociare, comparare, manipolare le informazioni genetiche sugli organismi modello diventa quindi un’impresa tutt’altro che semplice. Eppure è una delle attività centrali per la nuova genetica. L’utilizzo dei computer e di programmi informatici dedicati alla biologia aiuta si a decifrare la funzione dei geni e delle proteine degli organismi studiati, ma procedure isolate ed elaborate ad hoc possono essere sufficienti solo per archivi piccoli. Non lo sono più per il grado di flessibilità e integrazione necessario alla ricerca attuale. Basti pensare che l’European Molecular Biology Laboratory, l’archivio pubblico europeo, contiene oggi sequenze complessive per oltre 17 miliardi di nucleotidi. Alla difficoltà di sviluppare una competenza informatica adatta per analizzare una mole tanto imponente di informazioni si aggiunge poi quella della comparazione di geni o proteine appartenenti a specie diverse e conservati magari in banche dati differenti. Ecco perché i bioinformatici cercano di sviluppare uno standard e una nomenclatura comune per collegare gli archivi, in modo che ogni ricercatore ne possa consultare contemporaneamente e in modo significativo il maggior numero possibile.

    Ma Stein sottolinea anche un altro problema: i data base sono pensati per essere consultati dagli esseri umani e non dalle macchine. Attività semplici, come spostare un link o modificare la grafica delle pagine web, rendono subito inservibili i programmi calibrati sulla ricerca automatizzata di dati puri. Ecco perché molti ricercatori bioinformatici passano più tempo ad aggiornare i propri software di accesso ai dati che ad analizzare le informazioni in profondità insieme ai colleghi. Da qui l’idea di elaborare un modello di gestione degli archivi basato sul web che permetta l’accesso dei ricercatori a più di un data base e renda l’analisi e l’aggregazione dei dati semplice, affidabile e automatizzata.

    LASCIA UN COMMENTO

    Please enter your comment!
    Please enter your name here