“Aprite quelle banche dati”

Un codice di condotta condiviso da tutti i gestori dei centinaia di archivi genetici oggi disponibili su Internet. Per permettere a tutti di accedere alle informazioni custodite nei data base. È questa la proposta avanzata sull’ultimo numero di Nature da Lincoln Stein, un ricercatore del Cold Spring Harbor Laboratory di Long Island, New York. Secondo lo scienziato, infatti, è tempo che la grande quantità di dati resa disponibile dalla genetica molecolare e dai diversi progetti dedicati allo studio del genoma sia distribuita tra i ricercatori in modo più uniforme e coerente. Così da permettere a tutti l’analisi strutturale e funzionale delle informazioni. È stato proprio lo sviluppo tecnologico ha permettere la crescita quantitativa delle basi di dati disponibili per la ricerca, ora però, arrivato il momento dell’analisi, gli utenti si scontrano con ostacoli insormontabili. Un esempio: il formato digitale dei dati che, nel caso di archivi gestiti dall’industria privata, sono compattati in codici proprietari, impossibili quindi da utilizzare se non da coloro che hanno programmi sviluppati da quella stessa azienda. Secondo il ricercatore americano, se la bioinformatica vuole realizzare le promesse terapeutiche e scientifiche dichiarate, è tempo che elabori strategie efficaci di condivisione dei dati. Per far questo dovrebbe prendere spunto dal World Wide Web, una rete che utilizza protocolli e interfacce condivisi, in cui ogni utente, o ogni azienda, può accedere a informazioni di altri e rendere disponibili le proprie a tutti.

Nel campo della bioinformatica – la disciplina che unisce le competenze di biologia, matematica, informatica e ingegneria per comprendere, generare, elaborare e distribuire l’informazione biologica – diversi gruppi rivali, tanto pubblici che privati, propongono i propri siti web e archivi, con servizi e formati per l’informazione biologica digitale. Tutti diversi fra loro. Così i ricercatori, per analizzare dati che risiedono su server differenti, con formati e metodi di accesso specifici, elaborano programmi ad hoc che copiano solo alcuni dati, quelli indicati di volta in volta come interessanti, e poi li traducono nel formato scelto dall’utente. Incrociare, comparare, manipolare le informazioni genetiche sugli organismi modello diventa quindi un’impresa tutt’altro che semplice. Eppure è una delle attività centrali per la nuova genetica. L’utilizzo dei computer e di programmi informatici dedicati alla biologia aiuta si a decifrare la funzione dei geni e delle proteine degli organismi studiati, ma procedure isolate ed elaborate ad hoc possono essere sufficienti solo per archivi piccoli. Non lo sono più per il grado di flessibilità e integrazione necessario alla ricerca attuale. Basti pensare che l’European Molecular Biology Laboratory, l’archivio pubblico europeo, contiene oggi sequenze complessive per oltre 17 miliardi di nucleotidi. Alla difficoltà di sviluppare una competenza informatica adatta per analizzare una mole tanto imponente di informazioni si aggiunge poi quella della comparazione di geni o proteine appartenenti a specie diverse e conservati magari in banche dati differenti. Ecco perché i bioinformatici cercano di sviluppare uno standard e una nomenclatura comune per collegare gli archivi, in modo che ogni ricercatore ne possa consultare contemporaneamente e in modo significativo il maggior numero possibile.

Ma Stein sottolinea anche un altro problema: i data base sono pensati per essere consultati dagli esseri umani e non dalle macchine. Attività semplici, come spostare un link o modificare la grafica delle pagine web, rendono subito inservibili i programmi calibrati sulla ricerca automatizzata di dati puri. Ecco perché molti ricercatori bioinformatici passano più tempo ad aggiornare i propri software di accesso ai dati che ad analizzare le informazioni in profondità insieme ai colleghi. Da qui l’idea di elaborare un modello di gestione degli archivi basato sul web che permetta l’accesso dei ricercatori a più di un data base e renda l’analisi e l’aggregazione dei dati semplice, affidabile e automatizzata.

Admin

Articoli recenti

Una modifica al paradosso di Schrödinger per conciliare quantistica e relatività

Un gruppo di fisici dell’Università di Trieste (e di altri istituti) ha proposto una sorta…

15 ore fa

Il talco può aumentare il rischio di tumore?

Il colosso farmaceutico Johnson & Johnson pagherà 6,5 miliardi di dollari per chiudere le cause…

5 giorni fa

Mesotelioma, 9 casi su 10 sono dovuti all’amianto

Si tratta di una patologia rara e difficile da trattare. Colpisce prevalentemente gli uomini e…

1 settimana fa

Uno dei più misteriosi manoscritti medioevali potrebbe essere stato finalmente decifrato

Secondo gli autori di un recente studio potrebbe contenere informazioni sul sesso e sul concepimento,…

2 settimane fa

Ripresa la comunicazione con la sonda Voyager 1

Dopo il segnale incomprensibile, gli scienziati hanno riparato il danno a uno dei computer di…

2 settimane fa

Atrofia muscolare spinale, ampliati i criteri di rimborsabilità della terapia genica

L’Aifa ha approvato l’estensione della rimborsabilità del trattamento, che era già stato approvato per l'atrofia…

2 settimane fa

Questo sito o gli strumenti di terze parti in esso integrati trattano dati personali (es. dati di navigazione o indirizzi IP) e fanno uso di cookie o altri identificatori necessari per il funzionamento e per il raggiungimento delle finalità descritte nella cookie policy.

Leggi di più