Il database di Twitter aiuterà la ricerca

Ogni giorno nel mondo si scambiano circa 500 milioni di tweet: una mole di dati enorme, che oggi il sito di microblogging ha deciso di offrire per una causa nobile: la scienza. A febbraio la società ha annunciato infatti il lancio di “Twitter Data Grants”, hashtag #DataGrants, un progetto pilota realizzato in collaborazione con Gnip, che permetterà ad un selezionato gruppo di istituti di ricerca di accedere a tutti i dati presenti nei loro database. Dopo aver vagliato oltre 1.300 proposte arrivate da oltre 60 paesi, ad aprile Twitter ha quindi confermato la scelta dei sei istituti che parteciperanno al progetto.

I temi dei progetti scelti sono i più vari: si va da uno studio dell’Harvard Medical School/ Boston Children’s Hospital che indagherà la diffusione delle intossicazioni alimentari, ad una ricerca della Ucsd che mira a scoprire i livelli di felicità di ogni città analizzando le foto postate dagli abitanti, passando per un indagine della University of East London che vuole scoprire se esiste una relazione tra i tweet e i risultati delle gare sportive.

Ora i ricercatori avranno accesso alle banche dati, che contengono tutte le informazioni scambiate su Twitter a partire dal 2006, e presto dovrebbero quindi arrivare i primi risultati delle loro indagini. Nonostante in molti vedano l’iniziativa come il Santo Graal del Big Data per lo studio dei comportamenti umani, c’è anche chi comincia a sollevare i primi dubbi. Un articolo su Scientific American pone ad esempio due domande spinose: Twitter manterrà o diritti legali sulle scoperte? Utilizzare Twitter come strumento di ricerca scientifica può essere considerato etico, dal momento che gli utenti non hanno mai accettato di partecipare agli studi?

In attesa che Twitter decida di chiarire questi punti, un’ipotesi di linee guida pubblicata a febbraio da Caitlin Rivers e Bryan Lewis, due ricercatori di epidemiologia computazionale della Virginia Tech, può dare l’idea del genere di precauzioni che serviranno in futuro, per utilizzare i dati presenti sui social network senza ledere i diritti degli utenti. Nel documento i ricercatori propongono ad esempio che le informazioni raccolte siano sempre utilizzate facendo attenzione al contesto in cui sono state condivise, di mantenere ad ogni costo l’anonimato degli utenti, e di evitare di svolgere ricerche volte a raccogliere informazioni sull’autore prevenienti da altre fonti (come Facebook).

 Via Wired.it