Categorie: Società

Culturomics, la genomica applicata alla cultura

Per la sua affinità alla genomica, i ricercatori lo hanno denominato “culturomics”, vale a dire genoma culturale. Ora, dopo quattro anni di lavoro, i frutti di questo ambizioso progetto, nato dalla collaborazione tra Università di Harvard, Google, Encyclopaedia Britannica e American Heritage Dictionary, sono stati descritti in un articolo apparso sull’ultimo numero di Science. Si tratta di un set di dati estremamente potente, costruito a partire da 5,2 milioni di volumi e ben 500 miliardi di parole: pari a circa il 4% dei libri ad oggi pubblicati.
“Questo patrimonio digitale – spiegano gli autori – verrà utilizzato secondo criteri quantitativi ripresi, appunto, dalla genomica: servirà per studiare l’evoluzione di una serie di fenomeni culturali e storici, sulla base dei cambiamenti nella frequenza dei termini usati nel corso di secoli e decenni”. Con una metafora, è possibile paragonarlo a un “reperto fossile” della cultura umana, riportato in vita grazie alla digitalizzazione dei testi.

“L’interesse per gli approcci computazionali alle scienze umane e sociali risale agli anni Cinquanta”, ha detto Jean-Baptiste Michel, ricercatore presso il Dipartimento di Psicologia e Programmazione per le Dinamiche Evoluzionare di Harvard. “Finora, però, i tentativi di utilizzare i metodi quantitativi nello studio della cultura sono stati ostacolati dalla mancanza di dati appropriati. Adesso, grazie a questo lavoro, abbiamo un grande set di dati, disponibile tramite una interfaccia che è al tempo stesso facile da usare e disponibile gratuitamente a tutti”.

A realizzare questo strumento sono stati gli ingegneri di Google: essenzialmente si tratta di un’interfaccia che consente agli utenti di digitare una parola o una frase, per poi vedere come è cambiata la sua frequenza durante i secoli. “La culturomica estende i confini dell’indagine quantitativa a un ampio spettro di nuovi fenomeni nelle scienze umane e sociali”, ha aggiunto Erez Lieberman Aiden, l’altro autore dell’articolo. “Navigare tra questo patrimonio di dati è un’esperienza affascinante per chiunque sia interessato a capire ciò che ha interessato le persone nei secoli. Inoltre, speriamo che gli accademici delle discipline umanistiche lo trovino uno strumento utile ed efficiente”.

L’insieme dei dati digitali è migliaia di volte più grande rispetto a ogni altro corpus storico collezionato finora. Circa il 72 per cento del testo è in inglese, il resto si divide tra francese, spagnolo, tedesco, cinese, russo ed ebraico. Messe insieme, tutte le lettere compongono una sequenza 1.000 volte più lunga del genoma umano. Se tutti i caratteri venissero disposti in linea retta, si otterrebbe una linea pari a dieci volte la distanza tra il nostro pianeta e la Luna. “Ora che una frazione significativa dei libri del mondo è stata digitalizzata, è possibile per i programmi di analisi computerizzata rivelare trend nascosti in campi come la storia, la cultura, il linguaggio e il pensiero filosofico”, ha concluso Jon Orwant, ingegnere e manager di Google Books.

Riferimento: Science DOI: 10.1126/science.1199644DOI: 10.1126/science.330.6011.1600

Admin

Visualizza i commenti

  • Notevolissimo anche per un altro dettaglio: non c'è neanche una mezza pagina di italiano. Per protesta il governo italiano invierà ad Harvard i ministri Frattini e Bondi.

Articoli recenti

Mesotelioma, 9 casi su 10 sono dovuti all’amianto

Si tratta di una patologia rara e difficile da trattare. Colpisce prevalentemente gli uomini e…

24 ore fa

Uno dei più misteriosi manoscritti medioevali potrebbe essere stato finalmente decifrato

Secondo gli autori di un recente studio potrebbe contenere informazioni sul sesso e sul concepimento,…

4 giorni fa

Ripresa la comunicazione con la sonda Voyager 1

Dopo il segnale incomprensibile, gli scienziati hanno riparato il danno a uno dei computer di…

6 giorni fa

Atrofia muscolare spinale, ampliati i criteri di rimborsabilità della terapia genica

L’Aifa ha approvato l’estensione della rimborsabilità del trattamento, che era già stato approvato per l'atrofia…

7 giorni fa

Così i tardigradi combattono gli effetti delle radiazioni

Resistono alle radiazioni potenziando la loro capacità di riparare i danni al dna. Piccolo aggiornamento…

1 settimana fa

Leptospirosi: perché crescono i casi a New York?

Mai così tanti casi di leptospirosi in un anno dal 2001: a contribuire all’aumento delle…

2 settimane fa

Questo sito o gli strumenti di terze parti in esso integrati trattano dati personali (es. dati di navigazione o indirizzi IP) e fanno uso di cookie o altri identificatori necessari per il funzionamento e per il raggiungimento delle finalità descritte nella cookie policy.

Leggi di più