Galileo Giornale di scienza e problemi globali

02 Settembre 2010 | ultimo aggiornamento 43 minuti fa
Temi fisica e matematica

A ogni parola il suo valore

0
Pubblicato il 24 Agosto 2009 14:59

Individuare immediatamente le parole chiave di un testo sconosciuto, quelle che ne indicano il contenuto, è il sogno di ogni studioso di testi antichi e sconosciuti. Un sogno da oggi più realizzabile grazie al metodo matematico messo a punto da alcuni ricercatori dell’Università di Manchester che assegna a ogni parola un “valore informativo” e identifica così i termini più significativi di un testo.

Per ottenere questo valore, i ricercatori hanno misurato l’uniformità della distribuzione di ogni parola (hanno calcolato la sua entropia secondo la teoria dell’informazione, disciplina che studia l’elaborazione e la distribuzione dell’informazione), sia in un testo con le parole nel giusto ordine sia nello stesso testo con le parole tutte mescolate. Moltiplicando la differenza tra i due valori di entropia di ogni parola per la frequenza della parola stessa gli scienziati hanno ottenuto l’unità di misura desiderata: il “valore informativo”.

Secondo i ricercatori inglesi è proprio la distribuzione in un testo a decretare il valore di un termine e non il numero assoluto di ripetizioni. Le congiunzioni (e, anche, quindi, ecc.), per esempio, sono usate frequentemente, ma non sono indicative. Infatti, sono uniformemente distribuite in un testo ordinato come in uno disorganizzato e quindi presentano un valore informativo basso. La tendenza a essere raggruppate in capitoli e paragrafi, invece, dà alle parole significative un valore molto alto, rendendole riconoscibili.

La validità della nuova unità di misura è stata confermata da un test condotto su “L’origine della specie” di Charles Darwin: le parole con il valore più alto sono state “specie, varietà, ibridi, forme, isole, selezione e genere”. Il sistema messo a punto dai ricercatori inglesi potrebbe rivelarsi molto utile per la decodificazione di testi in codice o scritti in idiomi sconosciuti. “L’applicazione principale potrebbe però non essere il letteratura, ma in biologia, magari per identificare quei geni che trasportano informazioni utili. Del resto quando si guarda il genoma sembra davvero di essere davanti a una lingua straniera”, ha spiegato Marcelo Montemurro, leader del gruppo di ricerca. (c.v.)

Fonte: New Scientist

Commenti lascia un commento

Nessun commento, per ora.

Lascia un commento

Oggi su Galileo

Sondaggio

Lo scorso 7 luglio Pete Bethune, militante dell’organizzazione ambientalista Sea Shepard, è stato condannato a 2 anni per aver disturbato una nave baleniera giapponese in acque antartiche. Pensate che questo tipo di iniziative aiuti la battaglia per la protezione delle balene?

risultati

Segui Galileo

Galileo Servizi Editoriali

Parole per la scienza

Galileo servizi editoriali è un service giornalistico che realizza inchieste per le principali testate italiane, sviluppa progetti di comunicazione per le aziende e gli enti di ricerca, produce formazione universitaria, organizza mostre, eventi, conferenze, realizza pubblicazioni su carta e siti web. vai al sito di Galileo Servizi Editoriali

Partners