La Rete si organizza in comunità

16/03/2002

di

Andrea Capocci

La ricerca di informazioni in Internet è oggi un grande business, oltre a essere un interessante problema interdisciplinare. Un motore di ricerca più efficiente attira in poco tempo un enorme numero di visitatori, le cui richieste sono analizzate dettagliatamente e rivelano preferenze e interessi degli utenti di Internet. Merce pregiatissima per le imprese, che le società usano per individuare nuove nicchie di mercato. Solo grazie alla vendita di queste informazioni i motori di ricerca possono infatti fornire gratuitamente il loro quotidiano servizio di orientamento. Nell’anarchia dello sviluppo della Rete, che cresce ininterrottamente senza alcun autorità superiore, Gary Flake, Steve Lawrence, Lee Giles e Frans Coetzee dell’istituto di ricerca Nec hanno studiato una proprietà interessante: il modo in cui si ramificano i link da una pagina Web all’altra. Seguendo questi percorsi virtuali hanno individuato “comunità tematiche” di siti, come sostengono in una ricerca pubblicata dalla rivista “IEEE Computer”, gruppi di pagine cioè che sono più connesse tra loro che con il resto della Rete. E hanno descritto questa autorganizzazione con un algoritmo matematico, lo stesso con cui hanno poi testato un motore di ricerca su argomenti noti, verificando come il loro metodo assegnasse automaticamente alla stessa comunità siti i cui contenuti erano effettivamente correlati, anche se il testo non presentava somiglianze.

Se questo sistema fosse utilizzato su larga scala, il risultato di una ricerca su Internet non dipenderebbe in maniera rilevante dalla parola-chiave. Evitando così alcuni spiacevoli inconvenienti: spesso, infatti, con un motore di ricerca tradizionale si ottengono risultati completamente diversi usando una parola-chiave e un suo sinonimo. Un motore capace di scovare le correlazioni tematiche tra le pagine Web può invece suggerire di visitare siti collegati tra loro anche se non contengono la stessa parola-chiave. Esso sarebbe in grado di stabilire autonomamente le aree tematiche in cui il Web si suddivide, evitando così l’intervento umano, dispendioso e soggettivo, necessario a motori di ricerca come Yahoo!.

L’antesignano di tutti i motori di ricerca è stato Altavista dove, una volta inserite le parole-chiave, venivano elencati tutti i siti che le contenevano nel testo. Il risultato della ricerca, però, mescolava informazioni utili e siti irrilevanti. L’alternativa era Yahoo!. Erano una sorta di “pagine gialle” della Rete, una classificazione per categorie tematiche cui gli autori possono iscrivere il proprio sito per renderlo reperibile al pubblico. Ma c’era chi “barava” e compariva abusivamente nelle categorie più di moda, mentre altri non si preoccupavano affatto di essere inclusi nell’elenco. Si poneva inoltre il problema di chi decidesse come classificare le pagine Web. In ogni caso, entrambi i motori di ricerca (e i loro vari imitatori) consideravano la Rete come un insieme di pagine indipendenti, e non prendevano in considerazione la struttura che li connette.

La rivoluzione dei motori di ricerca arrivò con Google. Per misurare la rilevanza di un sito, Google simula un utente un po’ mattacchione che passa da una pagina all’altra della Rete cliccando a caso. In questo vagabondare, alcune pagine saranno visitate più spesso di altre, e il numero delle “visite” viene usato per misurare la “rilevanza” del sito e stabilire l’ordine con cui i risultati della ricerca appaiono sullo schermo. In altre parole, un sito è considerato rilevante se molti siti puntano a esso, perché ogni link può essere interpretato come un attestato di stima, di utilità o di somiglianza. Oltre al testo contenuto in una pagina, dunque, la struttura stessa della rete diviene fonte di informazione.

Da allora, ed era il “lontano” 1998, la Rete è stata studiata estesamente da informatici, matematici e fisici. Che ne hanno scoperto proprietà statistiche interessanti da molti punti di vista. Per esempio, nonostante il numero dei siti superi il miliardo, due pagine Web sono separate in media solo da una ventina di click (il Web è uno “small world”). Inoltre, se si rappresenta Internet come un insieme di punti collegati da frecce, il grafo ottenuto è un frattale. Cioè, assomiglia a una rete di affluenti di un fiume, come ha scoperto il gruppo di fisici teorici dell’Università “La Sapienza” di Roma coordinato da Guido Caldarelli. Si direbbe che la forma di Internet ottimizzi il flusso di informazione, così come un bacino fluviale si adatta ai pendii per facilitare lo scorrimento dell’acqua a fondo valle. E proprio partendo dalla convinzione che un link trasmetta un flusso di “interesse” da un sito all’altro, i ricercatori americani hanno individuato il loro metodo innovativo di ricerca di informazioni su Internet.

La Rete si organizza in comunità

RESTA IN ORBITA

Articoli recenti

Salute: le parole che curano, e quelle che ingannano

Invecchiamento, il primo test sugli esseri umani per ringiovanire le cellule

Ecco Co-Scientist, il “torneo” per scienziati (artificiali) di Google

Intelligenza artificiale: gli LLM possono “sentire” ansia e paura

CHI SIAMO

SEGUICI

La Rete si organizza in comunità

Articoli Correlati

I robot umanoidi non ci possono rubare, ancora, il lavoro

Scienza & Cinema: così i film apocalittici aiutano il dibattito sul clima

Collega-Menti 2026, il Festival che accende il dibattito sul bisogno di equilibrio

RESTA IN ORBITA

Articoli recenti

Salute: le parole che curano, e quelle che ingannano

Invecchiamento, il primo test sugli esseri umani per ringiovanire le cellule

Ecco Co-Scientist, il “torneo” per scienziati (artificiali) di Google

Intelligenza artificiale: gli LLM possono “sentire” ansia e paura

CHI SIAMO

SEGUICI