HomeSocietàTag anti spam

Tag anti spam

In rete ormai si procede per parole chiave. Blogger e web editor etichettano i loro contenuti, siano essi foto da inserire su flickr o pagine web da suggerire sul proprio forum, con una serie di parole chiave (tag) che dovrebbero aiutare gli utenti a raggiungere quelli più interessanti. Ma qual è il criterio che guida la scelta dei tag? Ed è possibile ripetere o prevedere i percorsi di selezione delle parole usate?  A questo potrebbe rispondere il  modello fisico-statistico sviluppato da alcuni ricercatori italiani e francesi e pubblicato su Pnas

A ricostruire il meccanismo di associazione che guida gli utenti del web sono stati Vittorio Loreto di INFM-CNR e Università La Sapienza di Roma, Andrea Baldassarri dell’Università La Sapienza di Roma, Ciro Cattuto della Fondazione ISI di Torino, e Alain Barrat e Gregory Schehr del CNRS francese, che hanno creato un modello di tagging capace di produrre risultati confrontabili con i dati reali estratti dai siti di social networking Del.icio.us e Bibsonomy (usati dagli utenti per segnalare e catalogare siti, pagine web, riferimenti bibliografici).

Per cercare di ricostruire i percorsi mentali che portano un individuo ad associare certe etichette a determinati contenuti, i ricercatori hanno immaginato la rete come uno spazio in cui l’utente cammina passando da un punto (un tag) all’altro, muovendosi secondo affinità semantiche (come “cielo” e “nuvola”, “nuvola” e “bianco”, e così via). Associando a ogni passeggiata l’insieme dei nodi (tag) scelti e il tratto che lega un nodo all’altro, i ricercatori hanno ricostruito i percorsi degli utenti tag dopo tag, creando migliaia di post ipotetici.

Confrontando questi post ipotetici con altrettanti reali, pubblicati sui siti di social networking, gli studiosi hanno trovato diverse corrispondenze nella struttura, per esempio una stessa co-occorrenza di tag (cioè quante volte un tag è usato insieme a un altro, come “mare” e “acqua”). I ricercatori hanno quindi visto che in rete i contenuti che presentano tag associati semanticamente sono visitati più spesso rispetto a quelli i cui tag non lo sono. Misurando la vicinanza semantica dei tag possono essere estratti alcuni concetti chiave che guidano le ricerche dei navigatori.

“Comprendere meglio come gli utenti associano contenuti  e parole chiave potrebbe portare a molte innovazioni nei servizi online”, hanno spiegato i ricercatori. Per esempio sistemi più efficaci di protezione dallo spam (capaci di identificare le associazioni “sbagliate” di parole all’interno di email fraudolente),  servizi di pubblicità e marketing online capaci di proporre prodotti mirati per specifici target, oppure l’uso del tagging per catalogare enormi quantità di dati (una strada intrapresa da Google). (c.v.)

Riferimenti: PNAS doi: 10.1073/pnas.0901136106

RESTA IN ORBITA

Articoli recenti