La formula della navigazione

Soldi in cambio di click. È questo il business delle “fabbriche di click”. Si tratta di centri illegali, situati soprattutto in India, che garantiscono un minimo di contatti alle pagine pubblicitarie in Internet in cambio di denaro. Questo è solo uno dei sottoprodotti della pubblicità online. Un giro di affari di 20 miliardi di euro all’anno, che cresce il 20 per cento ogni 12 mesi. Il segmento più dinamico del mercato pubblicitario è stato al centro della visita in Italia di Andrei Broder. Il pioniere dei motori di ricerca, oggi “mente pensante” di Yahoo!, ha partecipato al congresso “Complex networks: from biology to information technology” che si è svolto dal 2 al 6 luglio a Cagliari, uno degli eventi satellite che hanno preceduto Statphys23, il grande convegno sulla complessità co-organizzato dall’Istituto Nazionale di Fisica della Materia dal 9 al 13 luglio a Genova.

“Le fabbriche di clic possono essere pagate dalle imprese pubblicitarie per simulare un successo inesistente in realtà. Ma anche da alcune imprese interessate a esaurire il budget pubblicitario di un avversario”, spiega Broder. Ma questa non è l’unica trappola di un mercato mutevole e aggressivo. “Alcune pagine web sono delle scatole vuote, con dei contenuti creati solo per fare soldi  grazie a banner e messaggi pubblicitari”. Per questa e altre ragioni, Yahoo!-Research, di cui Broder è vicedirettore, sta studiando i meccanismi del comportamento umano in Internet.

Nel cammino verso questo obiettivo, l’impresa ha incontrato una vasta comunità di ricercatori (soprattutto fisici e ingegneri) che stanno analizzando le dinamiche umane in rete. “Rispondere alle mail o navigare in Internet non sono attività totalmente arbitrarie”, spiega Guido Caldarelli, professore associato al Centro di Complessità di Roma, dell’Infm, e organizzatore dell’incontro. Il ricercatore è coautore di uno studio sui tempi di risposta della posta elettronica. “Non possiamo predire il ‘tempo medio’ impiegato da una persona a rispondere a una mail. Al contrario, c’è una grande varietà dei tempi di reazione”. Però i ricercatori sono riusciti a descrivere una legge che stabilisce la distribuzione di questi tempi. In più, hanno mostrato che questa legge emerge naturalmente da un modello del comportamento umano. Uno schema che rappresenta i criteri con cui le persone stabiliscono una lista di priorità per rispondere alla posta. “Studi come questi possono aiutare a riconoscere comportamenti anomali. Per esempio, la diffusione di worms, virus che si autoinviano immediatamente a tutti gli indirizzi di posta del computer che infettano. Oppure lo spam, invii massivi di mail pubblicitari o pornografici.”

Studiare le deviazioni dal comportamento “normale” per individuare azioni distruttive è l’idea centrale di molte ricerche. “Conoscendo la struttura del web è possibile individuare anomalie come le ‘fattorie di link’”, spiega Debora Donato, ricercatrice di Yahoo!-Research. Quando si fa una richiesta a un motore di ricerca come Google, i risultati vengono presentati in un ordine che dà massima priorità alle pagine molto “linkate”. Infatti, le pagine che ricevono molti link da altre pagine sono probabilmente interessanti o autorevoli. “Per questo, alcuni operatori costruiscono centinaia di pagine senza contenuto che servono solo per puntare a un’altra pagina e aumentarne così il ‘rango’”. Strutture di questo genere perturbano l’architettura normale del web. Infatti, le pagine “false” sono tutte vicine e dello stesso tipo, mentre quando i link sono autentici vengono da pagine diverse e lontane fra loro.

La gerarchizzazione delle pagine a partire dal numero di link ha generato anche l’allarme per l’avvento di una “googlearchia”. “Se Google privilegia le pagine con più link, queste verranno più lette e quindi riceveranno ancora più collegamenti”, spiega Alessandro Flammini, dell’Università dell’Indiana. “Questo potrebbe creare in teoria una oligarchia di pagine superconnesse, che andrebbe specialmente a svantaggio delle pagine ‘giovani’”. Però Flammini e collaboratori hanno dimostrato quantitativamente che Google non solo non produce questo effetto, ma addirittura lo combatte. “In realtà, nelle liste elaborate dai motori di ricerca ci sono solo le pagine che contengono la parola cercata. Quindi, finché le persone continueranno a mantenere una gran varietà d’interessi (e quindi a cercare una gran varietà di parole) le poche pagine superlikate non acquisiranno tutti i link”. Al contrario, secondo i ricercatori, i motori di ricerca danno un’opportunità anche alle pagine remote che parlano dei temi più specifici.

“Fenomeni come la Wikipedia offrono l’opportunità unica di studiare come interagiscono milioni di persone”, spiega Caldarelli. Il ricercatore ha studiato la struttura a grande scala dell’enciclopedia virtuale. “Le nostre analisi hanno rivelato che la Wikipedia è un universo di parole strettamente correlate, legati fra loro da catene di concetti molto corte”. Il gruppo ha scoperto alcune regolarità nel modo in cui gli autori costruiscono le voci e quantificato il ruolo dell’imitazione e del riutilizzo di materiali nell’enciclopedia.“La rete è il grande, nuovo laboratorio per studiare quantitativamente il comportamento umano”.

LASCIA UN COMMENTO

Please enter your comment!
Please enter your name here