Il sesso di Twitter

Su Twitter, la parola “guerra” è scritta nel 64% dei casi da uomini, e solo nel 36% da donne. Con “amore” le percentuali sono praticamente le stesse, ma invertite. Nessuno si è messo a contare quante volte compare ciascun termine sui micropost di ambo i sessi, ovviamente: i numeri sono il risultato di un nuovo strumento online – Tweetolife – messo a punto proprio per rivelare come le caratteristiche legate al genere vengono trasportate in rete. 

Si può provare con diversi termini (per ora in inglese), e in tempo reale si vedono comparire non solo le percentuali rosa e azzurre, ma anche le altre parole che i due sessi vi associano. Prendendo di nuovo “guerra”, per esempio, nei tweet degli uomini questa viene digitata insieme al verbo “scatenare” o con il videogame Halo. Curiosamente, le donne la digitano nella stessa frase in cui scrivono anche “sposa” e “rovinare”. E “internet“? È usata nel 57% dei casi dai maschi e nel restante 43% dalle femmine. Le associazioni suonano abbastanza bizzarre (o molto indicative, a seconda dei punti di vista) per entrambi i sessi. Per esempio, nei primi appare con “banking”, nelle seconde con “stupid”. 

Dietro l’applicazione (ancora in fase demo) ci sono due ricercatori del Centro Mente e Cervello (CIMeC) dell’Università di Trento, Amaç Herdagdelen e Marco Baroni. Il loro scopo non era quello di eseguire un’analisi sociologica, ma creare uno strumento computazionale per studiare quella che viene definita la “conoscenza di senso comune” (al Media Lab del Mit stanno compilando un database che contiene migliaia di espressioni di senso comune): l’insieme di conoscenze riguardo al mondo che un individuo possiede e che rappresenta un punto di riferimento per chi si occupa di intelligenze artificiali

Quello che Herdagdelen e Baroni hanno realizzato, per ora, è per l’appunto un sistema automatico in grado di analizzare i contenuti dei tweet e di compararli tra di loro per tirarne fuori le differenze di comportamento tra i due sessi. L’applicazione mostra anche come varia la presenza dei termini a seconda delle ore del giorno. Per esempio, cercando “love”, il picco, in Gran Bretagna, è intorno alla mezzanotte, mentre per “war” è alle 4 del mattino, come per “internet”. 

Per realizzare questo strumento, i ricercatori hanno controllato 34 milioni di messaggi raccolti durante 4 mesi (tra novembre 2009 e febbraio 2010) dall’Università di Edimburgo (Gb). “È un processo del tutto simile alla decifrazione di un papiro” ha detto Baroni: “ Qui, però, la difficoltà sta nell’estrazione e nella gestione di enormi quantità di dati fluttuanti nel web, non nell’attribuzione di significato a simboli sconosciuti”. 
Il loro studio, “Stereotypical gender actions can be extracted from web text“, è stato pubblicato sul Journal Of the American Society for Information Science and Technology.

E i risultati mostrano proprio che è possibile stabilire il sesso di chi sta scrivendo usando un sistema automatico di analisi dei contenuti. Gli studiosi sono convinti che la loro creatura possa essere di grande utilità a chi si occupa di scienze sociali, e sperano che gli umanisti possano presto cominciare a fidarsi un po’ di più dei nuovi strumenti: “L’obiezione al nostro appello per una collaborazione volta a una corretta interpretazione dei dati estratti da Twitter è stata una ulteriore conferma dell’ostilità ancora troppo diffusa verso le nuove tecnologie”, hanno infatti sottolineato i ricercatori. 

I due stanno ora ampliando l’analisi ad altri fenomeni, allargando l’area geografica considerata e inserendo lingue diverse dall’inglese. I dati saranno disponibili pubblicamente.

Via wired.it

LASCIA UN COMMENTO

Please enter your comment!
Please enter your name here