“I cani rosa sono rari?”. Sembra una domanda semplice, ma un computer avrebbe qualche difficoltà a rispondere. Per “rosa” intendiamo un fiore o un colore? Noi lo sappiamo benissimo, ma i motori di ricerca faticano a cogliere queste sfumature del linguaggio. A superare questa barriera semantica potrebbe essere Composes (Compositional Operations in Semantic Space), il progetto di ricerca sviluppato dal linguista computazionale Marco Baroni presso il Centro Mente/Cervello (Cimec) dell’Università di Trento.
L’equipe del Cimec ha da poco ricevuto un finanziamento europeo (Erc Starting Grants) da 1 milione di euro per mettere a punto degli strumenti in grado di abbattere la barriera semantica che impedisce ai computer di comprendere il linguaggio umano. Al progetto Composes lavoreranno una decina di ricercatori. L’obiettivo è quello di migliorare i motori di ricerca, rendendoli in grado di comprendere il significato di intere proposizioni.
Il gruppo di scienziati del Cimec avvierà uno studio lungo cinque anni per sviluppare dei modelli computazionali in grado di risolvere due problemi fondamentali alla base del Web semantico. Il primo scoglio ha a che fare con la capacità da parte dei computer di capire il significato preciso di migliaia di vocaboli (problema della quantità), mentre il secondo riguarda la possibilità di afferrare il significato di una frase di senso compiuto, anche semplicissima (problema della composizionalità).
Il Cimec ha fissato per gennaio 2015 il rilascio di un primo prototipo di spazio di ricerca semantico, una sorta di preview dei motori di ricerca del futuro, capaci di capire di quali informazioni abbiamo bisogno quando chiediamo loro di “rari cani rosa” o qualsiasi altra informazione che necessita di essere contestualizzata. Insomma, un passo in avanti rispetto a Wolfam|Alpha, il primo caso di motore di ricerca che tenta di risponde a domande poste in modo articolato.
“Ci aspettiamo che Composes abbia un impatto sulla linguistica computazionale e teorica, sulle scienze cognitive e l’intelligenza artificiale”, commenta Baroni. “Sarà il primo sistema a soddisfare i criteri necessari a fare di una macchina un parlante quasi umano, dotato della conoscenza del significato di migliaia di parole, delle regole compositive per creare nuove frasi significanti, e del possesso di quelle che noi chiameremmo intuizioni semantiche, conoscenze del senso comune”.
Credit per l’immagine: tanakawho / Flickr