Calcoli di parole

In principio furono gli ideogrammi. Poi vennero gli alfabeti sillabici. Molto dopo vennero quelli fonetici, caratterizzati da una perfetta corrispondenza tra suono e grafia. Cambiamenti tutti all’insegna della riduzione. Ogni volta che si è verificato un passaggio da un sistema alfabetico a un altro, infatti, si è riscontrata una notevole diminuzione del numero di caratteri. Ma le possibilità di restringere e di rendere il tutto ancora più essenziale non sono finite qui. È quello che, per esempio, fanno i classici programmi zip che comprimono i file eliminando tutte le parti non essenziali. E di recente molti matematici si sono cimentati in questi studi. Tra questi Aldo De Luca, docente di matematica dell’Università di Roma La Sapienza. Che ha deciso di studiare la struttura complessa e combinatoria delle “parole”, che per lui sono sequenze (o stringhe) di simboli (le lettere), appartenenti un insieme finito (l’alfabeto). “È fondamentale sottolineare”, spiega De Luca, durante un seminario su questo tema tenutosi giovedì 11 aprile scorso presso l’Aula Magna de La Sapienza, “la distinzione fra struttura e significato delle parole. Le mie ricerche si concentrano sulla prima senza mai entrare nell’ambito del significato, quello semantico”.

Oltre ai software zip molte sono le applicazioni degli studi simili a quelli di De Luca, che ormai si contano dall’inizio degli anni Cinquanta, quando con il matematico Marcel Paul Schutzenberger, che elaborò la teoria dei codici a lunghezza variabile, nacque la cosiddetta “matematica delle parole”. Esperimenti che coinvolgono trasversalmente tutte le discipline scientifiche e non, dalla fisica all’informatica, dalla linguistica alla chimica fino alla biologia.

Gli alfabeti analizzati dallo stesso De Luca hanno cardinalità, il numero di simboli che compone un alfabeto, molto più basse rispetto a quelle degli alfabeti moderni (cirillico, anglosassone e così via). Un alfabeto di cardinalità due, per esempio, è quello costituito dai due simboli 0 e 1. Un insieme piuttosto ridotto, ma che sta alla base dei calcoli svolti da qualunque computer. In natura, poi, esiste un alfabeto di cardinalità quattro estremamente importante: quello che compone la sequenza del Dna formato dalle basi azotate: adenina, citosina, guanina, e timina. Queste, rappresentate dalle lettere (A,C,G,T), formano una i due filamenti che costituiscono la doppia elica del Dna. La “parola”, rappresentata da un singolo gene del nostro dna, può essere composta da diverse migliaia di “lettere”. Grazie ai metodi presentati da De Luca, che si basano essenzialmente sui “fattori” o “blocchi” della parola, ovvero su quelle sotto-parole costituite da una determinata sequenza di simboli, ricorrenti all’interno della parola stessa, presto si potrà ricostruire il dna partendo solamente da frammenti di poche centinaia di basi.

Ma anche la fisica e l’informatica possono trarre beneficio dalla teoria combinatoria sviluppata in ambito matematico. Questo metodo, inoltre, potrebbe gettare luce sulle procedure con cui il cervello processa le informazioni. E anche la tecnica delle comunicazioni si potrebbe ispirare a esso per trovare il modo di spezzare un unico messaggio elettronico in diverse porzioni. In futuro si potrebbe spedire pezzi di e-mail attraverso canali distinti (per esempio satellite, doppino telefonico e fibra ottica), in modo da non saturarne nessuno, e che il messaggio si ricomponga correttamente non appena arrivato.

LASCIA UN COMMENTO

Please enter your comment!
Please enter your name here