628 vizualizari | Fii primul care comenteaza
Joi, 17 februarie 2011, Facultatea de Matematica si Informatica a Universitatii din Bucuresti a organizat conferinta Caracterizari numerice ale cuvintelor, sustinuta de prof. dr. Adrian Atanasiu.
In fata celor peste 40 de participanti, familiari in grade diferite cu abordarea matematica a limbii, profesorul Atanasiu a incercat sa demistifice subiectul, sa il explice si sa il materializeze in exemple. Pentru a indeplini aceasta sarcina, au fost abordate 5 teme: diverse evaluari numerice ale cuvintelor, vectorul Parikh, matricea Parikh, cuvinte peste un alfabet binar si coduri de autentificare a mesajelor.
In prima parte a conferintei, profesorul Atanasiu a vorbit despre subiectul atat de controversat al existentei unor mesaje ascunse in spatele textului Bibliei, respectiv al textului original al Vechiului Testament, in limba ebraica. Au fost expuse cronologic cateva dintre cercetarile efectuate pe aceasta tema, de la Isaac Newton (primul care s-a ocupat de gasirea unor elemente ascunse in text) pana la dr. Elyahu Rips (autorul codului Toras) si la congresele din prezent. Dr. Elyahu Rips a eliminat spatiile dintre cuvintele textului biblic si a obtinut informatii parcurgand noul text in secvente de cate n litere. Mai tarziu, facandu-se un studiu comparativ, s-a observat ca textul biblic prezinta intr-adevar mult mai multe "elemente ascunse" decat alte texte, daca este astfel parcurs.
Referindu-se tot la diverse evaluari numerice, Adrian Atanasiu a continuat prin a explica modalitatea in care un text poate fi tradus dintr-o limba in alta, tinand cont numai de frecventa cu care apar literele alfabetului in cele doua limbi.
In continuare, profesorul Atanasiu a prezentat vectorul Parikh, un vector care a condus la primele concluzii in domeniu, fiind o caracterizare incipienta si grosiera a cuvintelor prin numere, care a oferit insa baza pentru cercetarile ulterioare mai avansate.
Una dintre cercetarile care au pornit de la acest vector este cea care foloseste matricea Parikh. Desi aceasta este o metoda mult mai eficienta de caracterizare a cuvintelor prin cifre, prezinta si ea unele dificultati. Aceste dificultati iau forma cuvintelor amiabile, sau ambigue. Aceste cuvinte sunt cuvinte diferite, caracterizate insa de aceeasi matrice Parikh, datorita faptului ca daca luam doua caractere consecutive din text si neconsecutive in alfabet, pe care le inversam, matricea nu se schimba. De asemenea, daca avem doua caractere consecutive in alfabet, de exemplu A si B, care apar de doua ori in text, sub forma AB si BA, aceste doua secvente pot fi simultan inversate si, din nou, matricea nu se va modifica.
Au fost prezentate si metode de minimizare a problemei de amiabilitate, precum morfismul Istrail, care construieste o imagine a cuvintelor, observandu-se faptul ca imaginile a doua cuvinte amiabile nu sunt si ele amiabile, in cazul alfabetului binar.
Ultima parte a conferintei a fost dedicata codurilor generate de imagini, muzica, film, precum si amprentelor pe care aceste coduri le genereaza si utilitatii acestora in verificarea autenticitatii unor produse si in cazul drepturilor de autor.
Conferinta s-a incheiat cu o scurta sesiune de intrebari si cu aplauze prelungite pentru profesorul Adrian Atanasiu si pentru modul sau limpede de a explica tema aleasa, atat de interesanta dar mai putin cunoscuta publicului larg.
Sursa: Unibuc