Lingvističke aktuelnosti

Upisano u kategoriju: Projekti, Broj 4

(EURO) WORDNET U leto 1999. godine priveden je kraju projekat pod nazivom Euro Wordnet. Radi se o primeni na nekoliko evropskih jezika sistema WordNet,  koji je za engleski jezik sačinjen početkom devedesetih godina na američkom Princetonu. Više informacija o Euro WordNetu može se naći na strani http://www.hum.uva.nl/~ewn/, dok su informacije o američkom WordNetu, koji je bio osnova za evropski dostupne na strani:  http://www.cogsci.princeton.edu/~wn/. Mada je projekat Euro WordNeta dovršen, postoji organizacija pod nazivom: Global WordNet Association (više informacija na strani: http://www.hum.uva.nl/~ewn/gwa.htm) koja se bavi koordiniranjem daljih projekata zasnovanih na prinstonskom WordNetu.Pođimo od verzije za engleski jezik, koja se u celosti može skinuti s navedene strane ili pregledati preko interneta. Profesor Miller i njegovi saradnici razvili su sistem predstavljanja leksike engleskog jezika u formi sinonimskih grozdova (synsets) uz istovremeno predstavljanje leksičkih relacija među njima. Tako se za svaku leksemu mogu dobiti informacije ne samo o njenim sinonimima, nego i o antonimima, hipo- i hiperonimima, holonimima i meronimima, troponomima, koordiniranim terminima, stepenu uobičajenosti, a za glagole se daju i rečenični obrasci. Tako npr. ako upišemo knife, dobijamo tri imenička smisla sa njihovim sinomima i definicijama svakog smisla (1. nož za rezanje, 2. nož kao hladno oružje, 3. jezičak, recimo plamena) te jedan glagolski (ubosti nožem). Nakon toga možemo za svaki imenički smisao dobiti kojoj vrsti pripada i koje su vrste noževa (dakle hiperonime i hiponime), koji su delovi noža (meronimi – u ovoj odrednici nema holonima, čiji je deo nož), koordinirane termine (gde dobijam sve vrste alata ili oružja sa sečivima), te stepen uobičajenosti (ovaj stepen računa se samo na osnovu značenja koja reč ima, pa ispada da je nož neuobičajen, što pokazuje slabost ovog načina predstavljanja uobičajenosti). Za glagolski smisao daju se i troponomi (načini ubadanja nožem), te rečenični okviri, iz kojih se vidi da je okvir da «neko ubada nožem nekog drugog». U ovim primeru nema antonima, ali oni se mogu dobiti za veliki broj prideva.Dakle, engleski WordNet zapravo je moćna baza podataka o leksici i leksičkim relacijama sa mnoštvom primena od učenja jezika do leksikografije i kompjuterske lingvistike.Evropski WordNet pošao je i korak dalje. Cilj je bio ne samo da se leksičke baze podataka ovog tipa stvore za nekoliko evropskih jezika nego i da se stvori međujezički indeks koji povezuje reči iz različitih jezika. Euro WordNet izradio je baze podataka za holandski, italijanski, španski, nemački, francuski, češki i estonski. Izvan ovoga projekta, kako izveštavaju njegovi autori, u izradi su WorNeti za švedski, norveški, danski, grčki, portugalski, baskijski, katalonski, rumunski, litvanski, ruski, bugarski i slovenački. Dakle, nakon završetka Euro WordNeta ne samo da jedan broj evropskih jezika ima izuzetno bogate i primenjive baze podataka, nego će još veći broj jezika u najbližoj budućnosti takve baze podataka imati. S tim u vezi javlja se potreba uključivanja srpske leksikografije u ovu zajednicu. Naime, svakako su nam potrebni rečnici sinonima, antonima, tematski rečnici i sl. Umesto da se na ovim projektima radi nekoordinirano, bilo bi mnogo korisnije ako bi se pristupilo formiranju srpskog WordNeta, koji bi onda bio ne samo osnova za postajanje navedenih rečnika, nego bi, putem uključivanja srpske leksikografije u svetsku zajednicu WordNeta, ova baza podataka bila dobro oruđe za proveru, vrednovanje, upotpunjavanje i sl. dvojezičnih rečnika sa svim onim jezicima koji već imaju bazu podataka WordNet. O primenama ovakve baze podataka u računarskoj lingvistici, koja će u narednim godinama imati sve važnije mesto u primenjenoj lingvistici, ne treba posebno govoriti. Slično je i u primenama u leksikografiji u funkciji pomoći leksikografu bez obzira na kojem rečniku radi. Konačno, velike su koristi takve baze podatka za nastavnike i učenike jezika čak i u osnovnim i srednjim školama, a o novinarima da i ne govorimo.Bilo bi stoga dobro da se u odgovarajućim institucijama ozbiljno porazmisli o pokretanju ovakvog projekta za srpski jezik.  Danko Šipka  (Poznanj) 

Bez komentara »

No comments yet.

RSS feed for comments on this post. TrackBack URL

Leave a comment

You must be logged in to post a comment.

Napravljeno pomoćuWordPressa