Hizkuntza teknologiak funtsezkoak dira informazio eta komunikazioaren gizartean. Egun, badira zenbait hizkuntza aplikazio eskuragarri, hala nola, ortografia eta estilo zuzentzaileak, on-line hiztegiak, itzulpen laguntzaileak, Interneterako bilatzaileak, hizketa testu bihurtzen duten sistemak, testuak irakurtzen dituztenak... Sistema hauen eta gizakiaren arteko komunikazioa lantzen duen zientziari deritzo ingeniaritza linguistikoa, pertsona eta makinen arteko komunikazioari, alegia.
Euskal Herrian badira ingeniaritza linguistikoa lantzen duten zenbait enpresa eta talde, besteak beste, Elhuyar, IXA, Eleka, Code & Sintax, VicomTech, Hizkia, Plazagunea, Ametzagaiña eta Aholab. Unibertsitate mailan ere, esaterako EHUko Zientzia Fakultatean, Bilboko Industri Injineruen Eskolan eta Gasteizko Injineru Teknikoen Eskolan, bada honetan jarduten duenik.
Ingeniaritza linguistikoaren munduan lantzen diren esparru ezberdinak eta Euskal Herrian duten trataera eta ikerlana ezagutu xedez, hiru enpresetara jo dugu, hain zuzen ere Eleka, Aholab eta Ametzagaiñara. Teknologia linguistikoetan espezializatuak diren Eleka enpresan esaterako, Josu Waliño ikertzailearekin hitz egin dugu. Teknologia linguistiko estrategikoak garatzeko eredu aitzindaria da Eleka. Urteak daramatza ingeniaritza linguistikoaren arloan ikertzen, behar dokumentalei eta linguistikoei aurre egiteko teknologiak eta irtenbideak garatzen. Unibertsitateetan garatzen diren teknologietan oinarrituta eta produktuen gaineko lizentzien bidez bezeroen eskakizunen arabera tresnak garatzea da haien eginkizun nagusia.
Bi talde elkartuz sortu den enpresa proiektua da Eleka: IXA Taldea eta Elhuyar Fundazioa. Errendimendu Handiko Taldea izendatu du Eusko Jaurlaritzak EHUko Informatika Fakultateko IXA Taldea. Talde horrek 15 urte eman ditu ingeniaritza linguistikoaren arloan. Hainbat produktu garatu dituzte, esaterako, Xuxen (Worden txertatutako euskarazko zuzentzaile ortografikoa), lematizazioan oinarritutako Interneteko bilatzaileak eta hainbat tresna linguistiko. Bestalde, Elhuyar Fundazioak hizkuntzaren esparruan hogeita hamar urteko esperientzia du. Denbora honetan zehar, Euskal Herriko hizkuntzalaritzaren arloan enpresa aitzindaria bihurtu da Elhuyar.
Josu Waliñoren ustez, ingeniaritza linguistikoa hizkuntza eta informazioa informatikaren bidez tratatzea da. Bi arlo ezberdintzen dira zientzia honetan: Testuaren tratamendu informatizatua, hau da, lengoaia naturalaren prozesamendua eta bestetik, ahotsaren tratamendua. Azken honen barruan bi arlo bereizi behar dira, ahotsaren sintesia, hots, ordenagailuak hitz egitea, eta ordenagailuak zuk esandakoa transkribatzea edota ulertzea. Waliñoren aburuz, ezagutzaren tratamendua da ingeniaritza linguistikoaren helburua, maila guztietan. Informazioa ezagutza da, era testualean nahiz ahotsaren bitartez eman daitekeena. Beraz, informazio hori jaso eta ezagutza tratatzeko aukera izatea da xedea. Honekin lortzen dena da pertsonek egun behartuta egitera gauden hainbat lan ordenagailuek era automatikoan egitea; itzulpena esaterako. Itzulpen automatikoaren helburua sistema bat testu bat bere testuinguruan ulertzeko gai izatea eta itzultzea izango litzateke. Ahots errekonozimenduan beste horrenbeste izango litzateke, ezagutzaren tratamendua.
Nazioartean informatikaren lehen pausoekin hasi ziren ingeniaritza linguistikoa lantzen. Euskal Herri mailan aldiz, Informatika Fakultateko IXA taldea hasi zen arlo hau jorratzen duela 15 urte. Beraz, EHUn hasi zen ingeniaritza linguistikoa lantzen eta ikertzen. Ondoren, IXA taldeak eta Elhuyar Fundazioak Eleka sortu zuten ingeniaritza linguistikoa enpresetara eramateko. Memento honetan, zortzi laguneko ikerketa talde batek euskarazko zuzentzaile gramatikala lantzen dihardu. Urtebete barru amaitua egotea espero dute. Orain arte Elekak testuaren tratamendu informatizatua landu badu ere, Elhuyarrekin, Aholabekin, IXArekin, Robotikerrekin eta VicomTechekin bat eginik, ahots errekonozimendua landuko du lehen aldiz. Hain zuzen ere, ahotsaren bitartez euskarazko bilaketak egiteko proiektua dute. «Hizking 21» izeneko hiru urteko proiektu honen helburua euskara ingelesaren mailara iristea da.
Euskara informatikoki lantzeko zailtasunak
Ahots errekonozimendua
Katalunian kokatuta dagoen ATLAS (Applied Technologies on Language and Speech) enpresak esaterako, euskaraz ataza sinpleak ezagutzeko sistema garatu du. Honekin lortzen dena da konputagailuari hitz egitea, berak mezu bat ulertzea, transkribatu edota hitz gako batzuen bitartez bilaketa batzuk egin edota gailu bat aktibatzea. Aholab taldea berriro hizpide hartuta, testuak transkribatzeko prototipo bat lantzen ari dira, ikerkuntza mailan betiere. Talde honek euskara ere badu erreferente, bestelako aplikazioak ezagutzeko zenbait ataza landu dituzte, besteak beste domotikan aplikatzeko, elbarrientzako aplikazioak... Mementoz ezer komertzialik ez badute ere, ikerkuntzan zenbait aplikazio garatu ditu Aholab taldeak. Finantziazio aldetik, tresna hauek garatzeko datu base onak behar direnez inbertsio handiak egin behar direla jakinarazi digu Karmele Lopez de Ipiñak. "Datu guztiak bildu, etiketatu eta tratatzeko baliabideak behar dira eta finantziazioa ezinbestekoa da. Nire ustez erakundeak sartuko dira finantziazio honetan eta hiru urte barru egoera aldatzea espero dut. Izan ere, honek beste sistema batzuk garatu eta aurrerapen, ikerkuntza eta baliabide gehiago edukitzea ekarriko bailuke. Memento honetan bilaketak egiteko finantziazioa eta denbora ez da hain handia. Urte honetan behingoz zerbait operatiboa eta erabilgarria edukitzea espero dugu".
Hizkuntzaren tratamenduari dagokionez, bat dator Aholabeko kidea Josu Waliñorekin, hots, euskara informatikoki landua izateko zailtasun nagusia hizkuntzaren egitura morfologikoa dela adierazi digu: «Zailtasun honen aurrean beste eredu batzuk aurkitu behar izan ditugu, esaterako turkiera. Ahotsa eta hotsak grabatzeko ez dugu batua bakarrik erabili, euskalki guztiak baizik, batez ere hots ezberdinak egon daitezkeelako».
Naturaltasuna da sistema hauen helburua. Orain arte eginiko sistemak deserosoak izan dira erabiltzailearentzat. Memento honetan, sistema eleanitzak, erosotasuna eta erabilgarritasuna dira nazioarte mailan gehien lantzen ari diren esparruak. Horretarako, baliabideen optimizazioa hartzen da kontuan. Euskal Herrian ordea, helburu horiek murriztu egiten dira, helburu "errealagoak" finkatuz. "Ikerkuntza taldean nazioarteko kongresuetara mugitzen gara, ezinbestekoa baita kanpoko jendearekin harremanak mantentzea sistemak garatzeko eta eurengandik ikasteko. Askotan euskarak baliorik ez duela iruditzen bazaigu ere, gure lanak nazioartean erakustean, euskararen egitura berezia duenez, jendea asko hurbiltzen zaigu. Guk esaterako, turkiera eta japoniera ditugu eredu bezala, erabiltzen duten egitura antzekoa baita", azaldu digu Karmele Lopez de Ipiñak. Bere esanetan, gu ez gaude nazioartekoen mailan, finantziazioa eta baliabideak falta baitzaizkigu. Dena den, egun, erakunde eta enpresen aldetik interes handia omen dago.
Ahots errekonozimenduaren barnean, robotizazioa eta domotizazioa ere aurkitzen dira. Batak robotek agindupean gizakiak esanikoa burutzea bilatzen du eta besteak berriz, etxeko gailuek gure ahotsaren aginduak betetzea. Sistema hauek errazagoak dira, hitz sinpleak direlako. Arazoak ordea, aplikazioa garatzeko modua bilatzerakoan sortzen dira. Hizketa ezagutza ez da oso konplexua, zailtasuna arlo teknikoan dute gehienbat.
Etorkizunari begira, "nazioartean dituzten tresnak Euskal Herrian edukitzea izango litzateke ikerlarion ametsa", adierazi digu Aholabeko kideak. Tresna ugari daude, telefono bidezko aplikazioak esaterako. Elkarrizketa sistema batzuk beste hizkuntza batzuetan garatuta daude. Katalunian esaterako, eguraldia kontsultatzeko zerbitzu hau eskaintzen da. 906 789 987 zenbakira deitu eta sistema automatiko batek hartzen du deia. Lengoaia naturalaz baliaturik eguraldiari buruz informazioa eskatu dezakezu. Sistema hau Kataluniako Unibertsitate Politeknikoko TALP ikerketa taldeak garatu du. Antzeko sistemak garatu dituzte Telepizza eta Renfek, besteak beste.
Hizkuntza idatziaren tratamendua
Garapen eta tratamendu egokiak lortzeko beraz, gai honetan ikerle eta aditu direnek gizarte eskariari begiratu behar zaiola diote. Sistema eta aplikazio horiek lantzeko eta helburu hori lortzeko ordea, ikerketa taldeek, industriak eta erakunde ofizialek koordinatu egin behar dute. Noiz izango dugu posible teknologia guztiak lengoaia naturalaren bitartez maneiatzea? Finantziazioak eta dedikazioak izango dute horren erantzuna. Hori da euskarak teknologien munduan bere lekua izateko eta gure hizkuntzari esparru honetan etorkizun bat ziurtatzeko modu bakarra.
![]() |
|
||||
1899 zenbakia. Azkena || Hemeroteka
|
© 2008-2011 Argia.com - Komunikazio Biziagoa