Hizking21 hizkuntz ingeniaritza XXI. mendearen
atean
Testuen
prozesutik haratago, konputagailuek hizkuntzaren alorrean egin
dezaketena jorratzen du hizkuntz ingeniaritzak. Makinekin
komunikatzeko bidea gero eta naturalagoa izatea da, besteak beste,
helburu orokorra: erabiltzailea ohi duen bezala mintzatuko da, edo
idatziko du, eta makinek ulertu egingo diote, eta, hala programatuz
gero, obeditu ere bai. Lehendik grabatutako mezuak errepikatu
beharrean, mezu komunikatiboak sortuko dituzte makinek, idatzizkoak
zein hitzezkoak. Horretarako, ordea, bide luzea eta oinarrizko lan
handia egin behar da.
 |
(Argazkia: G.
Andonegi). |
Hizking21 izenaz
ekin zaion proiektuaren helburua hau da: 2005 urterako, gaur egun
ingeleserako dauden tresna infolinguistikoak euskaraz ere izatea.
Horietako asko euskararako propio sortuak izango dira, beste batzuk
beste hizkuntzetarako daudenak egokituz lortuak. Euskararen
morfologia eta sintaxi berezia direla eta, lehenago inork jorratu
gabeko arazoak topatuko dira, eta horiek gainditzeko garatzen den
teknologiak Euskal Herria mundu mailako erreferentzia bilaka lezake
alor honetan.
Zer dagoen egun
Gaur egun
euskarazko hizkuntz teknologia informatikoak aipatzekotan,
ezinbestekoa da Euskal Herriko Unibertsitateko IXA eta Aholab
taldeak aipatzea. Hizkuntzaren tratamendurako hainbat tresna
informatiko garatu dituzte: zuzentzaile ortografikoa,
lematizatzailea, desanbiguatzailea, etab.; eta horiek izango dira,
hein handi batean, proiektuaren abiapuntua. Horiek lan egingo
badute, ordea, erreferentziak behar dituzte, lexikoiak; eta horiek
osatu eta eguneratzeko berriz, ezinbesteko tresna bilakatu dira
corpusak, hizkuntza errealaren isla diren testu-biltegi sailkatu,
etiketatu eta antolatuak.
 |
Zenbat eta gehiago garatu hizkuntza naturalaren
prozesamendua, orduan eta aiseago erabili ahal izango dira
lan-tresna informatikoak. (Argazkia: G.
Andonegi). |
Elhuyarrek
urteetan zehar hiztegigintzan egindako lanak, bai hizkuntz
hiztegietan bai hiztegi teknikoetan, baliabide aproposa izango dira
aipatu lexikoi horiek osatu eta elikatzeko. Zientzia eta Teknikaren
alorrean osatu eta bildu duen materiala ere baliotsua izango da oso
corpus bereziak sortze bidean.
Aholabek
ahotsaren analisia eta tratamendua du bere jardun nagusia.
Ahots-formatuko fitxategi batetik testu idatzira igarotzeko tresnak
baditu, eta alderantzizkoak ere bai. Horretarako ere ezinbestekoa da
erreferentziak izatea: makinari ‘entzun’ duena nola ezagutu eta nola
‘idatzi’ behar duen irakatsi behar zaio.
Horra bitarteko
tresna eta baliabideak euskarari estu lotutakoak dira. Beraz,
gehienak propio garatutako teknologiaz egindako programak dira.
Interfazeei dagokienez, berriz, beste hizkuntzetan dagoeneko
aurreratutako lanaren zati bat baliagarria den arren —avatarren
diseinua oso aurreratuta dago—, euskaraz hitz eginarazi behar zaie.
Horretan ere Aholabek eta Vicomtechek beren bidea egina dute eta
aurrera segituko dute.
Robotiker
Fundazioa erreferentzia da ekipoen arteko konektagarritasunaren
arloan Euskal Herrian, eta oinarrizko teknologiaren ardura izango du
Hizking21en. Euskal Herrian, dena dela, badira alor horretan
diharduten beste agente batzuk ere, hala nola ASP, Diana
Teknologia...
Zer dagoen egiteko (....)
|