ZerNola.net
eguneratze-data 2003/10/20

2003/09/01
Saiz Elizondo, Rafa


Elhuyar Z. eta T. 190. zk.


Testua bere osotasunean Elhuyar Zientzia eta Teknika aldizkarian duzu. 190. aleko artikuluak azarotik aurrera izango dituzu eskuragarri Zientzia.Neten.

Hizking21 hizkuntz ingeniaritza XXI. mendearen atean

Testuen prozesutik haratago, konputagailuek hizkuntzaren alorrean egin dezaketena jorratzen du hizkuntz ingeniaritzak. Makinekin komunikatzeko bidea gero eta naturalagoa izatea da, besteak beste, helburu orokorra: erabiltzailea ohi duen bezala mintzatuko da, edo idatziko du, eta makinek ulertu egingo diote, eta, hala programatuz gero, obeditu ere bai. Lehendik grabatutako mezuak errepikatu beharrean, mezu komunikatiboak sortuko dituzte makinek, idatzizkoak zein hitzezkoak. Horretarako, ordea, bide luzea eta oinarrizko lan handia egin behar da.

(Argazkia: G. Andonegi).

Hizking21 izenaz ekin zaion proiektuaren helburua hau da: 2005 urterako, gaur egun ingeleserako dauden tresna infolinguistikoak euskaraz ere izatea. Horietako asko euskararako propio sortuak izango dira, beste batzuk beste hizkuntzetarako daudenak egokituz lortuak. Euskararen morfologia eta sintaxi berezia direla eta, lehenago inork jorratu gabeko arazoak topatuko dira, eta horiek gainditzeko garatzen den teknologiak Euskal Herria mundu mailako erreferentzia bilaka lezake alor honetan.

Zer dagoen egun

Gaur egun euskarazko hizkuntz teknologia informatikoak aipatzekotan, ezinbestekoa da Euskal Herriko Unibertsitateko IXA eta Aholab taldeak aipatzea. Hizkuntzaren tratamendurako hainbat tresna informatiko garatu dituzte: zuzentzaile ortografikoa, lematizatzailea, desanbiguatzailea, etab.; eta horiek izango dira, hein handi batean, proiektuaren abiapuntua. Horiek lan egingo badute, ordea, erreferentziak behar dituzte, lexikoiak; eta horiek osatu eta eguneratzeko berriz, ezinbesteko tresna bilakatu dira corpusak, hizkuntza errealaren isla diren testu-biltegi sailkatu, etiketatu eta antolatuak.

Zenbat eta gehiago garatu hizkuntza naturalaren prozesamendua, orduan eta aiseago erabili ahal izango dira lan-tresna informatikoak. (Argazkia: G. Andonegi).

Elhuyarrek urteetan zehar hiztegigintzan egindako lanak, bai hizkuntz hiztegietan bai hiztegi teknikoetan, baliabide aproposa izango dira aipatu lexikoi horiek osatu eta elikatzeko. Zientzia eta Teknikaren alorrean osatu eta bildu duen materiala ere baliotsua izango da oso corpus bereziak sortze bidean.

Aholabek ahotsaren analisia eta tratamendua du bere jardun nagusia. Ahots-formatuko fitxategi batetik testu idatzira igarotzeko tresnak baditu, eta alderantzizkoak ere bai. Horretarako ere ezinbestekoa da erreferentziak izatea: makinari ‘entzun’ duena nola ezagutu eta nola ‘idatzi’ behar duen irakatsi behar zaio.

Horra bitarteko tresna eta baliabideak euskarari estu lotutakoak dira. Beraz, gehienak propio garatutako teknologiaz egindako programak dira. Interfazeei dagokienez, berriz, beste hizkuntzetan dagoeneko aurreratutako lanaren zati bat baliagarria den arren —avatarren diseinua oso aurreratuta dago—, euskaraz hitz eginarazi behar zaie. Horretan ere Aholabek eta Vicomtechek beren bidea egina dute eta aurrera segituko dute.

Robotiker Fundazioa erreferentzia da ekipoen arteko konektagarritasunaren arloan Euskal Herrian, eta oinarrizko teknologiaren ardura izango du Hizking21en. Euskal Herrian, dena dela, badira alor horretan diharduten beste agente batzuk ere, hala nola ASP, Diana Teknologia...

Zer dagoen egiteko
(....)


Testua bere osotasunean Elhuyar Zientzia eta Teknika aldizkarian duzu. 190. aleko artikuluak azarotik aurrera izango dituzu eskuragarri Zientzia.Neten.

 


Beste artikulu batzuk:

Mac OS X sisteman dabilen Photoshop 7.0 iritsi da
2002/04/01
Maclink plus/translators
1990/10/01
Mandrake Linux 8.2 euskaraz
2002/03/21
Mapa genetikoa azkarrago osatzeko teknika
2001/06/11
Math Talk: ahotsaren bidez formula matematikoak idazteko programa
2000/05/01