Gizartea > Rafa SAIZ Hizking 21 proiektuko
koordinatzailea «Gure hizkuntza
naturalaren bidez makinekin komunikatzea da helburua»
Rafa Saiz, Elhuyarko kidea,
Usurbilen egoitza duen Hizking 21 proiektuko arduraduna da.
Teknologia berrientzat euskarazko hizkuntz aplikazioak sortzea
al da Hizking 21 proiektuaren azken helburua? Aplikazioak gero
etorriko dira. Aldez aurretik lan asko dago egiteko. Pentsa dezagun
aplikazioa makina bat dela eta hainbat pieza behar dituela. Guk
sortuko ditugu beharrezkoak diren pieza horiek. Aplikazio bat izan
daiteke, adibidez, diktaketak egiteko programa; guk testu bat
diktatzea eta makinak idaztea. Aplikazioa azken muntaia baino ez da,
baina horretara iristeko pauso asko eman behar dira. Makinak
diktatzen zaizkion soinu horiek zein hitz diren interpretatzen jakin
behar du, eta hitz horiek nola idazten diren, nola transkribatu
behar dituen pantailan ere jakin behar du. Testuak ulertu eta
zuzentzeko gai izango diren aplikazioak ere izango ditugu aurrera
begira. Azken batean, guk intuizioz egiten ditugun gauza asko
makinei egiten irakatsiko diegu. Ixa taldeak zuzentzaile ortografiko
bat badu, adibidez. Hurrengo pausoa zuzentzaile gramatikala izango
da. Horrelako tresna txiki asko beharrezkoak dira gero aplikazio
handiak sortzeko.
Horrek esan nahi du ordenagailuei euskaraz irakatsi behar
zaiela. Makinek ez dakite hizkuntzarik, noski, baina gure hizkuntza
zein den eta gu nola komunikatzen garen irakatsi behar diegu. Orain
arte, gizakiak makinekin komunikatzeko, haien hizkuntza edo
protokolo batzuk ikasi behar izan ditugu. Batez ere hastapenetan.
Gerora gauza horiek leunduz joan dira, eta komunikazio hori geroz
eta errazagoa bihurtu da. Orain helburua beste bat litzateke:
gizakion komunikazio bide normala hizkuntza da. Ahozko hizkuntza da
gainera naturala eta ez idatzizkoa. Azken helburua litzateke gu
makinekin komunikatu ahal izatea gure artean egiten dugun bezala.
Hizkuntza naturalaren aldeko apustu hori ez da erraza
izango. Ez dugu idazten hitz egiten dugun moduan. Askotan idatziz
bizitasuna galtzen da. Intonazioa galtzen da, esaterako, nahiz eta
puntuazioa txukun jarri. Ahozko hizkuntza askoz ere naturalagoa da,
eta baditu zenbait gauza idatziz jarri ezin direnak. Intonazioa,
keinuak... Horrek guztiak erakusten du askoz ere zailagoa dela
ahozko hizkuntza informatikoki tratatzea. Aberatsagoa delako,
hasteko. Horregatik da azkenean datorren partea. Helburua da,
adibidez, inoiz telefonoz etxean ditugun tresna elektrikoei agindu
bat eman behar badiegu, ez egotea denbora luzez zain, gaur egun
Euskaltelera deitzen dugunean, adibidez, egon behar dugun bezala.
Egungo teknika oso oinarrizkoa da. Makinak esaten digu zer nahi
dugun, guk erantzuten diogu, eta berak berriz galdetzen digu ea ondo
ulertu duen ziurtatzeko. «Telefonoa kargatu nahi duzu?», «bai», «bai
esan duzu?», «bai». Helburua da lagun bati hitz egiten diogun moduan
hitz egin ahal izatea makinari ere. Lauzpabost urte barru lortzeko
helburua litzateke hau.
Euskararen berezitasunek, euskalkiek esaterako, zaildu
egingo al dute prozesu hori?
Hizkuntza guztietan gertatzen dira antzekoak. Azentuak,
hizketarako zailtasun bereziak dauzkaten pertsonak, aldaera
geografikoak... Gaztelaniak, adibidez, ikaragarriak ditu. Ez
bakarrik Espainian; Hego Amerika osoan eta Ipar Amerika osoan ere
azentuak eta erregistroak erabat ezberdinak dira. Eta, hala ere,
horrelako programak aurrera ateratzen dira. Ingelesarekin, beste
hainbeste. Zailtasun horiek kontuan hartu behar dira, beti egongo
baitira. Baina ez euskararen kasuan bakarrik. Edonola ere, horrelako
programak sortzeko, idatzizko komunikazioan eta ahozkoan,
ezinbesteko elementu bat izaten da corpus izenekoa. Euskararen
corpusa da euskaraz egin diren testuen bilduma adierazgarria eta
ondo antolatua. Zertarako? Gero programek erreferentzia bezala
erabil dezaten. Euskaltelen adibidearekin jarraituz, orain dela urte
batzuk egin ziren telefono bidezko grabazioak ditugu. Euskaraz
galdera batzuk egin, eta jendeari erantzuteko eskatzen zitzaion. 600
edo 1.000 hiztunen hizketa eskuratu zen horrela. Hitz berdinak,
baina mila pertsonek esanak. Horiek corpus bat osatzen dute. Orain
Euskaltelera deitzen dugunean, eta, adibidez, «sei, zazpi, zortzi»
esaten dugunean, makinak gure grabazioa alderatzen du dauzkan ahots
horiekin. Hortik egiaztatzen du esan dugun hori «sei, zazpi, zortzi»
dela, eta ez beste ezer.
Nondik sortu zen Hizking 21 proiektua?
Elhuyar Fundazioak eta Ixa Taldeak aspalditik dauzkate
harremanak, eta bien artean Eleka hizkuntza ingeniaritza enpresa
sortu dute, horrelako produktuak sortu eta saltzeko. Harreman bat
bazegoen, beraz, oinarrizko gauzak egiteko. Baina asmo
handizaleagoak ere baziren. Adibidez, EHUko Aholab laborategia orain
dela denbora bat garatzen hasitako ahots tesia eta ahotsaren
alorreko gaiak. Elhuyarrek eta Ixak idatzizko testuekin egindako
lana Aholabek ahotsarekin egin du. Robotikerrek eta Vicomtechek ere
hizkuntz teknologien beste hainbat arlo landu dituzte. Vicomtechek
interfaceak landu ditu, esaterako. Horrek balio du, adibidez,
Betizuko pertsonaiek hizketan egiteko. Guk makinari idatzizko testua
emanda, horrek gai izan behar du testu hori irakurtzeko,
pertsonaiari ahoskarazteko eta, gainera, pertsonaiaren aurpegiaren
mugimendu errealak eragiteko. Robotikerrek, berriz, oinarrizko
teknologiak eta telekomunikazioak oso landuak ditu. -
|