Berriak Ezbaika Zerbitzuak Ikusentzun Denborapasa Gara Webgida
GARAn GAUR
 Euskal Herria
 Ekonomia
 Mundua
 Gizartea
 Herriak
 Iritzia
 Kirolak
 Kultura

BILAKETAK
 
 15/07/03 |
Gizartea >
Rafa SAIZ Hizking 21 proiektuko koordinatzailea
«Gure hizkuntza naturalaren bidez makinekin komunikatzea da helburua»

Rafa Saiz, Elhuyarko kidea, Usurbilen egoitza duen Hizking 21 proiektuko arduraduna da. ­Teknologia berrientzat euskarazko hizkuntz aplikazioak sortzea al da Hizking 21 proiektuaren azken helburua? Aplikazioak gero etorriko dira. Aldez aurretik lan asko dago egiteko. Pentsa dezagun aplikazioa makina bat dela eta hainbat pieza behar dituela. Guk sortuko ditugu beharrezkoak diren pieza horiek. Aplikazio bat izan daiteke, adibidez, diktaketak egiteko programa; guk testu bat diktatzea eta makinak idaztea. Aplikazioa azken muntaia baino ez da, baina horretara iristeko pauso asko eman behar dira. Makinak diktatzen zaizkion soinu horiek zein hitz diren interpretatzen jakin behar du, eta hitz horiek nola idazten diren, nola transkribatu behar dituen pantailan ere jakin behar du. Testuak ulertu eta zuzentzeko gai izango diren aplikazioak ere izango ditugu aurrera begira. Azken batean, guk intuizioz egiten ditugun gauza asko makinei egiten irakatsiko diegu. Ixa taldeak zuzentzaile ortografiko bat badu, adibidez. Hurrengo pausoa zuzentzaile gramatikala izango da. Horrelako tresna txiki asko beharrezkoak dira gero aplikazio handiak sortzeko.

­Horrek esan nahi du ordenagailuei euskaraz irakatsi behar zaiela. Makinek ez dakite hizkuntzarik, noski, baina gure hizkuntza zein den eta gu nola komunikatzen garen irakatsi behar diegu. Orain arte, gizakiak makinekin komunikatzeko, haien hizkuntza edo protokolo batzuk ikasi behar izan ditugu. Batez ere hastapenetan. Gerora gauza horiek leunduz joan dira, eta komunikazio hori geroz eta errazagoa bihurtu da. Orain helburua beste bat litzateke: gizakion komunikazio bide normala hizkuntza da. Ahozko hizkuntza da gainera naturala eta ez idatzizkoa. Azken helburua litzateke gu makinekin komunikatu ahal izatea gure artean egiten dugun bezala.

­Hizkuntza naturalaren aldeko apustu hori ez da erraza izango. Ez dugu idazten hitz egiten dugun moduan. Askotan idatziz bizitasuna galtzen da. Intonazioa galtzen da, esaterako, nahiz eta puntuazioa txukun jarri. Ahozko hizkuntza askoz ere naturalagoa da, eta baditu zenbait gauza idatziz jarri ezin direnak. Intonazioa, keinuak... Horrek guztiak erakusten du askoz ere zailagoa dela ahozko hizkuntza informatikoki tratatzea. Aberatsagoa delako, hasteko. Horregatik da azkenean datorren partea. Helburua da, adibidez, inoiz telefonoz etxean ditugun tresna elektrikoei agindu bat eman behar badiegu, ez egotea denbora luzez zain, gaur egun Euskaltelera deitzen dugunean, adibidez, egon behar dugun bezala. Egungo teknika oso oinarrizkoa da. Makinak esaten digu zer nahi dugun, guk erantzuten diogu, eta berak berriz galdetzen digu ea ondo ulertu duen ziurtatzeko. «Telefonoa kargatu nahi duzu?», «bai», «bai esan duzu?», «bai». Helburua da lagun bati hitz egiten diogun moduan hitz egin ahal izatea makinari ere. Lauzpabost urte barru lortzeko helburua litzateke hau.

­Euskararen berezitasunek, euskalkiek esaterako, zaildu egingo al dute prozesu hori?

Hizkuntza guztietan gertatzen dira antzekoak. Azentuak, hizketarako zailtasun bereziak dauzkaten pertsonak, aldaera geografikoak... Gaztelaniak, adibidez, ikaragarriak ditu. Ez bakarrik Espainian; Hego Amerika osoan eta Ipar Amerika osoan ere azentuak eta erregistroak erabat ezberdinak dira. Eta, hala ere, horrelako programak aurrera ateratzen dira. Ingelesarekin, beste hainbeste. Zailtasun horiek kontuan hartu behar dira, beti egongo baitira. Baina ez euskararen kasuan bakarrik. Edonola ere, horrelako programak sortzeko, idatzizko komunikazioan eta ahozkoan, ezinbesteko elementu bat izaten da corpus izenekoa. Euskararen corpusa da euskaraz egin diren testuen bilduma adierazgarria eta ondo antolatua. Zertarako? Gero programek erreferentzia bezala erabil dezaten. Euskaltelen adibidearekin jarraituz, orain dela urte batzuk egin ziren telefono bidezko grabazioak ditugu. Euskaraz galdera batzuk egin, eta jendeari erantzuteko eskatzen zitzaion. 600 edo 1.000 hiztunen hizketa eskuratu zen horrela. Hitz berdinak, baina mila pertsonek esanak. Horiek corpus bat osatzen dute. Orain Euskaltelera deitzen dugunean, eta, adibidez, «sei, zazpi, zortzi» esaten dugunean, makinak gure grabazioa alderatzen du dauzkan ahots horiekin. Hortik egiaztatzen du esan dugun hori «sei, zazpi, zortzi» dela, eta ez beste ezer.

­Nondik sortu zen Hizking 21 proiektua?

Elhuyar Fundazioak eta Ixa Taldeak aspalditik dauzkate harremanak, eta bien artean Eleka hizkuntza ingeniaritza enpresa sortu dute, horrelako produktuak sortu eta saltzeko. Harreman bat bazegoen, beraz, oinarrizko gauzak egiteko. Baina asmo handizaleagoak ere baziren. Adibidez, EHUko Aholab laborategia orain dela denbora bat garatzen hasitako ahots tesia eta ahotsaren alorreko gaiak. Elhuyarrek eta Ixak idatzizko testuekin egindako lana Aholabek ahotsarekin egin du. Robotikerrek eta Vicomtechek ere hizkuntz teknologien beste hainbat arlo landu dituzte. Vicomtechek interfaceak landu ditu, esaterako. Horrek balio du, adibidez, Betizuko pertsonaiek hizketan egiteko. Guk makinari idatzizko testua emanda, horrek gai izan behar du testu hori irakurtzeko, pertsonaiari ahoskarazteko eta, gainera, pertsonaiaren aurpegiaren mugimendu errealak eragiteko. Robotikerrek, berriz, oinarrizko teknologiak eta telekomunikazioak oso landuak ditu. -



 Iritzia 
Ikusmira

El Partido Popular no se frena ante nada
Paperezko lupa
Maite Soroa
Les falta deportividad
Editoriala

Cinco años
Kolaborazioak
Olaso
Abordar
Jo puntua
Jon Odriozola - Periodista
Gora GARA!
Gaurkoa
Teresa Toda - Periodista
Cierre de «Egin»: otros «daños colaterales»
Kolaborazioak
Fermín Gongeta - Sociólogo
Sobre Jürgen Habermas
Kolaborazioak
Josu Amezaga - Profesor de la UPV/EHU
Identidad vía satélite: Canal Vasco
Txokotik
Martin Garitano
Ganar un año


Baigorri Argitaletxea S.A Gipuzkoa: Portuetxe, 23-2.a/20018 Donostia
Tel 943 316999/FAX 943 316998