Interes-arloak – Aholab-GTTS

Dibertsitate funtzionalerako ahots-teknologiak

Euskal Herrian batez ere euskararentzat hedapen maila altua lortu duen testua ahots bihurtzeko sistema bat garatu du taldeak. Proiektu honetan sare neuronaletan oinarritutako tekniken ikerketa proposatzen da, gaur egungoa baino kalitate handiagoko TTS (testu-ahots bihurketa) bat lortzeko.
Horrez gain, ahots pertsonalizatuen kalitatea hobetu nahi da, sare neuronalak erabiliz ahotsak egokitzeko estrategiak ikertuz. Bereziki garrantzitsua da ahotsa pertsonalizatzeko gaitasuna patologia duen ahots-emaileen kasuan: helburua emailea ordezkatzen eta identifikatzen duten ahots sintetikoak lortzea da, haren komunikazio-gailu alternatiboan integratuta erabil dezan.
Bestalde, mintzamenean patologiaren bat duten pertsonek pairatzen duten muga handienetako bat sistema automatikoek ulertzeko daukaten zailtasuna da. Proiektuan hainbat estrategia ikertuko dira, sare neuronal sakonen erabileran oinarrituta, seinaleak hobeto ulertzeko moduan bihurtzeko, ASR sistemen aldean bereziki.

Azpititulatze automatikoa eta ahozko eta idatzizko terminoen bilaketa ikus-entzunezko baliabide eleanitzetan

Taldeak Eusko Legebiltzarreko saioen audio- eta testu-datu ugari ditu, gaztelaniaz eta euskaraz. Datu horiek aukera ematen diote talde berriari lehendik eskuragarri dauden eredu akustikoak eta aurrez garatutako eta Euskal Autonomia Erkidegoko beste eragile teknologiko batzuk (Elhuyar Fundazioaren hiztegia) erabiltzen ari diren ezagutza-sistemaren hizkuntza-ereduak hobetzeko. Fase berri honetan, beharrezko kudeaketak egin nahi dira, datu horiek euskararentzat etengabeko hizketaren aitortzailea izan daitezen, eta beste eragile teknologiko batzuen eskura jar daitezen merkaturatzeko. 3 urteko saio parlamentarioen datu-base bat garatzen da, eta hortik 4 ordu inguru aterako dira kalitate handiko etiketekin. Zati hori ikertzaile-komunitatearen eskura jarriko da datuak banatzeko agentzien bidez (LDL, ELRA). Halaber, parlamentu-saioen azpititulu automatikoko prototipo bat garatu nahi da, esatari-aldaketak eta hizkuntza-aldaketak detektatzeko gai izango dena, eta audioa behar bezala lerrokatu beharko du, eskuzko transkripzioak (saioen akta ofizialetatik lortutakoak) eta hizketaren errekontziente automatikoaren bidez lortutako transkripzio automatikoak erabiliz.
Informazioa automatikoki ateratzeari dagokionez ere, taldeak lankidetzan arituko dira, biek esperientzia baitute arlo horretan. Helburu orokorra da gaur egun erabilgarri dauden sistemen ahots- eta testu-bilaketa hobetzea, batez ere ezaugarriak ateratzeko prozesuan sare neuronal sakonak sartuz (geroagoko fonetikoak edo BNFak).

Ibilgailuen zaratak detektatzea eta sailkatzea

Taldeak ildo horretan egindako ikerketa Mercedes-Benz Vitoria enpresarekin egindako lankidetzatik sortu da, eta oso hurbil dago teknologiak fabrikazio-prozesuan eta instalazioaren kalitatean aplikatzetik.
Ibilgailuen soinu-kalitatea kontrolatzeko prozeduren barruan, erabakigarria da burrunba, kirrinka eta trakets motako zaratak egotea (buzz, squeak and rattle, BS&R), eta, horregatik, ikerketa-ildoa sare neuronalak aplikatzera bideratzen dugu soinu-gertaera horiek detektatzeko.
Erronka garrantzitsuena detekzio-sistema horiek gidatze-ingurune erreal batean aplikatzea da, BS&R-ren zarata gogaikarriak gertatzen diren tokian, hain zuzen ere. Sistema automatikoak oso sendoa izan behar du, zaratarekiko seinale-harremanaren baldintza oso txarretan funtzionatzeko ingurune oso aldakorretan: ibilgailu-tipologia desberdinak, gidatze-baldintza desberdinak eta zarata-iturri desberdinak.
Helburua entzumen-sistema automatiko bat sortzea da (machine listening), instalazioaren kalitate-kontroleko eta analisi funtzionaleko prozeduretan integratuko dena, eta ibilgailuaren soinu-kalitatean eragina duten zarata desatseginak hautematea, sailkatzea eta aurkitzea erraztuko duena.