Aholab is the short name of the Signal Processing Laboratory of the University of the Basque Country (UPV/EHU). The laboratory is located in Bilbao. We are a university research team and focus our research in the areas of Text to Speech Conversion, Speech and Speaker Recognition, and Speech Processing in general. Since 2005 we are a recognized research group of the Basque Research Network. The laboratory is part of the Basque Center for Language Technology (HiTZ) and the Department of Communications Engineering of the Faculty of Engineering of Bilbao (ETSI).
Kontratuaren iraupena: 16 hilabete
Lanpostu kopurua: 2
Lanpostuaren deskribapena: Informatikaren edo telekomunikazioen arloko bi pertsonaren bila gabiltza, adimen artifizialarekiko eta neurona-sareekiko grinarekin. Proiektu zirraragarri honetan, ahotsak sortzeko eta ezagutzeko sistemak garatzen eta hobetzen lan egingo duzu.
Erantzukizunak:
Baldintzak:
Onurak:
Gure taldearekin bat egitea eta ahotsa ezagutzeko teknologiaren etorkizunera laguntzea gustatzen bazaizu, zure eskaera jasotzea espero dugu! Idatz iezaguzu!
Aholab Taldeak eta HiTZ zentroak euskaraz ahotsa ezagutzeko sistema berria aurkeztu dute. Aurrerapen teknologiko horrek pertsonen eta teknologiaren arteko elkarrekintza eraldatzeko ahalmena du, bereziki euskal hizkuntzaren eremuan.
Sistema hori euskarazko 548 orduz entrenatu da, hainbat iturri publikotatik datorrena (Mozilla Common Voice 16.1, Basque Parliament, OpenSLR). Horri esker, erabiltzaileek hitz egiten dituzten hitzak eta esaldiak zehaztasunez ezagutzen ditu, eta WER kalitate-maila %5etik beherakoa da.
Aurrez aurretik entrenatutako bi eredu sortu dira, NVIDIA ereduetan oinarrituak. Horietako bat teknika klasikoagoak erabiliz sortutako hizkuntza-eredu bat da, eta bestea, berriz, transducer‑etan oinarritutako teknologia berriagoak erabiliz sortu da. Ereduen entrenamendua DIPCko zerbitzarien Hyperion sisteman egin da.
Garatutako sistema, potentzialki, laguntzaile birtualetan sar daiteke, mezuak bidaltzeko, informazioa bilatzeko edo agenda-notak ezartzeko. Telefono-deien erantzunak automatizatzeko aukera ere eman lezake, eraginkortasuna eta bezeroarentzako arreta hobetuz. Eta, zalantzarik gabe, euskarazko audio-grabazioen transkripzioa erraztuko du.
Esteka honetan dago eskuragai hizketa euskaraz ezagutzeko sistemaren demoa Sortutako ereduak ere Gaitu-Data webgunean daude eskeragai. Ikerketa taldeak hori erabiltzeko eta teknologia hobetzen jarraitzeko iruzkinak egiteko gonbita egiten dio komunitateari. Euskal komunitatearentzat tresna baliotsua izatea eta gure hizkuntza indartzen laguntzea espero dugu.
Gurekin ikastera etortzea pentsatu dutenei, egiten duguna azaltzen diegu.
Ate irekien jardunaldia – Bilboko Ingeniaritza Eskola – UPV/EHU
In the framework of the DeepRestore project, acquired EMG signals will be converted into speech. Combination with lip-reading modality will also be tested. The main tasks for the candidate will be:
a) taking part in the design and performing of EMG and video recordings
b) to process and prepare the acquired signals
c) to investigate and evaluate different deep learning strategies to decode the signals into speech
d) to document the process and contribute to scientific publications.
The candidate should preferably have a BSc degree in telecommunications engineering, artificial intelligence, computer science or equivalent preferably with a MSc. Degree. Outstanding curriculum vitae, good programming abilities, education in machine learning and experience in programming is necessary. Strong motivation, team working skills, and fluent spoken and written English will be highly appreciated.
The candidate should send an e-mail in English to inma.hernaez@ehu.eus with a CV and a brief description of the applicant particular merits to get the position. All applications will be considered regardless of gender, age, cultural background, nationality or impairments. Open until filled.