El reconocimiento de voz es uno de los retos clave de la interacción hombre-máquina. Para construir un reconocedor de voz se necesitan dos cosas: (1) un software que modele la correspondencia entre audio y fonemas, y (2) una cierta cantidad de datos de voz, generalmente de múltiples hablantes, con los que aprender tal correspondencia (es lo que se conoce como entrenamiento). Respecto al software, existen herramientas públicamente accesibles como HTK o como la reciente Kaldi, que a juzgar por comparativas publicadas en artículos científicos funciona muy bien. Existen también otras aproximaciones basadas en DNNs. El objetivo de este proyecto es analizar diversas alternativas e implementar un reconocder para el euskera utilizando la que se considere más adecuada, usando para entrenarlo las bases de datos de voz disponibles en Aholab.
Requisitos: manejo de Linux , buenas dotes de programación (en algún punto será necesario tanto programar scripts como entender código), inglés , interés por aprender sobre tecnologías de la voz.
Se valorará: Python, Tensorflow
Directores: Inma Hernáez y David Tavárez (inma.hernaez@ehu.eus)