Somos un equipo de investigación universitario y centramos nuestra investigación en las áreas de conversión de texto a voz, reconocimiento de voz y del hablante y procesamiento del habla en general. Desde 2005 somos un grupo de investigación reconocido de la Red Vasca de Investigación. El laboratorio forma parte del Centro Vasco de Tecnología del Lenguaje (HiTZ) y del Departamento de Ingeniería de Comunicaciones de la Escuela de Ingeniería de Bilbao (ETSI).
Nos centramos en las siguientes áreas específicas:
- Conversión de texto a voz: El grupo dispone de su propio sistema de conversión de texto a voz multilingüe, en inglés, español y euskera. Nuestro sistema AhoTTS en euskera (aholab.ehu.es/TTS) es el único íntegramente desarrollado en el País Vasco y está disponible de forma gratuita. También es capaz de generar habla sintética emocional.
- Síntesis del habla: Se dedica un gran esfuerzo de investigación a los algoritmos y tecnologías de generación de voz sintética, para ser incorporados a AhoTTS para su evaluación, con especial atención a las voces personalizadas y ayudas vocales para trastornos del habla. A lo largo de los últimos 25 años se han desarrollado y evaluado prácticamente todas las tecnologías de generación de voz más modernas.
- Modelado de prosodia: Se han desarrollado modelos de prosodia y técnicas de generación de prosodia específicos para el euskera, prestando especial atención al análisis de la prosodia y a las técnicas de conversión aplicadas a la generación de discurso emocional.
- Reconocimiento de voz: El grupo ha desarrollado varias bases de datos públicas para el desarrollo y prueba de sistemas de reconocimiento de voz en euskera, todas ellas disponibles a través de ELRA. También se ha desarrollado un sistema de reconocimiento de palabras aisladas y conectadas de vocabulario reducido en euskera y actualmente se está desarrollando un reconocedor de habla continuo.
- Reconocimiento y diarización de locutores: Hemos participado en varios proyectos nacionales relacionados con el reconocimiento de locutores. El reconocimiento de las emociones del hablante también ha sido un campo de investigación muy activo y productivo durante los últimos años.
- Machine Listening: Trabajamos en el reconocimiento automático de sonidos a través de redes neuronales, aplicándolo a la detección y clasificación de eventos sonoros en automóviles y a la clasificación de entornos acústicos urbanos. Tenemos varios proyectos con empresas interesadas en aplicaciones en esta área.