Project Title: Sistema multilingüe para la obtención de voces sintéticas personalizadas orientado a personas con discapacidad oral
Finnaced by: Eusko Jaurlaritza / Gobierno Vasco (SAIOTEK call)
Project manager: Daniel Erro
Participants: UPV/EHU (AhoLab)
Team: Daniel Erro, Inma Hernáez, Eva Navas, Iñaki Sainz, Dani Erro, Ibon Saratxaga, Jon Sanchez, Agustín Sánchez
Begin date: Jan-2013
End date: Dec-2013
Este proyecto se plantea como continuación del proyecto Saiotek 2011, ejecutado en los ejercicios 2011 y 2012 con acrónimo ZURE_TTS y título “Sistema para la obtención de voces personalizadas con aplicación a personas con discapacidad oral”. En dicho proyecto, además de desarrollarse las técnicas y algoritmos necesarios para proporcionar voces sintéticas personalizadas mediante la adaptación de una “voz promedio”, se desarrolló un portal web, http://aholab.ehu.es/ZURE_TTS, que permite el acceso al sistema a usuarios no especializados. En este proyecto se plantea avanzar en el desarrollo de dicho portal abordando dos apectos del mismo: (i) desarrollo de nuevas técnicas que mejoren la calidad de las voces sintéticas obtenidas en condiciones de escasez de muestras de la voz objetivo; (ii) avanzar en la difusión del trabajo mediante la incorporación de los idiomas gallego y catalán, junto con el inglés.
Adicionalmente se realizará una evaluación formal del sistema para los idiomas castellano y euskera, considerando aspectos como el volumen de datos disponible para la voz objetivo y la elección de la técnica de adaptación, de modo que se pueda estudiar su influencia sobre la calidad de la voz sintética resultante.
Así, los objetivos específicos del proyecto aquí propuesto son:
La razón de ser de este proyecto es la de afianzar la reorientación recientemente emprendida en Aholab hacia actividades de un mayor contenido social, es decir, que proporcionen un servicio a la sociedad en general y a las personas afectadas por trastornos del habla en particular. El proyecto permitirá aplicar la enorme experiencia del grupo, las herramientas que ha ido desarrollando a lo largo de los años y sus bases de datos de material de voz a un área de trabajo menos atractiva para compañías privadas por proporcinar beneficios económicos mucho más limitados. En lo que respecta a los objetivos concretos arriba enumerados, este proyecto permitirá hacer llegar la tecnología a más usuarios, de manera especial a aquellos que por sus limitaciones no están en disposición de grabar una gran cantidad de muestras de su voz. Además, al finalizar este proyecto se habrán sentado las bases para comenzar a trabajar en la personalización de voces sintéticas a partir de muestras de voces ya deterioradas por patologías diversas.
Por último, un efecto lateral del proyecto será la adquisición de nuevo material de voz, el grabado por los usuarios, que redundará en mejoras de la tecnología de Aholab en general.