Finalistas en el concurso de apps de Biscaytik
Tras presentar nuestra nueva app “TTS-Aholab Obtén una voz propia” en el concurso de app de ” BicayApp Concurso de Aplicaciones’14 hemos resultado FINALISTAS!!!
Tras presentar nuestra nueva app “TTS-Aholab Obtén una voz propia” en el concurso de app de ” BicayApp Concurso de Aplicaciones’14 hemos resultado FINALISTAS!!!
Project Title: Berria.info Entzungai
Finnaced by: Ehundu S.L.
Project manager: Ibon Saratxaga
Participants:Ehundu, Aholab
Team: Ibon Saratxaga, Inma Hernáez, Eva Navas, Iñaki Sainz, Dani Erro, Jon Sánchez
Begin date: May-2013
End date: Dec-2013.
AhoLab Signal Processing Laboratory ikertaldeak garatu duen plataforma abiapuntu hartuta, Berria.info-ren testuak entzungai jarriko ditugu.
De-identification in multimedia content can be defined as the process of concealing the identities of individuals captured in a given set of data (images, video, audio, text), for the purpose of protecting their privacy. This will provide an effective means for supporting the EU’s Data Protection Directive (95/46/EC), which is concerned with the introduction of appropriate measures for the protection of personal data.
The fact that a person can be identified by such features as face, voice, silhouette and gait, indicates the de-identification process as an interdisciplinary challenge, involving such scientific areas as image processing, speech analysis, video tracking and biometrics.
This Action aims to facilitate coordinated interdisciplinary efforts (related to scientific, legal, ethical and societal aspects) in the introduction of person de-identification and reversible de-identification in multimedia content by networking relevant European experts and organisations.
Visit the project webpage for more information.
Project Title: Advanced Research in Speech Technologies for Application to Audiovisua Environments for Inclusive Human-Machine Interaction (SpeechTech4All)
Finnaced by: Spanish Ministry of Economy and Competititvity
Project manager: Inma Hernaez
Participants:UPV/EHU, UPC, UVigo (coordinator)
Team: Inma Hernáez, Eva Navas, Iñaki Sainz, Dani Erro, Ibon Saratxaga, Jon Sánchez
Begin date: Jan-2013
End date: Dec-2015.
SpeechTech4All is a project focused on advanced research in all core speech technologies (speech recognition, automatic translation and text to speech conversion) for all the official languages of Spain. It is also aimed at the recognition of the speaker’s emotional state and the building of multimodal (speech and face) and multilingual (Spanish, Galician, Catalan and Basque) experimental work-frames that allow showing the work developed.
As a result of the project significant research advances will be obtained in each of the above mentioned technologies. Some of these advances are: universal access to the service of synthetic voices customization, development of domain adaptation techniques in automatic translation and development of emotional state detection systems based in speech and face joint processing. The project will take part in the international competitive evaluation campaigns organized by Interspeech and the Red Temática de Tecnologías del Habla (RTTH).
To show the advances achieved in all the technologies considered, as well as to manifest the social character of the project, two showcases are defined:
1) The first one integrates most of the technologies considered in the project and consists on the multilingual subtitling and dubbing of audiovisual material related to education: documentaries, speeches, seminars…
2) The second one is focused on one of the true applications of speech technologies: providing speech to people who have a severe level of oral disability by the use of a speech synthesis system adapted to the specific characteristics of the speaker.
Este proyecto está cofinanciado por el Fondo Europeo de Desarrollo de Regional
Project Title: Sistema multilingüe para la obtención de voces sintéticas personalizadas orientado a personas con discapacidad oral
Finnaced by: Eusko Jaurlaritza / Gobierno Vasco (SAIOTEK call)
Project manager: Daniel Erro
Participants: UPV/EHU (AhoLab)
Team: Daniel Erro, Inma Hernáez, Eva Navas, Iñaki Sainz, Dani Erro, Ibon Saratxaga, Jon Sanchez, Agustín Sánchez
Begin date: Jan-2013
End date: Dec-2013
Este proyecto se plantea como continuación del proyecto Saiotek 2011, ejecutado en los ejercicios 2011 y 2012 con acrónimo ZURE_TTS y título “Sistema para la obtención de voces personalizadas con aplicación a personas con discapacidad oral”. En dicho proyecto, además de desarrollarse las técnicas y algoritmos necesarios para proporcionar voces sintéticas personalizadas mediante la adaptación de una “voz promedio”, se desarrolló un portal web, http://aholab.ehu.es/ZURE_TTS, que permite el acceso al sistema a usuarios no especializados. En este proyecto se plantea avanzar en el desarrollo de dicho portal abordando dos apectos del mismo: (i) desarrollo de nuevas técnicas que mejoren la calidad de las voces sintéticas obtenidas en condiciones de escasez de muestras de la voz objetivo; (ii) avanzar en la difusión del trabajo mediante la incorporación de los idiomas gallego y catalán, junto con el inglés.
Adicionalmente se realizará una evaluación formal del sistema para los idiomas castellano y euskera, considerando aspectos como el volumen de datos disponible para la voz objetivo y la elección de la técnica de adaptación, de modo que se pueda estudiar su influencia sobre la calidad de la voz sintética resultante.
Así, los objetivos específicos del proyecto aquí propuesto son:
La razón de ser de este proyecto es la de afianzar la reorientación recientemente emprendida en Aholab hacia actividades de un mayor contenido social, es decir, que proporcionen un servicio a la sociedad en general y a las personas afectadas por trastornos del habla en particular. El proyecto permitirá aplicar la enorme experiencia del grupo, las herramientas que ha ido desarrollando a lo largo de los años y sus bases de datos de material de voz a un área de trabajo menos atractiva para compañías privadas por proporcinar beneficios económicos mucho más limitados. En lo que respecta a los objetivos concretos arriba enumerados, este proyecto permitirá hacer llegar la tecnología a más usuarios, de manera especial a aquellos que por sus limitaciones no están en disposición de grabar una gran cantidad de muestras de su voz. Además, al finalizar este proyecto se habrán sentado las bases para comenzar a trabajar en la personalización de voces sintéticas a partir de muestras de voces ya deterioradas por patologías diversas.
Por último, un efecto lateral del proyecto será la adquisición de nuevo material de voz, el grabado por los usuarios, que redundará en mejoras de la tecnología de Aholab en general.
Project Title: Tecnologías del habla para el aprendizaje de segundas lenguas (L2-Ikasi)
Finnaced by: Basque Government
Project manager: Eva Navas
Participants: UPV/EHU
Team: Eva Navas, Inma Hernáez, Ibon Saratxaga, Jon Sánchez, David Tavárez
Begin date: Jan-2012
End date: Dec-2013
En este proyecto se propone la realización de un sistema de ayuda para el aprendizaje de segundas lenguas utilizando las tecnologías del habla. Las tecnologías del habla pueden aplicarse tanto en la verificación de la corrección de las respuestas dadas por el estudiante, como en la evaluación de la pronunciación de los sonidos y de la entonación y ritmo con el que se expresa el estudiante. Para la evaluación de la corrección de las respuestas se emplean sistemas de reconocimiento de habla que deben verificar que la respuesta dada es la esperada por el sistema y al mismo tiempo ser capaces de tratar con señales producidas por hablantes no nativos. En la evaluación de la pronunciación también se aplican los sistemas de reconocimiento y se dan al estudiante indicaciones acerca de la corrección de su pronunciación en función de las medidas de confianza producidas por el sistema. En el marco del proyecto será necesario recoger una base de datos adecuada para entrenar el sistema de verificación de mensajes y otras que permitan entrenar el de evaluación de la corrección en la pronunciación tanto a nivel segmental como de fluidez global, de manera que sea posible ajustar los umbrales de decisión adaptándolos al nivel del estudiante. Sistemas de este tipo son comunes para lenguas mayoritarias como el inglés o el castellano, pero no existen para lenguas minoritarias.
El objetivo principal del proyecto es pues el desarrollo de un sistema de ayuda al aprendizaje de segundas lenguas tanto para realizar la verificación de enunciados como la evaluación segmental y de la fluidez de la pronunciación, centrándolo en el aprendizaje del euskara. La consecución de este objetivo global implica el logro de otros objetivos parciales como son el diseño y la obtención de las bases de datos adecuadas para el desarrollo y ajuste de los sistemas de evaluación de la corrección de la respuesta y la pronunciación, la adaptación de las herramientas automáticas de segmentación de bases de datos a la voz de hablantes no nativos, la construcción de un sistema automático de ayuda al aprendizaje del euskara como segunda lengua y el desarrollo de la metodología de evaluación del sistema realizado.
Este proyecto se enmarca dentro de la línea de investigación sobre aplicación de las tecnologías del habla a la enseñanza en la que el grupo trabaja desde el año 2009. Este proyecto supone un gran paso adelante, al proporcionar los recursos orales necesarios para continuar la investigación y al permitir comprobar la validez de las técnicas empleadas en otros idiomas para el euskara. Las aplicaciones de las tecnologías del habla en la enseñanza de idiomas es una línea estratégica para el grupo de investigación AhoLab en la que uno de sus miembros está actualmente realizando su tesis doctoral.
Project Title: Iparrahotsa: desarrollo de una voz sintética para el euskera estándar de Iparralde
Finnaced by: EUROREGION (Aquitaine-Euskadi)
Project manager: Inma Hernaez
Participants: UPV/EHU, IKER UMR5478 (CNRS)
Team: Inma Hernáez, Eva Navas, Iñaki Sainz, Dani Erro, Agustín Alonso
Begin date: Jan-2012
End date: Dec-2014.
En este proyecto se pretende desarrollar un sistema de Conversión de Texto en Habla para el dialecto navarro-labortano estándar del País Vasco de Francia.
El habla es la principal herramienta de comunicación de que disponemos las personas y el desarrollo de recursos y tecnologías para una lengua es el único modo de mantener la lengua viva en un mundo dominado por las tecnologías de la información y las comunicaciones. Este proyecto pretende cubrir una parte del vacío de las tecnologías del habla para el dialecto vasco navarro-laburtano, dialecto tradicional y muy presente en la Baja Navarra y en Labort, utilizado aproximadamente por 50000 hablantes.
El sistema de síntesis que se propone utilizar es el llamado AhoTTS (aholab.ehu.es/TTS). Este sistema, desarrollado para varias lenguas (inglés, castellano, euskera y otras), ha sido íntegramente desarrollado para el euskera batua utilizando tecnología propia de Aholab. En este proyecto se pretenden desarrollar los recursos y herramientas necesarias para obtener dos voces sintéticas (una masculina y otra femenina) para el dialecto propuesto, así como realizar las modificaciones que sean necesarias en los módulos del sistema para su integración en el sistema AhoTTS. El sistema se desarrollará en código abierto con licencia GPL de forma que podrá ser descargado, utilizado y modificado en el futuro.
Project Title: Ber2Tek, Tecnologías de la lengua, de voz y multimedia al servicio de la Industria de las Lenguas (IE12-333)
Finnaced by: Eusko Jaurlaritza / Gobierno Vasco (ETORTEK call)
Project manager: Eva Navas
Participants: UPV/EHU (AhoLab & IXA research groups), Elhuyar, VicomTech-IK4, Tecnalia
Team: Inma Hernáez, Eva Navas, Iñaki Sainz, Dani Erro, Ibon Saratxaga, Jon Sanchez
Begin date: Jan-2012
End date: Dec-2014
BerbaTek ha sido durante 2009-2011 un proyecto Etortek en el que han participado la fundación Elhuyar, los grupos de investigación IXA y Aholab de la UPV/EHU, el centro tecnológico Vicomtech-IK4 y la fundación Tecnalia Research&Innovation, con el objetivo principal de investigar y desarrollar tecnologías lingüísticas, de voz y multimedia, para que puedan servir como base tecnológica de apoyo a las distintas áreas que conforman el sector económico de la Industria de las Lenguas en el País Vasco. El presente proyecto, Ber2Tek, pretende ser una continuación del anterior en el que el consorcio continuará avanzando en el desarrollo de las tecnologías básicas demandadas por la Industria de las Lenguas local, alineándose a su vez con la visión y directrices estratégicas marcadas por la Comisión Europea en lo que a las tecnologías lingüísticas y la Industria de las Lenguas Europea se refiere. Ber2Tek nace, por lo tanto, como continuación natural del proyecto BerbaTek y como consecuencia de la reflexión estratégica de sus socios en el marco de las necesidades tecnológicas identificadas por las Industrias de la Lengua local y Europea. Su objetivo principal es avanzar en la investigación y desarrollo de las tecnologías de análisis de contenidos cross-media, traducción automática de alta calidad e interacción hablada multimodal natural. Además, pretende crear un repositorio online donde almacenar las herramientas y recursos básicos desarrollados a lo largo del proyecto con el objeto de impulsar la transferencia de tecnología hacia las PYMES vascas. Ber2Tek busca también generar el conocimiento y formación de la masa crítica cualificada que permita afrontar autónomamente el futuro de la I+D+i dentro de esta línea estratégica. Para ello se organizarán cursos de formación, master de postgrado, seminarios especializados y cursos de doctorado en el ámbito de la tecnología lingüística. Para lograr los objetivos planteados, los socios integrantes del proyecto Ber2Tek disponen de una comunidad científica e investigadora con la masa crítica necesaria y reconocida internacionalmente, además de relaciones preferenciales con muchas empresas de la industria de las lenguas. Tras el éxito del enfoque adoptado en el proyecto anterior, Ber2Tek estará también orientado hacia las aplicaciones. Sin dejar de lado la investigación básica, intentará presentar aplicaciones experimentales en forma de demostradores que, posteriormente, podrán ser desarrolladas y convertidas en producto por empresas dedicadas a la traducción, la enseñanza de las lenguas o los contenidos. Además de utilizar estos demostradores como evaluadores y pruebas de viabilidad, planeamos obtener la cooperación de empresas del entorno para participar en el proyecto como testeadores beta.
Project Title: TV-Social – Low Cost Telebista
Finnaced by: BASQUE GOVERNMENT (ETORGAI)
Project manager: Inma Hernaez
Participants:UPV/EHU, Irusoin, Gizer.net, Eleka, Gaia, Sonora estudios, Ibermatica, Mixer, Ibercom, Orio produkzioak, Arista, Telbask, VicomTech, Tecnológico Deusto, Elhuyar, Euve, I3B, Robotiker
Team: Inma Hernáez, Eva Navas, IIñaki Sainz, Dani Erro, Ibon Saratxaga, Daniel Erro, Jon Sánchez, Juanjo Igarza
Begin date: Jan-2010
Final date: Dec-2012.
Abstract:
El objetivo fundamental del proyecto TV SOCIAL es el de permitir el desarrollo de diferentes prototipos avanzados de generación automática de contenidos y automatización de procesos, orientados a la producción low-cost para entornos broadcast, y contenidos generados por el usuario (User-Generated Content), tanto desde el punto de vista del usuario doméstico como profesional, orientadas a la creación de contenidos multicanal, multiplataforma y multilingüe, con una dimensión internacional. Como objetivos colaterales o secundarios, podemos destacar:
Project Title: BUCEADOR: Information search engine for multilingual audiovisual contents.
Finnaced by: MICINN
Project manager: Eva Navas
Participants: TALP (UPC), GPS (Uni. Vigo) , Aholab (UPV/EHU)
Team: Eva Navas, Inma Hernáez, Iñaki Sainz, Ibon Saratxaga, Daniel Erro, Iñaki Gaminde, Jon Sánchez, Juanjo Igarza
Begin date: Jan-2010
Final date: Dec-2012.
For more information about the project please visit the project homepage
Abstract:
BUCEADOR is a project focused on advanced research in all core Spoken Language Technologies (SLT), (diarization, speech recognition, speech machine translation, and text-to-speech conversion), research in both, cross-language and speech-oriented information retrieval technologies for voice search applications, and the successful joint integration of all of them in a multilingual and multimodal information retrieval system.
The goal of the project is to achieve improvements in all the SLT components and voice search applications to improve human-machine and human-to-human communication among all the official languages spoken in Spain as well as between these languages and English.
The project will obtain research advances in each mentioned technology. Examples of such approaches are exploring new techniques for the diarization of speeches, incorporating confidence measures for unconstrained conversational speech in automatic speech recognition, integrating linguistic knowledge in the statistical approach to spoken language translation, new acoustic and prosodic models for generating expressive speech in synthesis, and implementing new strategies for voice search information retrieval. It is planned that the project will participate in European and American (NIST) competitive evaluation systems.
In order to show the achievements in the above mentioned technologies and their successful joint integration, the project will create a show case consisting of a search engine for multilingual audiovisual contents. Specifically, broadcast news from several TV, radio, and internet channels in all the official Spanish languages (Spanish, Catalan, Basque and Galician) plus English will be utilized.