The BrAIn2Lang website is now online.
This project explores how speech and language can be decoded from brain activity, bringing together neuroimaging and speech technologies.
https://aholab.ehu.eus/brain2lang
The BrAIn2Lang website is now online.
This project explores how speech and language can be decoded from brain activity, bringing together neuroimaging and speech technologies.
https://aholab.ehu.eus/brain2lang
IKER-GAITU proiektuaren helburu orokorra hizkuntza teknologian ikertzea da, ingurune digitalean euskararen presentzia areagotu dadin. Kultura eta Hizkuntza Politika sailaren dirulaguntzari esker eramango da aurrera 2023-2025 bitartean.
Egungo eta etorkizuneko teknologiek testuzko eta ahozko datu-masa erraldoiak eskatzen dituzte hizkuntza bakoitzeko. Aldiz, euskarak eta hizkuntza txikiagoek eskaini ahal dituzten datuak ez dira nahikoak gaur egun teknologia horiek behar adina kalitatea izateko. Horregatik, ezinbestekoa da hizkuntza teknologian ikertzea euskarak gero eta ohikoagoak izango diren teknologietan presentzia izateko eta beste hizkuntzen parera eramateko.
Webgunea: https://www.hitz.eus/iker-gaitu/
Instituzioa: Eusko Jaurlaritza
Ikertzaile Nagusia: Eneko Agirre
Ikertzaileak:
Victor García, Inma Hernaez, Asier Herranz, Eva Navas, Ibón Saratxaga, Eneko Agirre, Xabier Arregi, Mikel Artetxe, Unai Atutxa, Ekhi Azurmendi, Iker De la Iglesia, Mikel Iruskieta, Oier López de Lacalle , Paula Ontalvilla, Naiara Perez, German Rigau , Aitor Soroa, Jon Vadillo, Aimar Zabala
ILENIA es un proyecto común y coordinado entre los siguientes centros del estado: BSC-CNS (proyecto AINA), CENID (proyecto VIVES), HiTZ (proyecto NEL-GAITU) y Universidad de Santiago de Compostela (proyecto NÓS), que tiene como objetivo generar recursos digitales que permitan desarrollar aplicaciones multilingües en las diferentes lenguas de España.
https://proyectoilenia.es/
Investigadora Principal: Marta Villegas
Participantes: Eneko Agirre, Itziar Aldabe, Xabier Arregi, Ane García, Xabier Goenaga, Inma Hernaez, Ismael Hidalgo, Gorka Labaka, Eva Navas, Naiara Perez, German Rigau, Jon Sanchez de la fuente, Ibon Saratxaga, Christoforos Souganidis, Aitor Soroa, Jon Vadillo
Eneko Agirre, Itziar Aldabe, Xabier Arregi, Ane García, Xabier Goenaga, Ismael Hidalgo, Gorka Labaka, Naiara Perez, German Rigau , Aitor Soroa
Deep Restore Project | UPV-EHU
Periodo: desde 2023 hasta 2026
Entidad financiadora: Ministerio de Ciencia e Innovación
Importe total: 186875€
Investigadores Principales: HERNAEZ RIOJA, INMACULADA SARATXAGA COUCEIRO / IBON
Descripción:
The GENERAL OBJECTIVE of DeepRESTORE is to overcome the limitations of both traditional voice rehabilitation methods and previous SSI studies by investigating SSI-based communication systems for restoring communication to individuals who have been deprived of the ability to speak. In particular, in the subproject that will be developed at UPV/EHU total-laryngectomy patients, whose upper vocal tract (i.e. mouth, tongue, lips, etc.) is intact but cannot speak normally because their entire larynx (an organ essential for sound production) has been surgically removed to treat laryngeal cancer will be considered. These persons still retain the control over their speech articulators and, hence, biosignals reflecting the movements of the articulators can be easily captured using EMG and or video images of their faces.
From: 2023 To: 2024
This proposal aims to develop a speech-to-speech (S2S) translation system for Basque and Spanish, i.e. a system that receives a speech signal in one of the two languages, translates it to the other, and delivers this translation using speech with a personalised voice imitating the original speaker.
The project is a joint proposal of the two research groups of Hitz Center (Ixa and Aholab) and it is intended to boost their collaboration to generate a tool that requires the knowledge from the expertise fields of both of the groups. Both IXA, in the field of NLP and Aholab in speech processing have plenty of experience and resources. The S2S translation system that will be produced will enable Basque language support for state-of-the-art technologies in automatic speech recognition, machine translation and personalised speech synthesis.
This proposal responds to the Global Challenges of the Horizon Europe Pillar II. Specifically speech and natural language processing is aligned with Cluster 4: Digital, Industry & Space in the area of Artificial Intelligence-Data-Robotics.
Investigadores Principales: Ibon Saratxaga, Aitor Soroa
Entidad financiadora: EHU
From: 2021 To: 2022
En un espectáculo escénico el regidor es el encargado se seguir su evolución e indicar a los diferentes técnicos (luces, sonido, efectos) los momentos en los que deben ir disparando sus diferentes recursos. En este proyecto se pretende crear una sistema automático que sea capaz de identificar en cada momento el punto del guion en el que se encuentra el espectáculo y notificarlo a los diferentes sistemas de escena que controlan la música, luces y otros efectos, para que estos puedan actuar según tengan planificado en sus respectivas escaletas.
Para ello se trabajará a partir de un sistema de doblaje, AhoDubber, que utiliza la de detección de voz (VAD, Voice Activity Detection) en múltiples micrófonos de entrada, en tiempo real de forma que pueda detectar quién habla en cada momento, y además, el sistema emplea el guion codificado siguiendo un formato desarrollado ex profeso para situar cada intervención de los actores en el contexto del mismo. Con este proyecto se pretende ampliar su funcionalidad adicional para conseguir que la aplicación resuelva tareas adicionales del personal de control y se pueda integrar en el conjunto de aplicaciones que éstos utilizan habitualmente.
Entidad financiadora: ESKENA Euskadiko Ekoizle Eszenikoen Elkartea
From: 2020 to: 2023
ReSSInt tiene como objetivo investigar el uso de las interfaces de voz silenciosa para restaurar la comunicación en personas que han sido privadas de la capacidad de hablar. Las interfaces de voz silenciosa son dispositivos que capturan señales biológicas no acústicas generadas durante el proceso de producción de voz y las utilizan para predecir el mensaje deseado. Si bien las interfaces SSI se han investigado principalmente en el contexto del reconocimiento de voz (Silent-Speech-to-Text), este proyecto se centra en las técnicas de síntesis de voz directa, generando así directamente la forma de onda de voz correspondiente a su salida. Dos son las señales biológicas que se investigarán en este proyecto. En el subproyecto 1, se capturarán y procesarán las señales electromiográficas producidas por el aparato de producción del habla. El subproyecto 2 abordará el campo muy novedoso de la electrocorticografía ECoG, utilizando las señales obtenidas mediante electroencefalografía intracraneal.
De todo el espectro de trastornos del habla que pueden afectar a la voz de una persona, ReSSInt abordará dos condiciones, siendo cada una el objetivo de un subproyecto particular:
ReSSint será llevado a cabo por dos grupos de investigación ubicados en España con una fuerte colaboración de investigadores externos. El grupo Aholab de la UPV/EHU ha demostrado su experiencia en el campo del procesamiento de señales y la síntesis de voz. El grupo de la UGR está dirigido por un joven investigador con una consolidada experiencia investigadora en el campo de las interfaces de voz silenciosa. Ambos grupos contarán con el respaldo de grupos de investigación punteros en Europa.

From: 3/10/2020
To: 31/12/2020
Funding: Mercedes-Benz España, S.A.
From: 04/08/2020
To: 31/12/2020
Funding: Datik Información Inteligente, S.L.
From: 4/11/2020
To: 4/11/2040
Funding: ELDA. Evaluations and Language Resources Distribution Agency
From: 14/2/2017
To: 31/12/2019
Funding: Mescedes-Benz España S.A.
From: 2019 to: 2020
A través de MINTZAI, se plantea un proyecto de investigación orientado a afrontar los desafíos descritos y contribuir a la consolidación del posicionamiento de Euskadi como punto de referencia en materia de tecnologías lingüísticas.
El objeto principal del proyecto es el siguiente:
Investigación, desarrollo y validación de sistemas de traducción automática del habla basados en métodos de aprendizaje profundo E2E
El objeto principal del proyecto se descompone en los siguientes objetivos científico-tecnológicos:
Asimismo, se han definido los siguientes objetivos de alcance e impacto:
De cara a la consecución de estos objetivos, MINTZAI cuenta con un consorcio potente y con gran experiencia en el ámbito de las tecnologías lingüísticas que aspira a convertirse como punto de referencia en la materia. Se trata de un proyecto de carácter estratégico para todas las entidades participantes y para Eiken, MondragonLingua, EITB y Argia.
From: 1/6/18
To: 1/7/19
Funding: Elhuyar Fundazioa
From: 1-9-2018 to: 1-6-2021
Según datos del Instituto Nacional de Estadística, en España hay más de 410 000 personas con discapacidad para “Producir mensajes hablados” (datos de 2008). Este tipo de discapacidad produce un aislamiento social de las personas que la sufren, ya que su comunicación con el entorno se ve seriamente afectada, empeorando las relaciones personales, y generando problemas de integración en el entorno laboral. Este proyecto tiene como finalidad última la mejora de la calidad de vida de estas personas, mediante la generación de avances en el procesamiento digital del habla. Para generar estos avances se propone el uso de redes neuronales profundas en los procesos de conversión de texto en habla y de conversión y transformación de voz.
El grupo Aholab tiene experiencia demostrada en el procesamiento digital del habla y en la actualidad colabora con los dos hospitales más importantes del entorno (Hospital Universitario Cruces y Hospital Universitario Basurto) en el desarrollo de sistemas que mejoren la calidad de vida de los pacientes con discapacidades orales. El trabajo que se propone en este proyecto se enfoca a dos tipos de habla patológica: el habla esofágica (de personas laringectomizadas) y el habla disártrica. En ambos casos se aplicarán las técnicas de aprendizaje basadas en Redes Neuronales profundas, que están siendo aplicadas con éxito en los campos del reconocimientoy de la síntesis de voz. El interés especial de nuestro proyecto radica en el empleo de estos sistemas para voces con las patologías mencionadas.
Proyectos de Investigación Basica/Aplicada 2018-2020
Project Code: KK-2017/00043
From: 2017 To: 2018
A través de BerbaOla se plantea un proyecto de investigación fundamental orientada a afrontar los desafíos de la estrategia de especialización inteligente del Gobierno Vasco y con el propósito de consolidar el posicionamiento de Euskadi como punto de referencia en materia de tecnologías lingüísticas. El objeto principal del proyecto es el siguiente: Investigación y desarrollo en tecnologías de la lengua y el habla para la Fabricación Avanzada, Biociencias y Salud, e Industrias Culturales y Creativas.
Asimismo, el objeto principal del proyecto se descompone en los siguientes objetivos científico-tecnológicos:
• Profundizar en la investigación fundamental en tecnologías de la lengua y el habla a los nichos de oportunidad Industrias Culturales e Industrias de la Lengua, así como a las prioridades estratégicas Fabricación Avanzada y Biociencias y Salud Humana.
• Reforzar la aportación científico-tecnológica de las tecnologías de la lengua y el habla a los nichos de oportunidad mencionados, traccionando su desarrollo y avance como industrias competitivas.
• Centrar la investigación fundamental en Fabricación Avanzada con el objetivo de dotar de inteligencia a los procesos productivos e interacción persona-máquina.
• Orientar nuestra investigación fundamental para que los retos sociales marcados en el Horizon 2020 y la prioridad estratégica en Biociencias y Salud Humana, respondan a retos como el envejecimiento, interoperabilidad de la información médica, la farmacovigilancia o la inclusividad de personas con discapacidad.
• Ayudar en las superación de las barreras lingüísticas para que las empresas vascas tengan ventaja competitiva en el Mercado Único Digital y que el euskera no quede digitalmente relegado.
• Promover soluciones tecnológicas multilingües e inteligentes sustancialmente nuevas mediante la exploración de ideas innovadoras y basadas en los fundamentos científicos. • Apoyar de manera flexible la investigación en colaboración, orientada por los objetivos y la interdisciplinariedad a diversas escalas.
• Generar la base para el desarrollo de un Territorio Inteligente: desde la apertura y vinculación de los procesos sociales, pasando por la conectividad multilingüe de las cosas creando nuevos espacios para la interacción que posibilitan un nuevo paradigma inclusivo.
• Consolidar el consorcio BerbaOla como punto de referencia excelente científico-tecnológica en tecnologías de la lengua y la voz dentro del Espacio Europeo de Investigación.
Iparrahotsa is the AhoTTS version for Lapurdian Basque.This project has been funded by the Euroregion Aquitaine Euskadi under grant EUSKADI 2012-004. You can test it in this demo shown or download it from GitHub.
Financed by MINECO
The Thematic Network on Speech Technologies (RTTH) has for 16 years joined the leading researchers working on this field in Spain. Since 1999, the RTTH has boosted the research in the field of speech technology creating synergies among the different research groups that compose it with the aim of putting the Spanish research on Speech Technologies at the international scientific-technological forefront.
The main objectives of the network are:
“The fundamental objective of the ENRICH network is to modify or augment speech with additional information to make it easier to process.”
The network will train 14 PhD students and give them not just the necessary cross-disciplinary knowledge and research skills, but also experience of entrepreneurship and technology transfer so they can translate research findings into products and services that will help everybody communicate successfully.
Participants: Aholab (coordinator), Biocruces
Project Code: TEC2015-67163-C2-1-R
From: 1-1-2016 to: 31-12-2018
According to the data of the Spanish Statistical Institute (Instituto Nacional de Estadística) from 2008, there are more than 400 000 people with oral disabilities in Spain. In Europe, 0.4% of the population has an oral disability as indicated by Eurostat. This kind of disability produces social isolation since the communication with the environment is seriously affected so as to hamper personal relationships and generate problems of integration at the workplace.
RESTORE is a project aimed to improve the quality of communication for people with difficulties producing speech, providing them with tools and alternative communication services. At the same time, progress will be made at the research of techniques for restoration and rehabilitation of disordered speech. The following goals are proposed for the project:
Goal 1.- Implementation of a donors’ voice bank and creation of the service of personalized synthetic speech for people with oral disabilities in general and people who have been laryngectomised at Hospital Universitario Cruces.
Goal 2.- Design and development of a Serious Game as a multimedia tool to support the speech rehabilitation process for people with voice disorders.
Goal 3.- Improve the intelligibility of alaringeal voices (voices from people who have been laryngectomised) and dysartric voices.
The Project coordinates the research work of two groups, one from the field of Telecommunication Engineering and the other from the field of Medicine and Speech Therapy. The Voice Banking service proposed is a groundbreaking service for the country, since there are only a few experiences with the same aim in USA and Europe. This kind of service offers personalized synthetic speech that can be used in existing Alternative and Augmentative Communication devices. These devices allow people with oral disabilities to communicate. In our proposal the communication is achieved with a personalized voice that might be similar to the patient’s own voice in cases of progressive diseases or laryngectomies. Besides the design and development of a voice training tool is pursued in order to incentive and facilitate the speech rehabilitation process, a real hard and complex task depending on the specific pathology.
The ultimate goal of the project is to offer new possibilities in the rehabilitation and reintegration into society of patients with speech pathologies, especially those laryngectomised, by designing new intervention strategies aimed to favour their communication with the environment and ultimately increase their quality of life. This is the reason why the project fits perfectly into the Challenge 1 – Health, demographic change and wellbeing.
Este proyecto está cofinanciado por el Fondo Europeo de Desarrollo de Regional
Participants: Elhuyar (coordinator), Tecnalia, VicomTech, IXA, Aholab
Project Code: KK-2015/00098 KK-2016/00087
From: 1-1-2015 to: 31-12-2016
Mediante el proyecto ElkarOla deseamos obtener los siguientes objetivos:
Project Title: A system to produce customized voices with application to people with oral disabilities
Finnaced by: BASQUE GOVERNMENT (SAIOTEK)
Project manager: Inma Hernaez
Participants: UPV/EHUI
Team: Inma Hernáez, Eva Navas, Iñaki Sainz, Dani Erro, Ibon Saratxaga, Jon Sánchez, Juanjo Igarza
Begin date: Jul-2011
End date: Dec-2012.
Project page: http://aholab.ehu.es/ZURE_TTS/
EEl proyecto presentado es un primer paso hacia el desarrollo de un sistema automático de personalización de voces sintéticas orientado especialmente a colectivos de personas afectadas por la pérdida total o parcial de su voz. En esta primera fase, se obtendrán las técnicas básicas de personalización de voces utilizando datos de voz no patológicas, se generarán los modelos correspondientes a la voz de partida genérica o voz promedio y se diseñarán las bases de datos textuales necesarias para realizar la personalización. Asímismo, se desarrollará un primer prototipo de portal de acceso al sistema, que permita a un usuario no experto desarrollar una voz sintética personalizada a su propia voz. El desarrollo de este prototipo se considera clave para el éxito del proyecto, ya que con el que se realizará un estudio piloto del interés que esta aplicación pueda tener en colectivos de personas afectadas por patologías del habla.
Así pues, los objetivos que se pretenden alcanzar con este proyecto son tres:
Tras presentar nuestra nueva app “TTS-Aholab Obtén una voz propia” en el concurso de app de ” BicayApp Concurso de Aplicaciones’14 hemos resultado FINALISTAS!!!
Project Title: Berria.info Entzungai
Finnaced by: Ehundu S.L.
Project manager: Ibon Saratxaga
Participants:Ehundu, Aholab
Team: Ibon Saratxaga, Inma Hernáez, Eva Navas, Iñaki Sainz, Dani Erro, Jon Sánchez
Begin date: May-2013
End date: Dec-2013.
AhoLab Signal Processing Laboratory ikertaldeak garatu duen plataforma abiapuntu hartuta, Berria.info-ren testuak entzungai jarriko ditugu.
From: 01/09/2010
To: 02/04/2013
Funding: ELEKA Ingeniaritza Linguistikoa
De-identification in multimedia content can be defined as the process of concealing the identities of individuals captured in a given set of data (images, video, audio, text), for the purpose of protecting their privacy. This will provide an effective means for supporting the EU’s Data Protection Directive (95/46/EC), which is concerned with the introduction of appropriate measures for the protection of personal data.
The fact that a person can be identified by such features as face, voice, silhouette and gait, indicates the de-identification process as an interdisciplinary challenge, involving such scientific areas as image processing, speech analysis, video tracking and biometrics.
This Action aims to facilitate coordinated interdisciplinary efforts (related to scientific, legal, ethical and societal aspects) in the introduction of person de-identification and reversible de-identification in multimedia content by networking relevant European experts and organisations.
Visit the project webpage for more information.
Project Title: Advanced Research in Speech Technologies for Application to Audiovisua Environments for Inclusive Human-Machine Interaction (SpeechTech4All)
Finnaced by: Spanish Ministry of Economy and Competititvity
Project manager: Inma Hernaez
Participants:UPV/EHU, UPC, UVigo (coordinator)
Team: Inma Hernáez, Eva Navas, Iñaki Sainz, Dani Erro, Ibon Saratxaga, Jon Sánchez
Begin date: Jan-2013
End date: Dec-2015.
SpeechTech4All is a project focused on advanced research in all core speech technologies (speech recognition, automatic translation and text to speech conversion) for all the official languages of Spain. It is also aimed at the recognition of the speaker’s emotional state and the building of multimodal (speech and face) and multilingual (Spanish, Galician, Catalan and Basque) experimental work-frames that allow showing the work developed.
As a result of the project significant research advances will be obtained in each of the above mentioned technologies. Some of these advances are: universal access to the service of synthetic voices customization, development of domain adaptation techniques in automatic translation and development of emotional state detection systems based in speech and face joint processing. The project will take part in the international competitive evaluation campaigns organized by Interspeech and the Red Temática de Tecnologías del Habla (RTTH).
To show the advances achieved in all the technologies considered, as well as to manifest the social character of the project, two showcases are defined:
1) The first one integrates most of the technologies considered in the project and consists on the multilingual subtitling and dubbing of audiovisual material related to education: documentaries, speeches, seminars…
2) The second one is focused on one of the true applications of speech technologies: providing speech to people who have a severe level of oral disability by the use of a speech synthesis system adapted to the specific characteristics of the speaker.
Este proyecto está cofinanciado por el Fondo Europeo de Desarrollo de Regional
Project Title: Sistema multilingüe para la obtención de voces sintéticas personalizadas orientado a personas con discapacidad oral
Finnaced by: Eusko Jaurlaritza / Gobierno Vasco (SAIOTEK call)
Project manager: Daniel Erro
Participants: UPV/EHU (AhoLab)
Team: Daniel Erro, Inma Hernáez, Eva Navas, Iñaki Sainz, Dani Erro, Ibon Saratxaga, Jon Sanchez, Agustín Sánchez
Begin date: Jan-2013
End date: Dec-2013
Este proyecto se plantea como continuación del proyecto Saiotek 2011, ejecutado en los ejercicios 2011 y 2012 con acrónimo ZURE_TTS y título “Sistema para la obtención de voces personalizadas con aplicación a personas con discapacidad oral”. En dicho proyecto, además de desarrollarse las técnicas y algoritmos necesarios para proporcionar voces sintéticas personalizadas mediante la adaptación de una “voz promedio”, se desarrolló un portal web, http://aholab.ehu.es/ZURE_TTS, que permite el acceso al sistema a usuarios no especializados. En este proyecto se plantea avanzar en el desarrollo de dicho portal abordando dos apectos del mismo: (i) desarrollo de nuevas técnicas que mejoren la calidad de las voces sintéticas obtenidas en condiciones de escasez de muestras de la voz objetivo; (ii) avanzar en la difusión del trabajo mediante la incorporación de los idiomas gallego y catalán, junto con el inglés.
Adicionalmente se realizará una evaluación formal del sistema para los idiomas castellano y euskera, considerando aspectos como el volumen de datos disponible para la voz objetivo y la elección de la técnica de adaptación, de modo que se pueda estudiar su influencia sobre la calidad de la voz sintética resultante.
Así, los objetivos específicos del proyecto aquí propuesto son:
La razón de ser de este proyecto es la de afianzar la reorientación recientemente emprendida en Aholab hacia actividades de un mayor contenido social, es decir, que proporcionen un servicio a la sociedad en general y a las personas afectadas por trastornos del habla en particular. El proyecto permitirá aplicar la enorme experiencia del grupo, las herramientas que ha ido desarrollando a lo largo de los años y sus bases de datos de material de voz a un área de trabajo menos atractiva para compañías privadas por proporcinar beneficios económicos mucho más limitados. En lo que respecta a los objetivos concretos arriba enumerados, este proyecto permitirá hacer llegar la tecnología a más usuarios, de manera especial a aquellos que por sus limitaciones no están en disposición de grabar una gran cantidad de muestras de su voz. Además, al finalizar este proyecto se habrán sentado las bases para comenzar a trabajar en la personalización de voces sintéticas a partir de muestras de voces ya deterioradas por patologías diversas.
Por último, un efecto lateral del proyecto será la adquisición de nuevo material de voz, el grabado por los usuarios, que redundará en mejoras de la tecnología de Aholab en general.
Project Title: Tecnologías del habla para el aprendizaje de segundas lenguas (L2-Ikasi)
Finnaced by: Basque Government
Project manager: Eva Navas
Participants: UPV/EHU
Team: Eva Navas, Inma Hernáez, Ibon Saratxaga, Jon Sánchez, David Tavárez
Begin date: Jan-2012
End date: Dec-2013
En este proyecto se propone la realización de un sistema de ayuda para el aprendizaje de segundas lenguas utilizando las tecnologías del habla. Las tecnologías del habla pueden aplicarse tanto en la verificación de la corrección de las respuestas dadas por el estudiante, como en la evaluación de la pronunciación de los sonidos y de la entonación y ritmo con el que se expresa el estudiante. Para la evaluación de la corrección de las respuestas se emplean sistemas de reconocimiento de habla que deben verificar que la respuesta dada es la esperada por el sistema y al mismo tiempo ser capaces de tratar con señales producidas por hablantes no nativos. En la evaluación de la pronunciación también se aplican los sistemas de reconocimiento y se dan al estudiante indicaciones acerca de la corrección de su pronunciación en función de las medidas de confianza producidas por el sistema. En el marco del proyecto será necesario recoger una base de datos adecuada para entrenar el sistema de verificación de mensajes y otras que permitan entrenar el de evaluación de la corrección en la pronunciación tanto a nivel segmental como de fluidez global, de manera que sea posible ajustar los umbrales de decisión adaptándolos al nivel del estudiante. Sistemas de este tipo son comunes para lenguas mayoritarias como el inglés o el castellano, pero no existen para lenguas minoritarias.
El objetivo principal del proyecto es pues el desarrollo de un sistema de ayuda al aprendizaje de segundas lenguas tanto para realizar la verificación de enunciados como la evaluación segmental y de la fluidez de la pronunciación, centrándolo en el aprendizaje del euskara. La consecución de este objetivo global implica el logro de otros objetivos parciales como son el diseño y la obtención de las bases de datos adecuadas para el desarrollo y ajuste de los sistemas de evaluación de la corrección de la respuesta y la pronunciación, la adaptación de las herramientas automáticas de segmentación de bases de datos a la voz de hablantes no nativos, la construcción de un sistema automático de ayuda al aprendizaje del euskara como segunda lengua y el desarrollo de la metodología de evaluación del sistema realizado.
Este proyecto se enmarca dentro de la línea de investigación sobre aplicación de las tecnologías del habla a la enseñanza en la que el grupo trabaja desde el año 2009. Este proyecto supone un gran paso adelante, al proporcionar los recursos orales necesarios para continuar la investigación y al permitir comprobar la validez de las técnicas empleadas en otros idiomas para el euskara. Las aplicaciones de las tecnologías del habla en la enseñanza de idiomas es una línea estratégica para el grupo de investigación AhoLab en la que uno de sus miembros está actualmente realizando su tesis doctoral.
Project Title: Iparrahotsa: desarrollo de una voz sintética para el euskera estándar de Iparralde
Finnaced by: EUROREGION (Aquitaine-Euskadi)
Project manager: Inma Hernaez
Participants: UPV/EHU, IKER UMR5478 (CNRS)
Team: Inma Hernáez, Eva Navas, Iñaki Sainz, Dani Erro, Agustín Alonso
Begin date: Jan-2012
End date: Dec-2014.
En este proyecto se pretende desarrollar un sistema de Conversión de Texto en Habla para el dialecto navarro-labortano estándar del País Vasco de Francia.
El habla es la principal herramienta de comunicación de que disponemos las personas y el desarrollo de recursos y tecnologías para una lengua es el único modo de mantener la lengua viva en un mundo dominado por las tecnologías de la información y las comunicaciones. Este proyecto pretende cubrir una parte del vacío de las tecnologías del habla para el dialecto vasco navarro-laburtano, dialecto tradicional y muy presente en la Baja Navarra y en Labort, utilizado aproximadamente por 50000 hablantes.
El sistema de síntesis que se propone utilizar es el llamado AhoTTS (aholab.ehu.es/TTS). Este sistema, desarrollado para varias lenguas (inglés, castellano, euskera y otras), ha sido íntegramente desarrollado para el euskera batua utilizando tecnología propia de Aholab. En este proyecto se pretenden desarrollar los recursos y herramientas necesarias para obtener dos voces sintéticas (una masculina y otra femenina) para el dialecto propuesto, así como realizar las modificaciones que sean necesarias en los módulos del sistema para su integración en el sistema AhoTTS. El sistema se desarrollará en código abierto con licencia GPL de forma que podrá ser descargado, utilizado y modificado en el futuro.
Project Title: Ber2Tek, Tecnologías de la lengua, de voz y multimedia al servicio de la Industria de las Lenguas (IE12-333)
Finnaced by: Eusko Jaurlaritza / Gobierno Vasco (ETORTEK call)
Project manager: Eva Navas
Participants: UPV/EHU (AhoLab & IXA research groups), Elhuyar, VicomTech-IK4, Tecnalia
Team: Inma Hernáez, Eva Navas, Iñaki Sainz, Dani Erro, Ibon Saratxaga, Jon Sanchez
Begin date: Jan-2012
End date: Dec-2014
BerbaTek ha sido durante 2009-2011 un proyecto Etortek en el que han participado la fundación Elhuyar, los grupos de investigación IXA y Aholab de la UPV/EHU, el centro tecnológico Vicomtech-IK4 y la fundación Tecnalia Research&Innovation, con el objetivo principal de investigar y desarrollar tecnologías lingüísticas, de voz y multimedia, para que puedan servir como base tecnológica de apoyo a las distintas áreas que conforman el sector económico de la Industria de las Lenguas en el País Vasco. El presente proyecto, Ber2Tek, pretende ser una continuación del anterior en el que el consorcio continuará avanzando en el desarrollo de las tecnologías básicas demandadas por la Industria de las Lenguas local, alineándose a su vez con la visión y directrices estratégicas marcadas por la Comisión Europea en lo que a las tecnologías lingüísticas y la Industria de las Lenguas Europea se refiere. Ber2Tek nace, por lo tanto, como continuación natural del proyecto BerbaTek y como consecuencia de la reflexión estratégica de sus socios en el marco de las necesidades tecnológicas identificadas por las Industrias de la Lengua local y Europea. Su objetivo principal es avanzar en la investigación y desarrollo de las tecnologías de análisis de contenidos cross-media, traducción automática de alta calidad e interacción hablada multimodal natural. Además, pretende crear un repositorio online donde almacenar las herramientas y recursos básicos desarrollados a lo largo del proyecto con el objeto de impulsar la transferencia de tecnología hacia las PYMES vascas. Ber2Tek busca también generar el conocimiento y formación de la masa crítica cualificada que permita afrontar autónomamente el futuro de la I+D+i dentro de esta línea estratégica. Para ello se organizarán cursos de formación, master de postgrado, seminarios especializados y cursos de doctorado en el ámbito de la tecnología lingüística. Para lograr los objetivos planteados, los socios integrantes del proyecto Ber2Tek disponen de una comunidad científica e investigadora con la masa crítica necesaria y reconocida internacionalmente, además de relaciones preferenciales con muchas empresas de la industria de las lenguas. Tras el éxito del enfoque adoptado en el proyecto anterior, Ber2Tek estará también orientado hacia las aplicaciones. Sin dejar de lado la investigación básica, intentará presentar aplicaciones experimentales en forma de demostradores que, posteriormente, podrán ser desarrolladas y convertidas en producto por empresas dedicadas a la traducción, la enseñanza de las lenguas o los contenidos. Además de utilizar estos demostradores como evaluadores y pruebas de viabilidad, planeamos obtener la cooperación de empresas del entorno para participar en el proyecto como testeadores beta.
Project Title: TV-Social – Low Cost Telebista
Finnaced by: BASQUE GOVERNMENT (ETORGAI)
Project manager: Inma Hernaez
Participants:UPV/EHU, Irusoin, Gizer.net, Eleka, Gaia, Sonora estudios, Ibermatica, Mixer, Ibercom, Orio produkzioak, Arista, Telbask, VicomTech, Tecnológico Deusto, Elhuyar, Euve, I3B, Robotiker
Team: Inma Hernáez, Eva Navas, IIñaki Sainz, Dani Erro, Ibon Saratxaga, Daniel Erro, Jon Sánchez, Juanjo Igarza
Begin date: Jan-2010
Final date: Dec-2012.
Abstract:
El objetivo fundamental del proyecto TV SOCIAL es el de permitir el desarrollo de diferentes prototipos avanzados de generación automática de contenidos y automatización de procesos, orientados a la producción low-cost para entornos broadcast, y contenidos generados por el usuario (User-Generated Content), tanto desde el punto de vista del usuario doméstico como profesional, orientadas a la creación de contenidos multicanal, multiplataforma y multilingüe, con una dimensión internacional. Como objetivos colaterales o secundarios, podemos destacar:
Project Title: BUCEADOR: Information search engine for multilingual audiovisual contents.
Finnaced by: MICINN
Project manager: Eva Navas
Participants: TALP (UPC), GPS (Uni. Vigo) , Aholab (UPV/EHU)
Team: Eva Navas, Inma Hernáez, Iñaki Sainz, Ibon Saratxaga, Daniel Erro, Iñaki Gaminde, Jon Sánchez, Juanjo Igarza
Begin date: Jan-2010
Final date: Dec-2012.
For more information about the project please visit the project homepage
Abstract:
BUCEADOR is a project focused on advanced research in all core Spoken Language Technologies (SLT), (diarization, speech recognition, speech machine translation, and text-to-speech conversion), research in both, cross-language and speech-oriented information retrieval technologies for voice search applications, and the successful joint integration of all of them in a multilingual and multimodal information retrieval system.
The goal of the project is to achieve improvements in all the SLT components and voice search applications to improve human-machine and human-to-human communication among all the official languages spoken in Spain as well as between these languages and English.
The project will obtain research advances in each mentioned technology. Examples of such approaches are exploring new techniques for the diarization of speeches, incorporating confidence measures for unconstrained conversational speech in automatic speech recognition, integrating linguistic knowledge in the statistical approach to spoken language translation, new acoustic and prosodic models for generating expressive speech in synthesis, and implementing new strategies for voice search information retrieval. It is planned that the project will participate in European and American (NIST) competitive evaluation systems.
In order to show the achievements in the above mentioned technologies and their successful joint integration, the project will create a show case consisting of a search engine for multilingual audiovisual contents. Specifically, broadcast news from several TV, radio, and internet channels in all the official Spanish languages (Spanish, Catalan, Basque and Galician) plus English will be utilized.
Project Title: VERIFY: Prototipo de verificación de mensajes para la enseñanza de idiomas
Financed by:University of the Basque Country and DIDAKTIKER S.L.
Project manager: Inma Hernaez
Team: Inma Hernáez, Eva Navas, Igor Odriozola, Iñaki Sainz
Starting date: Jan 2009
Ending date: Dec 2010
Abstract:C-extrator , in the section assigned to Aholab, aims at speeding the interaction of the second language student with the computer, by using a spoken message verification tool. The message verification algorithms will be integrated in second language learning software from Didaktiker
El objetivo global del proyecto es el desarrollo de un sistema de verificación de mensajes para la mejora de la interacción entre usuario y ordenador, en el aprendizaje de idiomas. Este sistema de verificación debería posteriormente integrarse en el el software desarrollado por la empresa DIDAKTIKER para la empresa Bai&By, especializada en la enseñanza on-line del euskera y del inglés.
El software pretende agilizar la interacción con el usuario de forma que los enunciados solicitados, que actualmente el estudiante introduce en la aplicación a través del teclado del ordenador, puedan ser introducidos de forma oral mediante un micrófono. El sistema debería escribir el mensaje reconocido en el caso de que la respuesta sea correcta, o indicar un error si el mensaje oral enunciado no corresponde con la respuesta (o respuestas) esperadas. Es por esto que el sistema a desarrollar se ha llamado Sistema de Verificación de mensajes, ya que esta sería la principal función del módulo a desarrollar. Se espera que la disponibilidad de un módulo que permita la introducción oral en lugar de por teclado, agilizaría notablemente la velocidad en la que el estudiante puede completar las respuestas.
En la base del desarrollo de un sistema de este tipo se encuentran las tecnologías de reconocimiento de la voz (ASR: Automatic Speech Recognition), mediante las cuales se pretende identificar el mensaje contenido en un enunciado oral, es decir convertir un mensaje de voz en texto. La finalidad de este proyecto difiere notablemente de la funcionalidad de un sistema ASR, ya que no se trata de en nuestro caso de identificar el mensaje, sino de indicar si el mensaje enunciado corresponde con el mensaje esperado. Aunque la tecnología utilizada para verificar el enunciado es la misma empleada en los sistemas de reconocimiento de voz, el sistema de verificación tiene la ventaja de trabajar sobre un conjunto de enunciados que aunque puede ser grande, es finito.
Dado que el software para el aprendizaje on-line de idiomas está disponible tanto para el euskera como para el inglés, el sistema propuesto sería desarrollado para los dos idiomas de forma totalmente similar.
Project Title: BERBATEK: Herramientas y tecnologías para el impulso de las tecnologías de la lengua.
Financed by: Basque Government
Project manager: Eva Navas Cordón
Team: Eva Navas, Inma Hernáez, Jon Sanchez, Iñaki Gaminde, Iker Luengo, Ibon Saratxaga, Iñaki Sainz, Daniel Erro, Igor Odriozola
Starting date: Jan 2009
Ending date: Dec 2011
Abstract: BerbaTek is a strategic research project with a duration of three years (2009-2011). Its consortium is made up of the Elhuyar Foundation, the IXA and Aholab research groups of the UPV/EHU-University of the Basque Country, and the technology centres Vicomtech and Robotiker.
For more information about the project, please visit the project HomePage.
Project Title: C-EXTRACTOR”, Plataforma de extracción automática de conocimiento a partir de fuentes de información estructuradas
Financed by:Ministry of Industry and Comerce in collaboration with DIDAKTIKER S.L.
Project manager: Inma Hernaez
Team: Inma Hernáez, Eva Navas, Igor Odriozola, Iñaki Sainz
Starting date: Oct 2008
Ending date: Dec 2010
Abstract:C-extrator , in the section assigned to Aholab, aims at integrating various speech processing tools in second language learning software from Didaktiker
Project Title: Colaboración en desarrollo corporativo de síntesis bilingüe euskera-castellano sobre Verbio TTS
Financed by:Dominion Technologies, S.L.
Project manager: Inma Hernaez
Team: Inma Hernáez, Eva Navas, Igor Odriozola, Iñaki Sainz
Starting date: Oct 2008
Ending date: Apr 2009
Abstract:
Project Title: European Center of Excellence for Speech Synthesis
ECESS is an European Consortium aiming at promoting the R&D in the field of Speech Synthesis. For more information about this consortium connect to this link.
Financed by:EHU
Project manager: Inma Hernaez
Project Title: Multilingual Speaker Identification System
Financed by:Basque Governement
Project manager: Eva Navas
Team: Eva Navas, Inma Hernáez, Juanjo Igarza, Jon Sanchez, Iker Luengo
Starting date: Nov 2007
Ending date: Nov 2008
Abstract:
Bizkaieraren fonotekea is a sound archive created for the Basque variant spoken in the villages located in the area of Bizkaia. You will find all kind of recordings: traditional songs, old sayings, old legends… Through this project we want to show the invaluable treasure of our language and our dialect, not only to the interested people of our world but also to our future generations.
All recordings are transcribed and labeled at different levels which allows the search under different variables. Give it a try!
Project Title: Sistemas de Confort Acústico Inteligente (SCAI)
Financed by: P4Q, Maier
Project manager: Inma Hernaez
in collaboration with the University of Zaragoza.
Team:
Aholab: Inma Hernáez, Ibon Saratxaga, Eva Navas, Eneritz de Bilbao, David Tavarez
Starting date: Sept 2007
Ending date: May 2008
Abstract:The goal of this project is the development of DSP based techniques and algorithms aimed at making the vehicle inside acoustically comfortable.
Project Title: SCAI: Investigación en sistema de confort inteligente para interior de vehículo
Financed by: P4Q Electronics and Maier S.L.
Project manager: Inma Hernaez
Team: Inma Hernáez, Eva Navas, Ibon Saratxaga, Eneritz de Bilbao
Starting date: Set 2007
Ending date: Jun 2008
Abstract:
Project Title: SmartADAPT: Generación de Tecnología Asistiva Multimodal y Adaptativa en Entornos Ingeligentes
Financed by:Bizkaiko Foru Aldundia
in collaboration with ROBOTIKER-Teknalia
Project manager: Inma Hernaez
Team: Inma Hernáez, Eva Navas, Igor Odriozola, Iker Luengo, Iker Apalategi, Jonathan Gonzalez
Starting date: April 2007
Ending date: Dec 2009
Abstract:SmartADAP plantea desarrollar tecnologías deinterfaces de usuario más inteligentes que se adapten al usuario (a sus preferencias y capacidades/habilidades) y a la situación de entorno en la que se encuentra el propio usuario
Project Title: Tecnologías para la traducción de voz: Reconocimiento, traducción estadísitca basada en corpus y síntesis.
Finnaced by: Ministerio de Educación y Ciencia
Participants: TALP (UPC), GPS (Uni. Vigo) , Aholab (UPV/EHU)
Abstract:
Begin date: Jan-2007
Final date: Dec-2009.
More information: click here
Action COST-2102 Verbal and Non-Verbal Communication Behaviours
The main objetive of the Action is to develop an advanced acoustical, perceptual and psychological analysis of verbal and non-verbal communication signals originating in spontaneous face-to-face interaction, in order to identify algorithms and automatic procedures capable of identifying human emotional states.
More information: Action COST-2102
Project Title: Identificación biométrica basada en voz (IDENLOK)
Financed by: Basque Government
Project manager: Eva Navas
Team: Eva Navas, Inmaculada Hernáez, Juan José Igarza, Jon Sanchez, Iker Luengo, Ibon Saratxaga, Iñaki Sainz
Starting date: Jul 2006
Ending date: Dec 2007
Abstract:The goal of this project is the development of a speaker identification system that uses spectral and prosodic information.
En este proyecto se propone la realización de un sistema de identificación biométrica basado en voz que sea capaz de reconocer al locutor empleando para ello tanto información de tipo espectral como prosódica. El uso de éste último tipo de información hace al sistema más robusto frente a cambios de sesión y de canal, pero por otro lado lo hace más dependiente del idioma en el que se desarrolle. En el marco del proyecto será necesario recoger una base de datos adecuada para entrenar un sistema de verificación de locutor que permita a los usuarios utilizar el euskara como lengua de acceso al mismo. Además será necesario desarrollar herramientas automáticas de segmentación que permitan añadir la información necesaria a las señales de la base de datos, de manera que puedan ser utilizadas en el desarrollo del sistema de verificación. Con esta base de datos adecuadamente etiquetada se construirá un sistema clásico de verificación de locutor basado en rasgos espectrales y un sistema innovador basado en información prosódica. Las ventajas de ambos sistemas se fusionarán utilizando técnicas de fusión de expertos para obtener un sistema más robusto y eficiente.
El objetivo principal del proyecto es pues el desarrollo de un sistema mixto de verificación de locutor que utilice datos tanto espectrales como prosódicos y que sea adecuado para ser utilizado tanto en castellano como en euskara.
La consecución del objetivo global del proyecto implica el logro de otros objetivos parciales como son la obtención de una base de datos bilingüe adecuada para la caracterización de locutores, el desarrollo de herramientas automáticas de segmentación de bases de datos, la construcción de sistemas de verificación de locutor que utilicen un único tipo de información y la selección y aplicación de las técnicas más adecuadas de fusión para obtener el sistema mixto final.
Este proyecto se enmarca dentro de la línea de investigación sobre biometría en la que el grupo trabaja desde el año 2001. Los campos en los que se trabaja son la identificación en base a la firma, tanto off-line como on-line, y en base a la voz. Dentro de este último campo este proyecto supone un gran paso adelante, al proporcionar los recursos orales necesarios para continuar la investigación y al permitir comprobar la validez de las técnicas empleadas en otros idiomas para el euskara. La biometría es una línea estratégica para el grupo de investigación AhoLab y dos de sus miembros están actualmente realizando la tesis doctoral en este campo.
Project Title: ANHITZ: Tecnologías lingüísticas para la interacción multilingüe en entornos inteligentes (Linguistic technologies for multilingual interaction in intelligent environments)
Financed by: Basque Government
Project manager: Inmaculada Hernáez
Team: Eva Navas, Jon Sanchez, Iñaki Gaminde, Iker Luengo, Ibon Saratxaga, Iñaki Sainz, Nerea Ezeiza
Starting date: Jul 2006
Ending date: Dec 2008
Abstract: AnHitz aims to the development and research of linguistic technology in Basque for natural, friendly and intuitive person-device communication. For more information, please visit the project HomePage.
Project Title: Integración de un conversor de texto en habla bilingüe castellano/euskara en una máquina embebida Linux para leer datos enviados por el sistema TETRA y convertirlos en voz
Financed by: Dominion Tecnologías SLU
Project manager: Eva Navas
Project Team:Eva Navas, Iñaki Sainz, Jon Sanchez, Inma Hernaez
Start date: Jan 2006
End date: Set 2006
Project description:
Project phases:
Phase 1.-
Milestone 2.- In-site test of the system. Results OK.
Project Title:Tecnologias del habla aplicadas a dispositivos portátiles
Financed by:Basque Governement
Project manager: Eva Navas
Start date: Jan 2004
End date: Dec 2006
Team:
Project Title: HIZKING21: Hizkuntza Ingeniaritza XXI. Mendeko atean (Linguistic Engineering at the begining of the XXI century)
Financed by: Basque Government
Project manager: Inmaculada Hernáez
Team: Eva Navas, Jon Sanchez, Iñaki Gaminde, Iker Luengo, Ibon Saratxaga, Iñaki Sainz, Nerea Ezeiza
Starting date: Jul 2003
Ending date: Dec 2005
Abstract: Hizking aims to the development of resources and basic linguistic tools in order to allow the development of tools and applications of linguistic techonologies for the Basque Language. The project has had a continuity with the new project ANHITZ
Project Title: Bizkaieraren Bideoteka
Financed by: Bizkaiko Foru Aldundia
Project manager: Inmaculada Hernáez
Team: Eva Navas, Jon Sanchez, Imanol Madariaga, Iñaki Gaminde, Xabier Zalbide, Amaia Castelruiz
Starting date: Oct 2000
Ending date: Dec 2003
Abstract: Development of a multimedia archive containing audio and video recordings that can be easily accessed via WEB.
The database can be consulted here.