Projects

BrAIn2lang: new website

The BrAIn2Lang website is now online.

This project explores how speech and language can be decoded from brain activity, bringing together neuroimaging and speech technologies.

https://aholab.ehu.eus/brain2lang

IKER-GAITU: Research on Language Technology to foster the presence of Basque in the digital landscape

IKER-GAITU proiektuaren helburu orokorra hizkuntza teknologian ikertzea da, ingurune digitalean euskararen presentzia areagotu dadin. Kultura eta Hizkuntza Politika sailaren dirulaguntzari esker eramango da aurrera 2023-2025 bitartean.

Egungo eta etorkizuneko teknologiek testuzko eta ahozko datu-masa erraldoiak eskatzen dituzte hizkuntza bakoitzeko. Aldiz, euskarak eta hizkuntza txikiagoek eskaini ahal dituzten datuak ez dira nahikoak gaur egun teknologia horiek behar adina kalitatea izateko. Horregatik, ezinbestekoa da hizkuntza teknologian ikertzea euskarak gero eta ohikoagoak izango diren teknologietan presentzia izateko eta beste hizkuntzen parera eramateko.

Webgunea: https://www.hitz.eus/iker-gaitu/

Instituzioa: Eusko Jaurlaritza
Ikertzaile Nagusia: Eneko Agirre
Ikertzaileak:
Victor García, Inma Hernaez, Asier Herranz, Eva Navas, Ibón Saratxaga, Eneko Agirre, Xabier Arregi, Mikel Artetxe, Unai Atutxa, Ekhi Azurmendi, Iker De la Iglesia, Mikel Iruskieta, Oier López de Lacalle , Paula Ontalvilla, Naiara Perez, German Rigau , Aitor Soroa, Jon Vadillo, Aimar Zabala

ILENIA: Impulso de las lenguas en la inteligencia artificial

ILENIA es un proyecto común y coordinado entre los siguientes centros del estado: BSC-CNS (proyecto AINA), CENID (proyecto VIVES), HiTZ (proyecto NEL-GAITU) y Universidad de Santiago de Compostela (proyecto NÓS), que tiene como objetivo generar recursos digitales que permitan desarrollar aplicaciones multilingües en las diferentes lenguas de España.

https://proyectoilenia.es/

Investigadora Principal: Marta Villegas
Participantes: Eneko Agirre, Itziar Aldabe, Xabier Arregi, Ane García, Xabier Goenaga, Inma Hernaez, Ismael Hidalgo, Gorka Labaka, Eva Navas, Naiara Perez, German Rigau, Jon Sanchez de la fuente, Ibon Saratxaga, Christoforos Souganidis, Aitor Soroa, Jon Vadillo
Eneko Agirre, Itziar Aldabe, Xabier Arregi, Ane García, Xabier Goenaga, Ismael Hidalgo, Gorka Labaka, Naiara Perez, German Rigau , Aitor Soroa

DeepRESTORE: Deep learning approaches for speech restoration from face movement biosignals

Deep Restore Project | UPV-EHU

Periodo: desde 2023 hasta 2026

Entidad financiadora: Ministerio de Ciencia e Innovación

Importe total: 186875€

Investigadores Principales: HERNAEZ RIOJA, INMACULADA SARATXAGA COUCEIRO / IBON

Descripción:

The GENERAL OBJECTIVE of DeepRESTORE is to overcome the limitations of both traditional voice rehabilitation methods and previous SSI studies by investigating SSI-based communication systems for restoring communication to individuals who have been deprived of the ability to speak. In particular, in the subproject that will be developed at UPV/EHU total-laryngectomy patients, whose upper vocal tract (i.e. mouth, tongue, lips, etc.) is intact but cannot speak normally because their entire larynx (an organ essential for sound production) has been surgically removed to treat laryngeal cancer will be considered. These persons still retain the control over their speech articulators and, hence, biosignals reflecting the movements of the articulators can be easily captured using EMG and or video images of their faces.

HiTZketan: Deep bilingual speech to speech translation

From: 2023 To: 2024

This proposal aims to develop a speech-to-speech (S2S) translation system for Basque and Spanish, i.e. a system that receives a speech signal in one of the two languages, translates it to the other, and delivers this translation using speech with a personalised voice imitating the original speaker.
The project is a joint proposal of the two research groups of Hitz Center (Ixa and Aholab) and it is intended to boost their collaboration to generate a tool that requires the knowledge from the expertise fields of both of the groups. Both IXA, in the field of NLP and Aholab in speech processing have plenty of experience and resources. The S2S translation system that will be produced will enable Basque language support for state-of-the-art technologies in automatic speech recognition, machine translation and personalised speech synthesis.
This proposal responds to the Global Challenges of the Horizon Europe Pillar II. Specifically speech and natural language processing is aligned with Cluster 4: Digital, Industry & Space in the area of Artificial Intelligence-Data-Robotics.

Investigadores Principales: Ibon Saratxaga, Aitor Soroa

Entidad financiadora: EHU

AhoStage: Eskena-ikuskizunetarako erregidore automatikoa

From: 2021 To: 2022

En un espectáculo escénico el regidor es el encargado se seguir su evolución e indicar a los diferentes técnicos (luces, sonido, efectos) los momentos en los que deben ir disparando sus diferentes recursos. En este proyecto se pretende crear una sistema automático que sea capaz de identificar en cada momento el punto del guion en el que se encuentra el espectáculo y notificarlo a los diferentes sistemas de escena que controlan la música, luces y otros efectos, para que estos puedan actuar según tengan planificado en sus respectivas escaletas.
Para ello se trabajará a partir de un sistema de doblaje, AhoDubber, que utiliza la de detección de voz (VAD, Voice Activity Detection) en múltiples micrófonos de entrada, en tiempo real de forma que pueda detectar quién habla en cada momento, y además, el sistema emplea el guion codificado siguiendo un formato desarrollado ex profeso para situar cada intervención de los actores en el contexto del mismo. Con este proyecto se pretende ampliar su funcionalidad adicional para conseguir que la aplicación resuelva tareas adicionales del personal de control y se pueda integrar en el conjunto de aplicaciones que éstos utilizan habitualmente.

Entidad financiadora: ESKENA Euskadiko Ekoizle Eszenikoen Elkartea

ReSSint: Restauración de Voz mediante Interfaces de Habla Silenciosa

From: 2020 to: 2023

www.ressint.eus

ReSSInt tiene como objetivo investigar el uso de las interfaces de voz silenciosa para restaurar la comunicación en personas que han sido privadas de la capacidad de hablar. Las interfaces de voz silenciosa son dispositivos que capturan señales biológicas no acústicas generadas durante el proceso de producción de voz y las utilizan para predecir el mensaje deseado. Si bien las interfaces SSI se han investigado principalmente en el contexto del reconocimiento de voz (Silent-Speech-to-Text), este proyecto se centra en las técnicas de síntesis de voz directa, generando así directamente la forma de onda de voz correspondiente a su salida. Dos son las señales biológicas que se investigarán en este proyecto. En el subproyecto 1, se capturarán y procesarán las señales electromiográficas producidas por el aparato de producción del habla. El subproyecto 2 abordará el campo muy novedoso de la electrocorticografía ECoG, utilizando las señales obtenidas mediante electroencefalografía intracraneal.

De todo el espectro de trastornos del habla que pueden afectar a la voz de una persona, ReSSInt abordará dos condiciones, siendo cada una el objetivo de un subproyecto particular:

- Pacientes con laringectomía total (SP1), cuyo tracto vocal superior (es decir, boca, lengua, labios, etc.) está intacto, pero no pueden hablar normalmente porque toda su laringe (un órgano esencial para la producción de sonido) ha sido extirpada quirúrgicamente como tratamiento para el cáncer de laringe. Estas personas aún conservan el control sobre los articuladores del habla y, por lo tanto, los datos del habla silenciosos que reflejan los movimientos de los articuladores se pueden capturar utilizando EMG por ejemplo.
- -Enfermedades neurodegenerativas y otras lesiones traumáticas (SP2) que pueden dejar a un individuo paralizado y, posiblemente, incapaz de hablar. Para muchas de estas personas, su único medio de comunicación es a través de movimientos oculares limitados y parpadeo; sin embargo, para aquellos con síndrome de enclaustramiento total, incluso este tipo de comunicación puede no ser posible. Un sistema de comunicación basado en SSI podría proporcionarles una forma más efectiva y eficiente de comunicarse sin la necesidad de que un cuidador inicie una conversación o hable por ellos. Tal tecnología podría mejorar dramáticamente la vida de estas personas y, posiblemente, sus beneficios potenciales superarían los riesgos de la cirugía cerebral para implantar los electrodos ECoG.

ReSSint será llevado a cabo por dos grupos de investigación ubicados en España con una fuerte colaboración de investigadores externos. El grupo Aholab de la UPV/EHU ha demostrado su experiencia en el campo del procesamiento de señales y la síntesis de voz. El grupo de la UGR está dirigido por un joven investigador con una consolidada experiencia investigadora en el campo de las interfaces de voz silenciosa. Ambos grupos contarán con el respaldo de grupos de investigación punteros en Europa.

Transferencia y soporte a la puesta en marcha de un sistema automático de detección y clasificación de eventos sonoros basado en redes neuronales

From: 3/10/2020

To: 31/12/2020

Funding: Mercedes-Benz España, S.A.

Síntesis de voz en sistemas embarcados en la flota de autobuses de Vitoria/Gasteiz

From: 04/08/2020

To: 31/12/2020

Funding: Datik Información Inteligente, S.L.

Language resources distribution agreement for AhoSLABI

From: 4/11/2020

To: 4/11/2040

Funding: ELDA. Evaluations and Language Resources Distribution Agency

Análisis de la calidad sonora de los vehículos para su evaluación automática

From: 14/2/2017

To: 31/12/2019

Funding: Mescedes-Benz España S.A.

MINTZAI: Sistemas de Aprendizaje Profundo E2E para Traducción Automática del Habla

From: 2019 to: 2020

http://www.mintzai.eus/

A través de MINTZAI, se plantea un proyecto de investigación orientado a afrontar los desafíos descritos y contribuir a la consolidación del posicionamiento de Euskadi como punto de referencia en materia de tecnologías lingüísticas.

El objeto principal del proyecto es el siguiente:

Investigación, desarrollo y validación de sistemas de traducción automática del habla basados en métodos de aprendizaje profundo E2E

El objeto principal del proyecto se descompone en los siguientes objetivos científico-tecnológicos:

Investigación y desarrollo de métodos y sistemas de traducción automática E2E voz-voz y voz-texto.
Investigación y desarrollo de componentes y sistemas de traducción automática encadenados voz-voz y voz-texto.
Recopilación, generación y preparación de datos para la traducción del habla euskera-castellano.
Evaluación automática y humana de los sistemas desarrollados.

Asimismo, se han definido los siguientes objetivos de alcance e impacto:

Definición de un caso piloto de sistemas voz-voz para el par euskera-castellano.
Definición de un caso piloto de sistemas voz-texto para el par euskera-castellano.
Validación de los prototipos en relación al estado del arte en cuanto a calidad de los sistemas de traducción automática del habla E2E finales.
Difusión académica de los resultados del proyecto en conferencias internacionales.
Transferencia de resultados a la industria y análisis de las posibilidades de explotación comercial.

De cara a la consecución de estos objetivos, MINTZAI cuenta con un consorcio potente y con gran experiencia en el ámbito de las tecnologías lingüísticas que aspira a convertirse como punto de referencia en la materia. Se trata de un proyecto de carácter estratégico para todas las entidades participantes y para Eiken, MondragonLingua, EITB y Argia.

Asesoría tecnológica AHOLAB

From: 1/6/18

To: 1/7/19

Funding: Elhuyar Fundazioa

Aprendizaje profundo aplicado a voces patológicas

From: 1-9-2018 to: 1-6-2021

Según datos del Instituto Nacional de Estadística, en España hay más de 410 000 personas con discapacidad para “Producir mensajes hablados” (datos de 2008). Este tipo de discapacidad produce un aislamiento social de las personas que la sufren, ya que su comunicación con el entorno se ve seriamente afectada, empeorando las relaciones personales, y generando problemas de integración en el entorno laboral. Este proyecto tiene como finalidad última la mejora de la calidad de vida de estas personas, mediante la generación de avances en el procesamiento digital del habla. Para generar estos avances se propone el uso de redes neuronales profundas en los procesos de conversión de texto en habla y de conversión y transformación de voz.

El grupo Aholab tiene experiencia demostrada en el procesamiento digital del habla y en la actualidad colabora con los dos hospitales más importantes del entorno (Hospital Universitario Cruces y Hospital Universitario Basurto) en el desarrollo de sistemas que mejoren la calidad de vida de los pacientes con discapacidades orales. El trabajo que se propone en este proyecto se enfoca a dos tipos de habla patológica: el habla esofágica (de personas laringectomizadas) y el habla disártrica. En ambos casos se aplicarán las técnicas de aprendizaje basadas en Redes Neuronales profundas, que están siendo aplicadas con éxito en los campos del reconocimientoy de la síntesis de voz. El interés especial de nuestro proyecto radica en el empleo de estos sistemas para voces con las patologías mencionadas.

Proyectos de Investigación Basica/Aplicada 2018-2020

BERBAOLA: Tecnologías de la Lengua y el Habla aplicadas a los ámbitos del RIS3

Project Code: KK-2017/00043

From: 2017 To: 2018

A través de BerbaOla se plantea un proyecto de investigación fundamental orientada a afrontar los desafíos de la estrategia de especialización inteligente del Gobierno Vasco y con el propósito de consolidar el posicionamiento de Euskadi como punto de referencia en materia de tecnologías lingüísticas. El objeto principal del proyecto es el siguiente: Investigación y desarrollo en tecnologías de la lengua y el habla para la Fabricación Avanzada, Biociencias y Salud, e Industrias Culturales y Creativas.

Asimismo, el objeto principal del proyecto se descompone en los siguientes objetivos científico-tecnológicos:

• Profundizar en la investigación fundamental en tecnologías de la lengua y el habla a los nichos de oportunidad Industrias Culturales e Industrias de la Lengua, así como a las prioridades estratégicas Fabricación Avanzada y Biociencias y Salud Humana.
• Reforzar la aportación científico-tecnológica de las tecnologías de la lengua y el habla a los nichos de oportunidad mencionados, traccionando su desarrollo y avance como industrias competitivas.
• Centrar la investigación fundamental en Fabricación Avanzada con el objetivo de dotar de inteligencia a los procesos productivos e interacción persona-máquina.
• Orientar nuestra investigación fundamental para que los retos sociales marcados en el Horizon 2020 y la prioridad estratégica en Biociencias y Salud Humana, respondan a retos como el envejecimiento, interoperabilidad de la información médica, la farmacovigilancia o la inclusividad de personas con discapacidad.
• Ayudar en las superación de las barreras lingüísticas para que las empresas vascas tengan ventaja competitiva en el Mercado Único Digital y que el euskera no quede digitalmente relegado.
• Promover soluciones tecnológicas multilingües e inteligentes sustancialmente nuevas mediante la exploración de ideas innovadoras y basadas en los fundamentos científicos. • Apoyar de manera flexible la investigación en colaboración, orientada por los objetivos y la interdisciplinariedad a diversas escalas.
• Generar la base para el desarrollo de un Territorio Inteligente: desde la apertura y vinculación de los procesos sociales, pasando por la conectividad multilingüe de las cosas creando nuevos espacios para la interacción que posibilitan un nuevo paradigma inclusivo.
• Consolidar el consorcio BerbaOla como punto de referencia excelente científico-tecnológica en tecnologías de la lengua y la voz dentro del Espacio Europeo de Investigación.

Iparrahotsa: AhoTTS for Lapurdian Basque

Iparrahotsa is the AhoTTS version for Lapurdian Basque.This project has been funded by the Euroregion Aquitaine Euskadi under grant EUSKADI 2012-004. You can test it in this demo shown or download it from GitHub.

Thematic Network on Speech Technologies

Financed by MINECO

The Thematic Network on Speech Technologies (RTTH) has for 16 years joined the leading researchers working on this field in Spain. Since 1999, the RTTH has boosted the research in the field of speech technology creating synergies among the different research groups that compose it with the aim of putting the Spanish research on Speech Technologies at the international scientific-technological forefront.
The main objectives of the network are:

Enhance the international dimension of the research groups working in the field of Speech Technologies in Spain by organizing events that help building strong partnerships at European level to increase the chances of the members of the RTTH in the European framework program H2020.
Attract investment towards Speech Technologies research by finding new applications that provide new business opportunities. These applications must be materialized on prototypes and demonstrators to attract the interest of companies.
Encourage scientists and technologists experts on Speech Technologies from academia to join the industrial sector to facilitate the transfer of knowledge between both areas
Promote research in Speech Technologies attracting young researchers to this field through training, mobility initiatives, scholarships and awards.
Encourage the use of Speech Technologies as a transversal technology, developing strategies to strengthen its implementation in strategic areas such as health and active aging, the Internet of the future, Big Data, Mobile Communications, …
Progress in creating partnerships and integration of Network members to maintain the leadership of Spain in the research on Castilian and the rest of the languages of the state avoiding that our country could be left behind in this area with respect the rest of the advanced economies

ENRICH EU training network

“The fundamental objective of the ENRICH network is to modify or augment speech with additional information to make it easier to process.”

The network will train 14 PhD students and give them not just the necessary cross-disciplinary knowledge and research skills, but also experience of entrepreneurship and technology transfer so they can translate research findings into products and services that will help everybody communicate successfully.

RESTORE: Reparación, almacenamiento y rehabilitación de la voz

Participants: Aholab (coordinator), Biocruces

Project Code: TEC2015-67163-C2-1-R

From: 1-1-2016 to: 31-12-2018

aholab.ehu.eus/RESTORE/

According to the data of the Spanish Statistical Institute (Instituto Nacional de Estadística) from 2008, there are more than 400 000 people with oral disabilities in Spain. In Europe, 0.4% of the population has an oral disability as indicated by Eurostat. This kind of disability produces social isolation since the communication with the environment is seriously affected so as to hamper personal relationships and generate problems of integration at the workplace.

RESTORE is a project aimed to improve the quality of communication for people with difficulties producing speech, providing them with tools and alternative communication services. At the same time, progress will be made at the research of techniques for restoration and rehabilitation of disordered speech. The following goals are proposed for the project:

Goal 1.- Implementation of a donors’ voice bank and creation of the service of personalized synthetic speech for people with oral disabilities in general and people who have been laryngectomised at Hospital Universitario Cruces.

Goal 2.- Design and development of a Serious Game as a multimedia tool to support the speech rehabilitation process for people with voice disorders.

Goal 3.- Improve the intelligibility of alaringeal voices (voices from people who have been laryngectomised) and dysartric voices.

The Project coordinates the research work of two groups, one from the field of Telecommunication Engineering and the other from the field of Medicine and Speech Therapy. The Voice Banking service proposed is a groundbreaking service for the country, since there are only a few experiences with the same aim in USA and Europe. This kind of service offers personalized synthetic speech that can be used in existing Alternative and Augmentative Communication devices. These devices allow people with oral disabilities to communicate. In our proposal the communication is achieved with a personalized voice that might be similar to the patient’s own voice in cases of progressive diseases or laryngectomies. Besides the design and development of a voice training tool is pursued in order to incentive and facilitate the speech rehabilitation process, a real hard and complex task depending on the specific pathology.

The ultimate goal of the project is to offer new possibilities in the rehabilitation and reintegration into society of patients with speech pathologies, especially those laryngectomised, by designing new intervention strategies aimed to favour their communication with the environment and ultimately increase their quality of life. This is the reason why the project fits perfectly into the Challenge 1 – Health, demographic change and wellbeing.

Este proyecto está cofinanciado por el Fondo Europeo de Desarrollo de Regional

ELKAROLA: Tecnologías de la Lengua y el Habla para un Territorio Inteligente, Industrial, Inclusivo y Multilingüe

Participants: Elhuyar (coordinator), Tecnalia, VicomTech, IXA, Aholab

Project Code: KK-2015/00098 KK-2016/00087

From: 1-1-2015 to: 31-12-2016

elkarola.eus

Mediante el proyecto ElkarOla deseamos obtener los siguientes objetivos:

Enfocar y orientar la investigación fundamental en tecnologías de la lengua y el habla a los nichos de oportunidad Industrias Culturales e Industrias de la Lengua, así como a las prioridades estratégicas Fabricación Avanzada y Biociencias y Salud Humana.
- Reforzar la aportación científico-tecnológica de las tecnologías de la lengua y el habla a los nichos de oportunidad mencionados, traccionado su desarrollo y avance como industrias competitivas.
- Centrar la investigación fundamental en Fabricación Avanzada con el objetivo de dotar de inteligencia a los procesos productivos e interacción persona-máquina.
- Orientar nuestra investigación fundamental para que los retos sociales marcados en el Horizon 2020 y la prioridad estratégica en BioCiencias y Salud Humana, respondan a retos como el envejecimiento, interoperabilidad de la información médica, la farmacovigilancia o la inclusividad de personas con discapacidad funcional.
- Ayudar en las superación de las barreras lingüísticas para que las empresas vascas tengan ventaja competitiva en el Mercado Único Digital y que el euskera no quede digitalmente relegado.
- Promover soluciones tecnológicas multilingües e inteligentes sustancialmente nuevas mediante la exploración de ideas innovadoras y basadas en los fundamentos científicos.
- Apoyar de manera flexible la investigación en colaboración, orientada por los objetivos y la interdisciplinariedad a diversas escalas.
- Generar la base para el desarrollo de un Territorio Inteligente: desde la apertura y vinculación de los procesos sociales, pasando por la conectividad multilingüe de las cosas creando nuevos espacios para la interacción que posibilitan un nuevo paradigma inclusivo.
Consolidar el consorcio ElkarOla como punto de referencia excelente científico-tecnológica en tecnologías de la lengua y la voz dentro del Espacio Europeo de Investigación.
- Reforzar la excelencia, el dinamismo y la creatividad de la investigación en en tecnologías de la lengua y el habla, donde la interdisciplinariedad y la convergencia con otros ámbitos científico-tecnológicos sea una constante.
- Llevar a cabo acciones para la incorporación de técnicos e investigadores vascos de prestigio en tecnologías de la lengua y el habla.
- Consolidar el consorcio como polo de referencia, ya que, supondrá la integración y generación de una masa crítica investigadora del sistema vasco contribuyendo a situar a nuestra comunidad en un lugar preferente en el denominado Espacio Europeo de Investigación (ERA)
- Promover y generar una red de colaboración científica en el ámbito internacional con algunos centros de investigación de reconocimiento mundial
- Promover y generar un capital investigador en la investigación de excelencia en el campo de las tecnologías de la lengua en Euskadi, que sea una referencia a nivel nacional y Europeo;
Mejorar sustancialmente la transferencia científico-tecnológica de los resultados del proyecto y cuantificar su proyección socio-económica
- Construir las herramientas adecuadas para generar un mejor conocimiento y entendimiento del procesamiento del lenguaje natural como fenómeno económico, su impacto en el territorio, empresas y en las personas. Servirá para reforzar su orientación a resultados y su cercanía a las necesidades de la empresa y del conjunto de la sociedad vasca.
- Trabajar conjuntamente y de manera continuada con el tejido empresarial, para adecuar y adaptar de la manera más eficaz posible las líneas de investigación y proyectos planificados.
- Adoptar prácticas de investigación innovadoras y detectar y aprovechar las oportunidades de beneficio a largo plazo para el Territorio y las empresas
- Integrar el conocimiento generado desde las acciones innovadoras, científico-tecnológicas en el marco de los programas de formación en tecnologías de la lengua, Fabricación Avanzada y Biociencia y Salud Humana.
- Generar el soporte claro para la difusión y transferencia inmediata del conocimiento y avances tecnológicos con el fin de dar apoyo al tejido empresarial y favorecer la creación de empresas de base tecnolçogica o start-up en sectores intensivos en conocimiento en el ámbito de las tecnologías de la lengua y la voz.

Zure_TTS: A system to produce customized voices with application to people with oral disabilities.

Project Title: A system to produce customized voices with application to people with oral disabilities

Finnaced by: BASQUE GOVERNMENT (SAIOTEK)

Project manager: Inma Hernaez

Participants: UPV/EHUI

Team: Inma Hernáez, Eva Navas, Iñaki Sainz, Dani Erro, Ibon Saratxaga, Jon Sánchez, Juanjo Igarza

Begin date: Jul-2011
End date: Dec-2012.

Project page: http://aholab.ehu.es/ZURE_TTS/

EEl proyecto presentado es un primer paso hacia el desarrollo de un sistema automático de personalización de voces sintéticas orientado especialmente a colectivos de personas afectadas por la pérdida total o parcial de su voz. En esta primera fase, se obtendrán las técnicas básicas de personalización de voces utilizando datos de voz no patológicas, se generarán los modelos correspondientes a la voz de partida genérica o voz promedio y se diseñarán las bases de datos textuales necesarias para realizar la personalización. Asímismo, se desarrollará un primer prototipo de portal de acceso al sistema, que permita a un usuario no experto desarrollar una voz sintética personalizada a su propia voz. El desarrollo de este prototipo se considera clave para el éxito del proyecto, ya que con el que se realizará un estudio piloto del interés que esta aplicación pueda tener en colectivos de personas afectadas por patologías del habla.

Así pues, los objetivos que se pretenden alcanzar con este proyecto son tres:

Implementar un sistema de personalización de voces sintéticas basado en síntesis estadística.
Desarrollar un prototipo de demostración de funcionamiento del sistema para el euskera.
Analizar el interés del sistema para colectivos de personas afectadas por pérdida de voz.

TTS-Aholab Obtén una voz propia

Finalistas en el concurso de apps de Biscaytik

Tras presentar nuestra nueva app “TTS-Aholab Obtén una voz propia” en el concurso de app de ” BicayApp Concurso de Aplicaciones’14 hemos resultado FINALISTAS!!!

Berria.info Entzungai

Project Title: Berria.info Entzungai

Finnaced by: Ehundu S.L.

Project manager: Ibon Saratxaga

Participants:Ehundu, Aholab

Team: Ibon Saratxaga, Inma Hernáez, Eva Navas, Iñaki Sainz, Dani Erro, Jon Sánchez

Begin date: May-2013
End date: Dec-2013.

AhoLab Signal Processing Laboratory ikertaldeak garatu duen plataforma abiapuntu hartuta, Berria.info-ren testuak entzungai jarriko ditugu.

Desarrollo de sistemas de síntesis de voz

From: 01/09/2010

To: 02/04/2013

Funding: ELEKA Ingeniaritza Linguistikoa

COST Action IC1206

De-identification in multimedia content can be defined as the process of concealing the identities of individuals captured in a given set of data (images, video, audio, text), for the purpose of protecting their privacy. This will provide an effective means for supporting the EU’s Data Protection Directive (95/46/EC), which is concerned with the introduction of appropriate measures for the protection of personal data.

The fact that a person can be identified by such features as face, voice, silhouette and gait, indicates the de-identification process as an interdisciplinary challenge, involving such scientific areas as image processing, speech analysis, video tracking and biometrics.

This Action aims to facilitate coordinated interdisciplinary efforts (related to scientific, legal, ethical and societal aspects) in the introduction of person de-identification and reversible de-identification in multimedia content by networking relevant European experts and organisations.

Visit the project webpage for more information.

SpeechTech4all: Speech Technologies for all

Project Title: Advanced Research in Speech Technologies for Application to Audiovisua Environments for Inclusive Human-Machine Interaction (SpeechTech4All)

Finnaced by: Spanish Ministry of Economy and Competititvity

Project manager: Inma Hernaez

Participants:UPV/EHU, UPC, UVigo (coordinator)

Team: Inma Hernáez, Eva Navas, Iñaki Sainz, Dani Erro, Ibon Saratxaga, Jon Sánchez

Begin date: Jan-2013
End date: Dec-2015.

Project Webpage

SpeechTech4All is a project focused on advanced research in all core speech technologies (speech recognition, automatic translation and text to speech conversion) for all the official languages of Spain. It is also aimed at the recognition of the speaker’s emotional state and the building of multimodal (speech and face) and multilingual (Spanish, Galician, Catalan and Basque) experimental work-frames that allow showing the work developed.

As a result of the project significant research advances will be obtained in each of the above mentioned technologies. Some of these advances are: universal access to the service of synthetic voices customization, development of domain adaptation techniques in automatic translation and development of emotional state detection systems based in speech and face joint processing. The project will take part in the international competitive evaluation campaigns organized by Interspeech and the Red Temática de Tecnologías del Habla (RTTH).

To show the advances achieved in all the technologies considered, as well as to manifest the social character of the project, two showcases are defined:

1) The first one integrates most of the technologies considered in the project and consists on the multilingual subtitling and dubbing of audiovisual material related to education: documentaries, speeches, seminars…

2) The second one is focused on one of the true applications of speech technologies: providing speech to people who have a severe level of oral disability by the use of a speech synthesis system adapted to the specific characteristics of the speaker.

Este proyecto está cofinanciado por el Fondo Europeo de Desarrollo de Regional

ZureTTS: Sistema multilingüe para la obtención de voces sintéticas personalizadas orientado a personas con discapacidad oral

Project Title: Sistema multilingüe para la obtención de voces sintéticas personalizadas orientado a personas con discapacidad oral
Finnaced by: Eusko Jaurlaritza / Gobierno Vasco (SAIOTEK call)
Project manager: Daniel Erro
Participants: UPV/EHU (AhoLab)
Team: Daniel Erro, Inma Hernáez, Eva Navas, Iñaki Sainz, Dani Erro, Ibon Saratxaga, Jon Sanchez, Agustín Sánchez
Begin date: Jan-2013
End date: Dec-2013

Project web-page

Este proyecto se plantea como continuación del proyecto Saiotek 2011, ejecutado en los ejercicios 2011 y 2012 con acrónimo ZURE_TTS y título “Sistema para la obtención de voces personalizadas con aplicación a personas con discapacidad oral”. En dicho proyecto, además de desarrollarse las técnicas y algoritmos necesarios para proporcionar voces sintéticas personalizadas mediante la adaptación de una “voz promedio”, se desarrolló un portal web, http://aholab.ehu.es/ZURE_TTS, que permite el acceso al sistema a usuarios no especializados. En este proyecto se plantea avanzar en el desarrollo de dicho portal abordando dos apectos del mismo: (i) desarrollo de nuevas técnicas que mejoren la calidad de las voces sintéticas obtenidas en condiciones de escasez de muestras de la voz objetivo; (ii) avanzar en la difusión del trabajo mediante la incorporación de los idiomas gallego y catalán, junto con el inglés.

Adicionalmente se realizará una evaluación formal del sistema para los idiomas castellano y euskera, considerando aspectos como el volumen de datos disponible para la voz objetivo y la elección de la técnica de adaptación, de modo que se pueda estudiar su influencia sobre la calidad de la voz sintética resultante.

Así, los objetivos específicos del proyecto aquí propuesto son:

La incorporación de 3 nuevos idiomas al sistema ZureTTS (gallego, catalán e inglés) mediante la obtención de los corpus adecuados, y el desarrollo de la plataforma web multilingüe en 5 idiomas (castellano y euskera además de los 3 anteriores).
La obtención de voces promedio básicas en los 3 nuevos idiomas.
La obtención de datos reales de usuarios del sistema y generación de un número suficiente de voces personalizadas en al menos dos idiomas (castellano y euskera).
El diseño de nuevas técnicas de adaptación de voces sintéticas que sean robustas frente a la escasez de muestras de la voz objetivo.
La evaluación formal, mediante tests perceptuales, del funcionamiento del sistema en las diferentes condiciones de obtención de las voces.

La razón de ser de este proyecto es la de afianzar la reorientación recientemente emprendida en Aholab hacia actividades de un mayor contenido social, es decir, que proporcionen un servicio a la sociedad en general y a las personas afectadas por trastornos del habla en particular. El proyecto permitirá aplicar la enorme experiencia del grupo, las herramientas que ha ido desarrollando a lo largo de los años y sus bases de datos de material de voz a un área de trabajo menos atractiva para compañías privadas por proporcinar beneficios económicos mucho más limitados. En lo que respecta a los objetivos concretos arriba enumerados, este proyecto permitirá hacer llegar la tecnología a más usuarios, de manera especial a aquellos que por sus limitaciones no están en disposición de grabar una gran cantidad de muestras de su voz. Además, al finalizar este proyecto se habrán sentado las bases para comenzar a trabajar en la personalización de voces sintéticas a partir de muestras de voces ya deterioradas por patologías diversas.

Por último, un efecto lateral del proyecto será la adquisición de nuevo material de voz, el grabado por los usuarios, que redundará en mejoras de la tecnología de Aholab en general.

L2-IKASI: Tecnologías del habla para el aprendizaje de segundas lenguas

Project Title: Tecnologías del habla para el aprendizaje de segundas lenguas (L2-Ikasi)

Finnaced by: Basque Government

Project manager: Eva Navas

Participants: UPV/EHU

Team: Eva Navas, Inma Hernáez, Ibon Saratxaga, Jon Sánchez, David Tavárez

Begin date: Jan-2012
End date: Dec-2013

En este proyecto se propone la realización de un sistema de ayuda para el aprendizaje de segundas lenguas utilizando las tecnologías del habla. Las tecnologías del habla pueden aplicarse tanto en la verificación de la corrección de las respuestas dadas por el estudiante, como en la evaluación de la pronunciación de los sonidos y de la entonación y ritmo con el que se expresa el estudiante. Para la evaluación de la corrección de las respuestas se emplean sistemas de reconocimiento de habla que deben verificar que la respuesta dada es la esperada por el sistema y al mismo tiempo ser capaces de tratar con señales producidas por hablantes no nativos. En la evaluación de la pronunciación también se aplican los sistemas de reconocimiento y se dan al estudiante indicaciones acerca de la corrección de su pronunciación en función de las medidas de confianza producidas por el sistema. En el marco del proyecto será necesario recoger una base de datos adecuada para entrenar el sistema de verificación de mensajes y otras que permitan entrenar el de evaluación de la corrección en la pronunciación tanto a nivel segmental como de fluidez global, de manera que sea posible ajustar los umbrales de decisión adaptándolos al nivel del estudiante. Sistemas de este tipo son comunes para lenguas mayoritarias como el inglés o el castellano, pero no existen para lenguas minoritarias.

El objetivo principal del proyecto es pues el desarrollo de un sistema de ayuda al aprendizaje de segundas lenguas tanto para realizar la verificación de enunciados como la evaluación segmental y de la fluidez de la pronunciación, centrándolo en el aprendizaje del euskara. La consecución de este objetivo global implica el logro de otros objetivos parciales como son el diseño y la obtención de las bases de datos adecuadas para el desarrollo y ajuste de los sistemas de evaluación de la corrección de la respuesta y la pronunciación, la adaptación de las herramientas automáticas de segmentación de bases de datos a la voz de hablantes no nativos, la construcción de un sistema automático de ayuda al aprendizaje del euskara como segunda lengua y el desarrollo de la metodología de evaluación del sistema realizado.

Este proyecto se enmarca dentro de la línea de investigación sobre aplicación de las tecnologías del habla a la enseñanza en la que el grupo trabaja desde el año 2009. Este proyecto supone un gran paso adelante, al proporcionar los recursos orales necesarios para continuar la investigación y al permitir comprobar la validez de las técnicas empleadas en otros idiomas para el euskara. Las aplicaciones de las tecnologías del habla en la enseñanza de idiomas es una línea estratégica para el grupo de investigación AhoLab en la que uno de sus miembros está actualmente realizando su tesis doctoral.

Iparrahotsa: desarrollo de una voz sintética para el euskera estándar de Iparralde

Project Title: Iparrahotsa: desarrollo de una voz sintética para el euskera estándar de Iparralde

Finnaced by: EUROREGION (Aquitaine-Euskadi)

Project manager: Inma Hernaez

Participants: UPV/EHU, IKER UMR5478 (CNRS)

Team: Inma Hernáez, Eva Navas, Iñaki Sainz, Dani Erro, Agustín Alonso

Begin date: Jan-2012
End date: Dec-2014.

En este proyecto se pretende desarrollar un sistema de Conversión de Texto en Habla para el dialecto navarro-labortano estándar del País Vasco de Francia.

El habla es la principal herramienta de comunicación de que disponemos las personas y el desarrollo de recursos y tecnologías para una lengua es el único modo de mantener la lengua viva en un mundo dominado por las tecnologías de la información y las comunicaciones. Este proyecto pretende cubrir una parte del vacío de las tecnologías del habla para el dialecto vasco navarro-laburtano, dialecto tradicional y muy presente en la Baja Navarra y en Labort, utilizado aproximadamente por 50000 hablantes.

El sistema de síntesis que se propone utilizar es el llamado AhoTTS (aholab.ehu.es/TTS). Este sistema, desarrollado para varias lenguas (inglés, castellano, euskera y otras), ha sido íntegramente desarrollado para el euskera batua utilizando tecnología propia de Aholab. En este proyecto se pretenden desarrollar los recursos y herramientas necesarias para obtener dos voces sintéticas (una masculina y otra femenina) para el dialecto propuesto, así como realizar las modificaciones que sean necesarias en los módulos del sistema para su integración en el sistema AhoTTS. El sistema se desarrollará en código abierto con licencia GPL de forma que podrá ser descargado, utilizado y modificado en el futuro.

Ber2Tek, Tecnologías de la lengua, de voz y multimedia al servicio de la Industria de las Lenguas (IE12-333)

Project Title: Ber2Tek, Tecnologías de la lengua, de voz y multimedia al servicio de la Industria de las Lenguas (IE12-333)
Finnaced by: Eusko Jaurlaritza / Gobierno Vasco (ETORTEK call)
Project manager: Eva Navas
Participants: UPV/EHU (AhoLab & IXA research groups), Elhuyar, VicomTech-IK4, Tecnalia
Team: Inma Hernáez, Eva Navas, Iñaki Sainz, Dani Erro, Ibon Saratxaga, Jon Sanchez
Begin date: Jan-2012
End date: Dec-2014

Project Webpage

BerbaTek ha sido durante 2009-2011 un proyecto Etortek en el que han participado la fundación Elhuyar, los grupos de investigación IXA y Aholab de la UPV/EHU, el centro tecnológico Vicomtech-IK4 y la fundación Tecnalia Research&Innovation, con el objetivo principal de investigar y desarrollar tecnologías lingüísticas, de voz y multimedia, para que puedan servir como base tecnológica de apoyo a las distintas áreas que conforman el sector económico de la Industria de las Lenguas en el País Vasco. El presente proyecto, Ber2Tek, pretende ser una continuación del anterior en el que el consorcio continuará avanzando en el desarrollo de las tecnologías básicas demandadas por la Industria de las Lenguas local, alineándose a su vez con la visión y directrices estratégicas marcadas por la Comisión Europea en lo que a las tecnologías lingüísticas y la Industria de las Lenguas Europea se refiere. Ber2Tek nace, por lo tanto, como continuación natural del proyecto BerbaTek y como consecuencia de la reflexión estratégica de sus socios en el marco de las necesidades tecnológicas identificadas por las Industrias de la Lengua local y Europea. Su objetivo principal es avanzar en la investigación y desarrollo de las tecnologías de análisis de contenidos cross-media, traducción automática de alta calidad e interacción hablada multimodal natural. Además, pretende crear un repositorio online donde almacenar las herramientas y recursos básicos desarrollados a lo largo del proyecto con el objeto de impulsar la transferencia de tecnología hacia las PYMES vascas. Ber2Tek busca también generar el conocimiento y formación de la masa crítica cualificada que permita afrontar autónomamente el futuro de la I+D+i dentro de esta línea estratégica. Para ello se organizarán cursos de formación, master de postgrado, seminarios especializados y cursos de doctorado en el ámbito de la tecnología lingüística. Para lograr los objetivos planteados, los socios integrantes del proyecto Ber2Tek disponen de una comunidad científica e investigadora con la masa crítica necesaria y reconocida internacionalmente, además de relaciones preferenciales con muchas empresas de la industria de las lenguas. Tras el éxito del enfoque adoptado en el proyecto anterior, Ber2Tek estará también orientado hacia las aplicaciones. Sin dejar de lado la investigación básica, intentará presentar aplicaciones experimentales en forma de demostradores que, posteriormente, podrán ser desarrolladas y convertidas en producto por empresas dedicadas a la traducción, la enseñanza de las lenguas o los contenidos. Además de utilizar estos demostradores como evaluadores y pruebas de viabilidad, planeamos obtener la cooperación de empresas del entorno para participar en el proyecto como testeadores beta.

TV-Social – Low Cost Telebista

Project Title: TV-Social – Low Cost Telebista
Finnaced by: BASQUE GOVERNMENT (ETORGAI)

Project manager: Inma Hernaez

Participants:UPV/EHU, Irusoin, Gizer.net, Eleka, Gaia, Sonora estudios, Ibermatica, Mixer, Ibercom, Orio produkzioak, Arista, Telbask, VicomTech, Tecnológico Deusto, Elhuyar, Euve, I3B, Robotiker

Team: Inma Hernáez, Eva Navas, IIñaki Sainz, Dani Erro, Ibon Saratxaga, Daniel Erro, Jon Sánchez, Juanjo Igarza

Begin date: Jan-2010
Final date: Dec-2012.

Abstract:

El objetivo fundamental del proyecto TV SOCIAL es el de permitir el desarrollo de diferentes prototipos avanzados de generación automática de contenidos y automatización de procesos, orientados a la producción low-cost para entornos broadcast, y contenidos generados por el usuario (User-Generated Content), tanto desde el punto de vista del usuario doméstico como profesional, orientadas a la creación de contenidos multicanal, multiplataforma y multilingüe, con una dimensión internacional. Como objetivos colaterales o secundarios, podemos destacar:

Desarrollar tecnología que permita generar, editar y procesar, transferir y automatizar contenidos audiovisuales, a unos costes de producción asumibles, sin sacrificar calidad final de producto.
Permitir la participación del público en general, utilizando dispositivos a su alcance (cámaras de fotos, móviles y minicámaras domésticas)
Permitir a las empresas del sector audiovisual / TICS vasco posicionarse como empresas punteras en el desarrollo de este tipo de tecnologías de low-cost

BUCEADOR: Information search engine for multilingual audiovisual contents

Project Title: BUCEADOR: Information search engine for multilingual audiovisual contents.
Finnaced by: MICINN
Project manager: Eva Navas

Participants: TALP (UPC), GPS (Uni. Vigo) , Aholab (UPV/EHU)

Team: Eva Navas, Inma Hernáez, Iñaki Sainz, Ibon Saratxaga, Daniel Erro, Iñaki Gaminde, Jon Sánchez, Juanjo Igarza
Begin date: Jan-2010
Final date: Dec-2012.

For more information about the project please visit the project homepage

Abstract:

BUCEADOR is a project focused on advanced research in all core Spoken Language Technologies (SLT), (diarization, speech recognition, speech machine translation, and text-to-speech conversion), research in both, cross-language and speech-oriented information retrieval technologies for voice search applications, and the successful joint integration of all of them in a multilingual and multimodal information retrieval system.
The goal of the project is to achieve improvements in all the SLT components and voice search applications to improve human-machine and human-to-human communication among all the official languages spoken in Spain as well as between these languages and English.
The project will obtain research advances in each mentioned technology. Examples of such approaches are exploring new techniques for the diarization of speeches, incorporating confidence measures for unconstrained conversational speech in automatic speech recognition, integrating linguistic knowledge in the statistical approach to spoken language translation, new acoustic and prosodic models for generating expressive speech in synthesis, and implementing new strategies for voice search information retrieval. It is planned that the project will participate in European and American (NIST) competitive evaluation systems.
In order to show the achievements in the above mentioned technologies and their successful joint integration, the project will create a show case consisting of a search engine for multilingual audiovisual contents. Specifically, broadcast news from several TV, radio, and internet channels in all the official Spanish languages (Spanish, Catalan, Basque and Galician) plus English will be utilized.

VERIFY: Prototipo de verificación de mensajes para la enseñanza de idiomas

Project Title: VERIFY: Prototipo de verificación de mensajes para la enseñanza de idiomas

Financed by:University of the Basque Country and DIDAKTIKER S.L.

Project manager: Inma Hernaez

Team: Inma Hernáez, Eva Navas, Igor Odriozola, Iñaki Sainz

Starting date: Jan 2009

Ending date: Dec 2010

Abstract:C-extrator , in the section assigned to Aholab, aims at speeding the interaction of the second language student with the computer, by using a spoken message verification tool. The message verification algorithms will be integrated in second language learning software from Didaktiker

El objetivo global del proyecto es el desarrollo de un sistema de verificación de mensajes para la mejora de la interacción entre usuario y ordenador, en el aprendizaje de idiomas. Este sistema de verificación debería posteriormente integrarse en el el software desarrollado por la empresa DIDAKTIKER para la empresa Bai&By, especializada en la enseñanza on-line del euskera y del inglés.

El software pretende agilizar la interacción con el usuario de forma que los enunciados solicitados, que actualmente el estudiante introduce en la aplicación a través del teclado del ordenador, puedan ser introducidos de forma oral mediante un micrófono. El sistema debería escribir el mensaje reconocido en el caso de que la respuesta sea correcta, o indicar un error si el mensaje oral enunciado no corresponde con la respuesta (o respuestas) esperadas. Es por esto que el sistema a desarrollar se ha llamado Sistema de Verificación de mensajes, ya que esta sería la principal función del módulo a desarrollar. Se espera que la disponibilidad de un módulo que permita la introducción oral en lugar de por teclado, agilizaría notablemente la velocidad en la que el estudiante puede completar las respuestas.

En la base del desarrollo de un sistema de este tipo se encuentran las tecnologías de reconocimiento de la voz (ASR: Automatic Speech Recognition), mediante las cuales se pretende identificar el mensaje contenido en un enunciado oral, es decir convertir un mensaje de voz en texto. La finalidad de este proyecto difiere notablemente de la funcionalidad de un sistema ASR, ya que no se trata de en nuestro caso de identificar el mensaje, sino de indicar si el mensaje enunciado corresponde con el mensaje esperado. Aunque la tecnología utilizada para verificar el enunciado es la misma empleada en los sistemas de reconocimiento de voz, el sistema de verificación tiene la ventaja de trabajar sobre un conjunto de enunciados que aunque puede ser grande, es finito.

Dado que el software para el aprendizaje on-line de idiomas está disponible tanto para el euskera como para el inglés, el sistema propuesto sería desarrollado para los dos idiomas de forma totalmente similar.

BERBATEK: Tools and technologies to foster the language industry

Project Title: BERBATEK: Herramientas y tecnologías para el impulso de las tecnologías de la lengua.

Financed by: Basque Government

Project manager: Eva Navas Cordón

Team: Eva Navas, Inma Hernáez, Jon Sanchez, Iñaki Gaminde, Iker Luengo, Ibon Saratxaga, Iñaki Sainz, Daniel Erro, Igor Odriozola

Starting date: Jan 2009

Ending date: Dec 2011

Abstract: BerbaTek is a strategic research project with a duration of three years (2009-2011). Its consortium is made up of the Elhuyar Foundation, the IXA and Aholab research groups of the UPV/EHU-University of the Basque Country, and the technology centres Vicomtech and Robotiker.
For more information about the project, please visit the project HomePage.

C-EXTRACTOR: Plataforma de extracción automática de conocimiento a partir de fuentes de informac

Project Title: C-EXTRACTOR”, Plataforma de extracción automática de conocimiento a partir de fuentes de información estructuradas

Financed by:Ministry of Industry and Comerce in collaboration with DIDAKTIKER S.L.

Project manager: Inma Hernaez

Team: Inma Hernáez, Eva Navas, Igor Odriozola, Iñaki Sainz

Starting date: Oct 2008

Ending date: Dec 2010

Abstract:C-extrator , in the section assigned to Aholab, aims at integrating various speech processing tools in second language learning software from Didaktiker

Colaboración en desarrollo corporativo de síntesis bilingüe euskera-castellano sobre Verbio TTS

Project Title: Colaboración en desarrollo corporativo de síntesis bilingüe euskera-castellano sobre Verbio TTS

Financed by:Dominion Technologies, S.L.

Project manager: Inma Hernaez

Team: Inma Hernáez, Eva Navas, Igor Odriozola, Iñaki Sainz

Starting date: Oct 2008

Ending date: Apr 2009

Abstract:

ECESS: European Center of Excellence for Speech Synthesis

Project Title: European Center of Excellence for Speech Synthesis

ECESS is an European Consortium aiming at promoting the R&D in the field of Speech Synthesis. For more information about this consortium connect to this link.

Financed by:EHU

Project manager: Inma Hernaez

Multilingual Speaker Identification System

Project Title: Multilingual Speaker Identification System

Financed by:Basque Governement

Project manager: Eva Navas

Team: Eva Navas, Inma Hernáez, Juanjo Igarza, Jon Sanchez, Iker Luengo

Starting date: Nov 2007

Ending date: Nov 2008

Abstract:

Bizkaieraren Fonotekea: a sound archive for the Bizkaian Basque

Bizkaieraren fonotekea is a sound archive created for the Basque variant spoken in the villages located in the area of Bizkaia. You will find all kind of recordings: traditional songs, old sayings, old legends… Through this project we want to show the invaluable treasure of our language and our dialect, not only to the interested people of our world but also to our future generations.

All recordings are transcribed and labeled at different levels which allows the search under different variables. Give it a try!

Investigación en sistemas de confort inteligente en el interior de vehículos

Project Title: Sistemas de Confort Acústico Inteligente (SCAI)

Financed by: P4Q, Maier

Project manager: Inma Hernaez

in collaboration with the University of Zaragoza.

Team:

Aholab: Inma Hernáez, Ibon Saratxaga, Eva Navas, Eneritz de Bilbao, David Tavarez

Starting date: Sept 2007

Ending date: May 2008

Abstract:The goal of this project is the development of DSP based techniques and algorithms aimed at making the vehicle inside acoustically comfortable.

SCAI: Investigación en sistema de confort inteligente para interior de vehículo

Project Title: SCAI: Investigación en sistema de confort inteligente para interior de vehículo

Financed by: P4Q Electronics and Maier S.L.

Project manager: Inma Hernaez

Team: Inma Hernáez, Eva Navas, Ibon Saratxaga, Eneritz de Bilbao

Starting date: Set 2007

Ending date: Jun 2008

Abstract:

SmartADAPT: Generación de Tecnología Asistiva Multimodal y Adaptativa en Entornos Inteligentes

Project Title: SmartADAPT: Generación de Tecnología Asistiva Multimodal y Adaptativa en Entornos Ingeligentes

Financed by:Bizkaiko Foru Aldundia

in collaboration with ROBOTIKER-Teknalia

Project manager: Inma Hernaez

Team: Inma Hernáez, Eva Navas, Igor Odriozola, Iker Luengo, Iker Apalategi, Jonathan Gonzalez

Starting date: April 2007

Ending date: Dec 2009

Abstract:SmartADAP plantea desarrollar tecnologías deinterfaces de usuario más inteligentes que se adapten al usuario (a sus preferencias y capacidades/habilidades) y a la situación de entorno en la que se encuentra el propio usuario

AVIVAVOZ: Tecnologías para la traducción de voz

Project Title: Tecnologías para la traducción de voz: Reconocimiento, traducción estadísitca basada en corpus y síntesis.
Finnaced by: Ministerio de Educación y Ciencia

Participants: TALP (UPC), GPS (Uni. Vigo) , Aholab (UPV/EHU)

Abstract:
Begin date: Jan-2007
Final date: Dec-2009.
More information: click here

COST-2102-Verbal and Non Verbal Communication Behaviours

Action COST-2102 Verbal and Non-Verbal Communication Behaviours

The main objetive of the Action is to develop an advanced acoustical, perceptual and psychological analysis of verbal and non-verbal communication signals originating in spontaneous face-to-face interaction, in order to identify algorithms and automatic procedures capable of identifying human emotional states.

More information: Action COST-2102

Identificación biométrica basada en voz (IDENLOK)

Project Title: Identificación biométrica basada en voz (IDENLOK)

Financed by: Basque Government

Project manager: Eva Navas

Team: Eva Navas, Inmaculada Hernáez, Juan José Igarza, Jon Sanchez, Iker Luengo, Ibon Saratxaga, Iñaki Sainz

Starting date: Jul 2006

Ending date: Dec 2007

Abstract:The goal of this project is the development of a speaker identification system that uses spectral and prosodic information.

En este proyecto se propone la realización de un sistema de identificación biométrica basado en voz que sea capaz de reconocer al locutor empleando para ello tanto información de tipo espectral como prosódica. El uso de éste último tipo de información hace al sistema más robusto frente a cambios de sesión y de canal, pero por otro lado lo hace más dependiente del idioma en el que se desarrolle. En el marco del proyecto será necesario recoger una base de datos adecuada para entrenar un sistema de verificación de locutor que permita a los usuarios utilizar el euskara como lengua de acceso al mismo. Además será necesario desarrollar herramientas automáticas de segmentación que permitan añadir la información necesaria a las señales de la base de datos, de manera que puedan ser utilizadas en el desarrollo del sistema de verificación. Con esta base de datos adecuadamente etiquetada se construirá un sistema clásico de verificación de locutor basado en rasgos espectrales y un sistema innovador basado en información prosódica. Las ventajas de ambos sistemas se fusionarán utilizando técnicas de fusión de expertos para obtener un sistema más robusto y eficiente.

El objetivo principal del proyecto es pues el desarrollo de un sistema mixto de verificación de locutor que utilice datos tanto espectrales como prosódicos y que sea adecuado para ser utilizado tanto en castellano como en euskara.

La consecución del objetivo global del proyecto implica el logro de otros objetivos parciales como son la obtención de una base de datos bilingüe adecuada para la caracterización de locutores, el desarrollo de herramientas automáticas de segmentación de bases de datos, la construcción de sistemas de verificación de locutor que utilicen un único tipo de información y la selección y aplicación de las técnicas más adecuadas de fusión para obtener el sistema mixto final.

Este proyecto se enmarca dentro de la línea de investigación sobre biometría en la que el grupo trabaja desde el año 2001. Los campos en los que se trabaja son la identificación en base a la firma, tanto off-line como on-line, y en base a la voz. Dentro de este último campo este proyecto supone un gran paso adelante, al proporcionar los recursos orales necesarios para continuar la investigación y al permitir comprobar la validez de las técnicas empleadas en otros idiomas para el euskara. La biometría es una línea estratégica para el grupo de investigación AhoLab y dos de sus miembros están actualmente realizando la tesis doctoral en este campo.

ANHITZ:tecnologs linguisticas para la interaccion multilingue…

Project Title: ANHITZ: Tecnologías lingüísticas para la interacción multilingüe en entornos inteligentes (Linguistic technologies for multilingual interaction in intelligent environments)

Financed by: Basque Government

Project manager: Inmaculada Hernáez

Team: Eva Navas, Jon Sanchez, Iñaki Gaminde, Iker Luengo, Ibon Saratxaga, Iñaki Sainz, Nerea Ezeiza

Starting date: Jul 2006

Ending date: Dec 2008

Abstract: AnHitz aims to the development and research of linguistic technology in Basque for natural, friendly and intuitive person-device communication. For more information, please visit the project HomePage.

Integración de un conversor de texto en habla bilingüe castellano/euskara en una máquina embebida

Project Title: Integración de un conversor de texto en habla bilingüe castellano/euskara en una máquina embebida Linux para leer datos enviados por el sistema TETRA y convertirlos en voz

Financed by: Dominion Tecnologías SLU

Project manager: Eva Navas

Project Team:Eva Navas, Iñaki Sainz, Jon Sanchez, Inma Hernaez

Start date: Jan 2006

End date: Set 2006

Project description:

Project phases:

Phase 1.-

Milestone 2.- In-site test of the system. Results OK.

Tecnologias del habla aplicadas a dispositivos portátiles

Project Title:Tecnologias del habla aplicadas a dispositivos portátiles

Financed by:Basque Governement

Project manager: Eva Navas

Start date: Jan 2004

End date: Dec 2006

Team:

HIZKING21:Hizkuntza Ingeniaritza XXI.Mendeko atean

Project Title: HIZKING21: Hizkuntza Ingeniaritza XXI. Mendeko atean (Linguistic Engineering at the begining of the XXI century)

Financed by: Basque Government

Project manager: Inmaculada Hernáez

Team: Eva Navas, Jon Sanchez, Iñaki Gaminde, Iker Luengo, Ibon Saratxaga, Iñaki Sainz, Nerea Ezeiza

Starting date: Jul 2003

Ending date: Dec 2005

Abstract: Hizking aims to the development of resources and basic linguistic tools in order to allow the development of tools and applications of linguistic techonologies for the Basque Language. The project has had a continuity with the new project ANHITZ

Bizkaieraren bideoteka

Project Title: Bizkaieraren Bideoteka

Financed by: Bizkaiko Foru Aldundia

Project manager: Inmaculada Hernáez

Team: Eva Navas, Jon Sanchez, Imanol Madariaga, Iñaki Gaminde, Xabier Zalbide, Amaia Castelruiz

Starting date: Oct 2000

Ending date: Dec 2003

Abstract: Development of a multimedia archive containing audio and video recordings that can be easily accessed via WEB.

The database can be consulted here.

Projects

BrAIn2lang: new website

IKER-GAITU: Research on Language Technology to foster the presence of Basque in the digital landscape

ILENIA: Impulso de las lenguas en la inteligencia artificial

DeepRESTORE: Deep learning approaches for speech restoration from face movement biosignals

HiTZketan: Deep bilingual speech to speech translation

AhoStage: Eskena-ikuskizunetarako erregidore automatikoa

ReSSint: Restauración de Voz mediante Interfaces de Habla Silenciosa

Transferencia y soporte a la puesta en marcha de un sistema automático de detección y clasificación de eventos sonoros basado en redes neuronales

Síntesis de voz en sistemas embarcados en la flota de autobuses de Vitoria/Gasteiz

Language resources distribution agreement for AhoSLABI

Análisis de la calidad sonora de los vehículos para su evaluación automática

MINTZAI: Sistemas de Aprendizaje Profundo E2E para Traducción Automática del Habla

Asesoría tecnológica AHOLAB

Aprendizaje profundo aplicado a voces patológicas

BERBAOLA: Tecnologías de la Lengua y el Habla aplicadas a los ámbitos del RIS3

Iparrahotsa: AhoTTS for Lapurdian Basque

Thematic Network on Speech Technologies

ENRICH EU training network

RESTORE: Reparación, almacenamiento y rehabilitación de la voz

ELKAROLA: Tecnologías de la Lengua y el Habla para un Territorio Inteligente, Industrial, Inclusivo y Multilingüe

Zure_TTS: A system to produce customized voices with application to people with oral disabilities.

TTS-Aholab Obtén una voz propia

Finalistas en el concurso de apps de Biscaytik

Berria.info Entzungai

Desarrollo de sistemas de síntesis de voz

COST Action IC1206

SpeechTech4all: Speech Technologies for all

ZureTTS: Sistema multilingüe para la obtención de voces sintéticas personalizadas orientado a personas con discapacidad oral

L2-IKASI: Tecnologías del habla para el aprendizaje de segundas lenguas

Iparrahotsa: desarrollo de una voz sintética para el euskera estándar de Iparralde

Ber2Tek, Tecnologías de la lengua, de voz y multimedia al servicio de la Industria de las Lenguas (IE12-333)

TV-Social – Low Cost Telebista

BUCEADOR: Information search engine for multilingual audiovisual contents

VERIFY: Prototipo de verificación de mensajes para la enseñanza de idiomas

BERBATEK: Tools and technologies to foster the language industry

C-EXTRACTOR: Plataforma de extracción automática de conocimiento a partir de fuentes de informac

Colaboración en desarrollo corporativo de síntesis bilingüe euskera-castellano sobre Verbio TTS

ECESS: European Center of Excellence for Speech Synthesis

Multilingual Speaker Identification System

Bizkaieraren Fonotekea: a sound archive for the Bizkaian Basque

Investigación en sistemas de confort inteligente en el interior de vehículos

SCAI: Investigación en sistema de confort inteligente para interior de vehículo

SmartADAPT: Generación de Tecnología Asistiva Multimodal y Adaptativa en Entornos Inteligentes

AVIVAVOZ: Tecnologías para la traducción de voz

COST-2102-Verbal and Non Verbal Communication Behaviours

Identificación biométrica basada en voz (IDENLOK)

ANHITZ:tecnologs linguisticas para la interaccion multilingue…

Integración de un conversor de texto en habla bilingüe castellano/euskara en una máquina embebida

Tecnologias del habla aplicadas a dispositivos portátiles

HIZKING21:Hizkuntza Ingeniaritza XXI.Mendeko atean

Bizkaieraren bideoteka

Supporters