Aholab is the short name of the Signal Processing Laboratory of the University of the Basque Country (UPV/EHU). The laboratory is located in Bilbao. We are a university research team and focus our research in the areas of Text to Speech Conversion, Speech and Speaker Recognition, and Speech Processing in general. Since 2005 we are a recognized research group of the Basque Research Network. The laboratory is part of the Basque Center for Language Technology (HiTZ) and the Department of Communications Engineering of the Faculty of Engineering of Bilbao (ETSI).
Duración del contrato: 16 meses
Puestos disponibles: 2
Descripción del puesto: Estamos buscando dos personas del ámbito de la informática o de las telecomunicaciones, con pasión por la inteligencia artificial y las redes neuronales. En este emocionante proyecto, trabajarás en el desarrollo y perfeccionamiento de sistemas de creación y reconocimiento de voces.
Responsabilidades:
Requisitos:
Beneficios:
Si te atrae unirte a nuestro equipo y contribuir al futuro de la tecnología de reconocimiento de voz, ¡esperamos recibir tu solicitud! ¡Escríbenos!
Desde el Grupo Aholab y el centro HiTZ presentamos al público el nuevo sistema de reconocimiento de voz en euskera. Este avance tecnológico tiene el potencial de transformar la interacción entre las personas y la tecnología, especialmente en el ámbito del idioma vasco.
El sistema ha sido entrenado con 548 horas de voz en euskera procedentes de distintas fuentes públicas (Mozilla Common Voice 16.1, Basque Parliament, OpenSLR). lo que le permite reconocer con precisión las palabras y frases habladas por los usuarios, alcanzando niveles de calidad de WER menores al 5%.
Se han creado dos modelos diferentes basados en modelos preentrenados de NVIDIA. Uno de ellos se ha creado utilizando un modelo de lenguaje con técnicas más clásicas, y el otro utilizando tecnologías más emergentes como los transducers. El entrenamiento de los modelos se ha llevado a cabo en el sistema Hyperion de los servidores del DIPC.
Potencialmente, el sistema puede integrarse en asistentes virtuales para realizar tareas como enviar mensajes, buscar información o establecer recordatorios. También podría posibilitar la automatización de respuestas en llamadas telefónicas, mejorando la eficiencia y la atención al cliente. Y, sin duda, facilitará la transcripción de grabaciones de audio en euskera.
En este enlace está disponible una demo del sistema y los modelos pueden descargarse de Gaitu-Data. El equipo invita a la comunidad a utilizarlo y proporcionar comentarios para seguir mejorando la tecnología. Esperamos que sea una herramienta valiosa para la comunidad vasca y contribuya al fortalecimiento de nuestro idioma.
Gurekin ikastera etortzea pentsatu dutenei, egiten duguna azaltzen diegu.
Ate irekien jardunaldia – Bilboko Ingeniaritza Eskola – UPV/EHU
In the framework of the DeepRestore project, acquired EMG signals will be converted into speech. Combination with lip-reading modality will also be tested. The main tasks for the candidate will be:
a) taking part in the design and performing of EMG and video recordings
b) to process and prepare the acquired signals
c) to investigate and evaluate different deep learning strategies to decode the signals into speech
d) to document the process and contribute to scientific publications.
The candidate should preferably have a BSc degree in telecommunications engineering, artificial intelligence, computer science or equivalent preferably with a MSc. Degree. Outstanding curriculum vitae, good programming abilities, education in machine learning and experience in programming is necessary. Strong motivation, team working skills, and fluent spoken and written English will be highly appreciated.
The candidate should send an e-mail in English to inma.hernaez@ehu.eus with a CV and a brief description of the applicant particular merits to get the position. All applications will be considered regardless of gender, age, cultural background, nationality or impairments. Open until filled.