{"id":1669,"date":"2016-05-15T17:41:20","date_gmt":"2016-05-15T15:41:20","guid":{"rendered":"http:\/\/aholab.ehu.eus\/wordpress\/?p=1669"},"modified":"2020-10-01T14:44:56","modified_gmt":"2020-10-01T12:44:56","slug":"implementacion-y-puesta-a-punto-de-un-reconocedor-de-voz-basado-en-kaldi","status":"publish","type":"post","link":"https:\/\/aholab.ehu.eus\/aholab\/implementacion-y-puesta-a-punto-de-un-reconocedor-de-voz-basado-en-kaldi\/","title":{"rendered":"Implementaci\u00f3n y puesta a punto de un reconocedor de voz basado en DNN"},"content":{"rendered":"<p>El reconocimiento de voz es uno de los retos clave de la interacci\u00f3n hombre-m\u00e1quina. Para construir un reconocedor de voz se necesitan dos cosas: (1) un software que modele la correspondencia entre audio y fonemas, y (2) una cierta cantidad de datos de voz, generalmente de m\u00faltiples hablantes, con los que aprender tal correspondencia (es lo que se conoce como entrenamiento). Respecto al software, existen herramientas p\u00fablicamente accesibles como HTK o como la reciente Kaldi, que a juzgar por comparativas publicadas en art\u00edculos cient\u00edficos funciona muy bien. Existen tambi\u00e9n otras aproximaciones basadas en DNNs. El objetivo de este proyecto es analizar diversas alternativas e implementar un reconocder para el euskera utilizando la que se considere m\u00e1s adecuada, usando para entrenarlo las bases de datos de voz disponibles en Aholab.<\/p>\n<p>Requisitos: manejo de Linux , buenas dotes de programaci\u00f3n (en alg\u00fan punto ser\u00e1 necesario tanto programar scripts como entender c\u00f3digo), ingl\u00e9s , inter\u00e9s por aprender sobre tecnolog\u00edas de la voz.<\/p>\n<p>Se valorar\u00e1: Python, Tensorflow<\/p>\n<p>Directores: Inma Hern\u00e1ez y David Tav\u00e1rez\u00a0(inma.hernaez@ehu.eus)<\/p>\n","protected":false},"excerpt":{"rendered":"<p>El reconocimiento de voz es uno de los retos clave de la interacci\u00f3n hombre-m\u00e1quina. Para construir un reconocedor de voz se necesitan dos cosas: (1) un software que modele la correspondencia entre audio y fonemas, y (2) una cierta cantidad de datos de voz, generalmente de m\u00faltiples hablantes, con los que aprender tal correspondencia (es&#8230;<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_es_post_content":"","_es_post_name":"implementacion-y-puesta-a-punto-de-un-reconocedor-de-voz-basado-en-kaldi","_es_post_excerpt":"","_es_post_title":"Implementaci\u00f3n y puesta a punto de un reconocedor de voz basado en Kaldi","_eu_post_content":"","_eu_post_name":"","_eu_post_excerpt":"","_eu_post_title":"","_en_post_content":"El reconocimiento de voz es uno de los retos clave de la interacci\u00f3n hombre-m\u00e1quina. Para construir un reconocedor de voz se necesitan dos cosas: (1) un software que modele la correspondencia entre audio y fonemas, y (2) una cierta cantidad de datos de voz, generalmente de m\u00faltiples hablantes, con los que aprender tal correspondencia (es lo que se conoce como entrenamiento). Respecto al software, existen herramientas p\u00fablicamente accesibles como HTK o como la reciente Kaldi, que a juzgar por comparativas publicadas en art\u00edculos cient\u00edficos funciona muy bien. Existen tambi\u00e9n otras aproximaciones basadas en DNNs. El objetivo de este proyecto es analizar diversas alternativas e implementar un reconocder para el euskera utilizando la que se considere m\u00e1s adecuada, usando para entrenarlo las bases de datos de voz disponibles en Aholab.\r\n\r\nRequisitos: manejo de Linux , buenas dotes de programaci\u00f3n (en alg\u00fan punto ser\u00e1 necesario tanto programar scripts como entender c\u00f3digo), ingl\u00e9s , inter\u00e9s por aprender sobre tecnolog\u00edas de la voz.\r\n\r\nSe valorar\u00e1: Python, Tensorflow\r\n\r\nDirectores: Inma Hern\u00e1ez y David Tav\u00e1rez\u00a0(inma.hernaez@ehu.eus)","_en_post_name":"implementacion-y-puesta-a-punto-de-un-reconocedor-de-voz-basado-en-kaldi","_en_post_excerpt":"","_en_post_title":"Implementaci\u00f3n y puesta a punto de un reconocedor de voz basado en DNN","edit_language":"en","footnotes":""},"categories":[1],"tags":[],"class_list":["post-1669","post","type-post","status-publish","format-standard","hentry","category-sin-categoria"],"_links":{"self":[{"href":"https:\/\/aholab.ehu.eus\/aholab\/wp-json\/wp\/v2\/posts\/1669","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/aholab.ehu.eus\/aholab\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/aholab.ehu.eus\/aholab\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/aholab.ehu.eus\/aholab\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/aholab.ehu.eus\/aholab\/wp-json\/wp\/v2\/comments?post=1669"}],"version-history":[{"count":6,"href":"https:\/\/aholab.ehu.eus\/aholab\/wp-json\/wp\/v2\/posts\/1669\/revisions"}],"predecessor-version":[{"id":2030,"href":"https:\/\/aholab.ehu.eus\/aholab\/wp-json\/wp\/v2\/posts\/1669\/revisions\/2030"}],"wp:attachment":[{"href":"https:\/\/aholab.ehu.eus\/aholab\/wp-json\/wp\/v2\/media?parent=1669"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/aholab.ehu.eus\/aholab\/wp-json\/wp\/v2\/categories?post=1669"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/aholab.ehu.eus\/aholab\/wp-json\/wp\/v2\/tags?post=1669"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}