{"id":1957,"date":"2016-12-19T12:00:15","date_gmt":"2016-12-19T11:00:15","guid":{"rendered":"http:\/\/aholab.ehu.eus\/aholab\/?p=1957"},"modified":"2025-06-06T12:20:39","modified_gmt":"2025-06-06T10:20:39","slug":"tecnicas-de-mejora-del-rendimiento-de-los-sistemas-de-diarizacion-de-locutores","status":"publish","type":"post","link":"https:\/\/aholab.ehu.eus\/aholab\/es\/tecnicas-de-mejora-del-rendimiento-de-los-sistemas-de-diarizacion-de-locutores\/","title":{"rendered":"2016, David Tav\u00e1rez: T\u00e9cnicas de mejora del rendimiento de los sistemas de diarizaci\u00f3n de locutores","raw":"2016, David Tav\u00e1rez: T\u00e9cnicas de mejora del rendimiento de los sistemas de diarizaci\u00f3n de locutores"},"content":{"rendered":"<ul>\n<li><strong>T\u00edtulo:<\/strong> T\u00c9CNICAS DE MEJORA DEL RENDIMIENTO DE LOS SISTEMAS DE DIARIZACI\u00d3N DE LOCUTORES<\/li>\n<\/ul>\n<ul>\n<li><strong>Autor:<\/strong> TAVAREZ ARRIBA, DAVID<\/li>\n<\/ul>\n<ul>\n<li><strong>Universidad:<\/strong> Universidad del Pa\u00eds Vasco\/Euskal Herriko Unibertsitatea<\/li>\n<\/ul>\n<ul>\n<li><strong>Departamento:<\/strong> Ingenier\u00eda de comunicaciones<\/li>\n<\/ul>\n<ul>\n<li><strong>Fecha de Lectura:<\/strong> 19\/12\/2016<\/li>\n<\/ul>\n<ul>\n<li><strong>Programa de doctorado:<\/strong> Programa Oficial de Doctorado en Tecnolog\u00edas de la Informaci\u00f3n y Comunicaciones en Redes M\u00f3viles<\/li>\n<\/ul>\n<ul>\n<li><strong>Direcci\u00f3n:<\/strong>\n<ol>NAVAS CORD\u00d3N, EVA (Director)<\/ol>\n<\/li>\n<\/ul>\n<ul>\n<li><strong>Tribunal:<\/strong>\n<ol>HERN\u00c1EZ RIOJA, INMACULADA (presidente)<\/ol>\n<ol>ERRO ESLAVA, DANIEL (secretario)<\/ol>\n<ol>ORTEGA GIMENEZ, ALFONSO (vocal)<\/ol>\n<\/li>\n<\/ul>\n<ul>\n<li><strong>Descriptores:<\/strong>\n<ol>TECNOLOGIA DE LAS TELECOMUNICACIONES<\/ol>\n<\/li>\n<\/ul>\n<ul>\n<li><strong>Resumen:<\/strong>\n<ol>El objetivo de la diarizaci\u00f3n es detectar los cambios de locutor en una grabaci\u00f3n e identificar qu\u00e9 segmentos de voz corresponden a un mismo locutor, respondiendo a la pregunta \u00bfqui\u00e9n habl\u00f3 cu\u00e1ndo? El trabajo realizado en esta tesis abarca diferentes aspectos relacionados con el proceso de diarizaci\u00f3n de locutores, centrando el esfuerzo en los problemas comunes a los diferentes campos de aplicaci\u00f3n.En primer lugar, se han recopilado dos nuevas bases de datos que permitir\u00e1n el desarrollo y la implementaci\u00f3n de nuevos sistemas de diarizaci\u00f3n en los dos principales \u00e1mbitos de aplicaci\u00f3n. Adem\u00e1s, se han dise\u00f1ado dos nuevas t\u00e9cnicas de segmentaci\u00f3n de audio, refrendadas con \u00e9xito en distintas campa\u00f1as de evaluaci\u00f3n organizadas por la Red Tem\u00e1tica en Tecnolog\u00edas del Habla. Se ha desarrollado un m\u00e9todo de fusi\u00f3n de etiquetas que tiene en cuenta el desequilibrio entre clases, habitual en distintas \u00e1reas del procesado de la voz, como son la segmentaci\u00f3n de audio, el reconocimiento de emociones o el reconocimiento y verificaci\u00f3n de locutores. En cuanto a la tarea de segmentaci\u00f3n de locutores, se ha introducido en esta tesis una t\u00e9cnica de detecci\u00f3n de cambios de turno basada en el an\u00e1lisis trama a trama, que permite extender el funcionamiento online a los sistemas de diarizaci\u00f3n. Por \u00faltimo, se ha propuesto una t\u00e9cnica de mejora de la diarizaci\u00f3n basada en la identificaci\u00f3n y reagrupamiento de clusters pertenecientes a un mismo locutor.<\/ol>\n<\/li>\n<\/ul>\n","protected":false,"raw":"<ul>\n \t<li><strong>T\u00edtulo:<\/strong> T\u00c9CNICAS DE MEJORA DEL RENDIMIENTO DE LOS SISTEMAS DE DIARIZACI\u00d3N DE LOCUTORES<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Autor:<\/strong> TAVAREZ ARRIBA, DAVID<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Universidad:<\/strong> Universidad del Pa\u00eds Vasco\/Euskal Herriko Unibertsitatea<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Departamento:<\/strong> Ingenier\u00eda de comunicaciones<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Fecha de Lectura:<\/strong> 19\/12\/2016<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Programa de doctorado:<\/strong> Programa Oficial de Doctorado en Tecnolog\u00edas de la Informaci\u00f3n y Comunicaciones en Redes M\u00f3viles<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Direcci\u00f3n:<\/strong>\n<ol>NAVAS CORD\u00d3N, EVA (Director)<\/ol>\n<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Tribunal:<\/strong>\n<ol>HERN\u00c1EZ RIOJA, INMACULADA (presidente)<\/ol>\n<ol>ERRO ESLAVA, DANIEL (secretario)<\/ol>\n<ol>ORTEGA GIMENEZ, ALFONSO (vocal)<\/ol>\n<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Descriptores:<\/strong>\n<ol>TECNOLOGIA DE LAS TELECOMUNICACIONES<\/ol>\n<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Resumen:<\/strong>\n<ol>El objetivo de la diarizaci\u00f3n es detectar los cambios de locutor en una grabaci\u00f3n e identificar qu\u00e9 segmentos de voz corresponden a un mismo locutor, respondiendo a la pregunta \u00bfqui\u00e9n habl\u00f3 cu\u00e1ndo? El trabajo realizado en esta tesis abarca diferentes aspectos relacionados con el proceso de diarizaci\u00f3n de locutores, centrando el esfuerzo en los problemas comunes a los diferentes campos de aplicaci\u00f3n.En primer lugar, se han recopilado dos nuevas bases de datos que permitir\u00e1n el desarrollo y la implementaci\u00f3n de nuevos sistemas de diarizaci\u00f3n en los dos principales \u00e1mbitos de aplicaci\u00f3n. Adem\u00e1s, se han dise\u00f1ado dos nuevas t\u00e9cnicas de segmentaci\u00f3n de audio, refrendadas con \u00e9xito en distintas campa\u00f1as de evaluaci\u00f3n organizadas por la Red Tem\u00e1tica en Tecnolog\u00edas del Habla. Se ha desarrollado un m\u00e9todo de fusi\u00f3n de etiquetas que tiene en cuenta el desequilibrio entre clases, habitual en distintas \u00e1reas del procesado de la voz, como son la segmentaci\u00f3n de audio, el reconocimiento de emociones o el reconocimiento y verificaci\u00f3n de locutores. En cuanto a la tarea de segmentaci\u00f3n de locutores, se ha introducido en esta tesis una t\u00e9cnica de detecci\u00f3n de cambios de turno basada en el an\u00e1lisis trama a trama, que permite extender el funcionamiento online a los sistemas de diarizaci\u00f3n. Por \u00faltimo, se ha propuesto una t\u00e9cnica de mejora de la diarizaci\u00f3n basada en la identificaci\u00f3n y reagrupamiento de clusters pertenecientes a un mismo locutor.<\/ol>\n<\/li>\n<\/ul>"},"excerpt":{"rendered":"T\u00edtulo: T\u00c9CNICAS DE MEJORA DEL RENDIMIENTO DE LOS SISTEMAS DE DIARIZACI\u00d3N DE LOCUTORES Autor: TAVAREZ ARRIBA, DAVID Universidad: Universidad del Pa\u00eds Vasco\/Euskal Herriko Unibertsitatea Departamento: Ingenier\u00eda de comunicaciones Fecha de Lectura: 19\/12\/2016 Programa de doctorado: Programa Oficial de Doctorado en Tecnolog\u00edas de la Informaci\u00f3n y Comunicaciones en Redes M\u00f3viles Direcci\u00f3n: NAVAS CORD\u00d3N, EVA (Director) Tribunal:...","protected":false,"raw":""},"author":4,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_es_post_content":"<ul>\n \t<li><strong>T\u00edtulo:<\/strong> T\u00c9CNICAS DE MEJORA DEL RENDIMIENTO DE LOS SISTEMAS DE DIARIZACI\u00d3N DE LOCUTORES<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Autor:<\/strong> TAVAREZ ARRIBA, DAVID<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Universidad:<\/strong> Universidad del Pa\u00eds Vasco\/Euskal Herriko Unibertsitatea<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Departamento:<\/strong> Ingenier\u00eda de comunicaciones<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Fecha de Lectura:<\/strong> 19\/12\/2016<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Programa de doctorado:<\/strong> Programa Oficial de Doctorado en Tecnolog\u00edas de la Informaci\u00f3n y Comunicaciones en Redes M\u00f3viles<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Direcci\u00f3n:<\/strong>\n<ol>NAVAS CORD\u00d3N, EVA (Director)<\/ol>\n<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Tribunal:<\/strong>\n<ol>HERN\u00c1EZ RIOJA, INMACULADA (presidente)<\/ol>\n<ol>ERRO ESLAVA, DANIEL (secretario)<\/ol>\n<ol>ORTEGA GIMENEZ, ALFONSO (vocal)<\/ol>\n<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Descriptores:<\/strong>\n<ol>TECNOLOGIA DE LAS TELECOMUNICACIONES<\/ol>\n<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Resumen:<\/strong>\n<ol>El objetivo de la diarizaci\u00f3n es detectar los cambios de locutor en una grabaci\u00f3n e identificar qu\u00e9 segmentos de voz corresponden a un mismo locutor, respondiendo a la pregunta \u00bfqui\u00e9n habl\u00f3 cu\u00e1ndo? El trabajo realizado en esta tesis abarca diferentes aspectos relacionados con el proceso de diarizaci\u00f3n de locutores, centrando el esfuerzo en los problemas comunes a los diferentes campos de aplicaci\u00f3n.En primer lugar, se han recopilado dos nuevas bases de datos que permitir\u00e1n el desarrollo y la implementaci\u00f3n de nuevos sistemas de diarizaci\u00f3n en los dos principales \u00e1mbitos de aplicaci\u00f3n. Adem\u00e1s, se han dise\u00f1ado dos nuevas t\u00e9cnicas de segmentaci\u00f3n de audio, refrendadas con \u00e9xito en distintas campa\u00f1as de evaluaci\u00f3n organizadas por la Red Tem\u00e1tica en Tecnolog\u00edas del Habla. Se ha desarrollado un m\u00e9todo de fusi\u00f3n de etiquetas que tiene en cuenta el desequilibrio entre clases, habitual en distintas \u00e1reas del procesado de la voz, como son la segmentaci\u00f3n de audio, el reconocimiento de emociones o el reconocimiento y verificaci\u00f3n de locutores. En cuanto a la tarea de segmentaci\u00f3n de locutores, se ha introducido en esta tesis una t\u00e9cnica de detecci\u00f3n de cambios de turno basada en el an\u00e1lisis trama a trama, que permite extender el funcionamiento online a los sistemas de diarizaci\u00f3n. Por \u00faltimo, se ha propuesto una t\u00e9cnica de mejora de la diarizaci\u00f3n basada en la identificaci\u00f3n y reagrupamiento de clusters pertenecientes a un mismo locutor.<\/ol>\n<\/li>\n<\/ul>","_es_post_name":"tecnicas-de-mejora-del-rendimiento-de-los-sistemas-de-diarizacion-de-locutores","_es_post_excerpt":"","_es_post_title":"2016, David Tav\u00e1rez: T\u00e9cnicas de mejora del rendimiento de los sistemas de diarizaci\u00f3n de locutores","_eu_post_content":"<ul>\n \t<li><strong>T\u00edtulo:<\/strong> T\u00c9CNICAS DE MEJORA DEL RENDIMIENTO DE LOS SISTEMAS DE DIARIZACI\u00d3N DE LOCUTORES<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Autor:<\/strong> TAVAREZ ARRIBA, DAVID<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Universidad:<\/strong> Universidad del Pa\u00eds Vasco\/Euskal Herriko Unibertsitatea<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Departamento:<\/strong> Ingenier\u00eda de comunicaciones<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Fecha de Lectura:<\/strong> 19\/12\/2016<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Programa de doctorado:<\/strong> Programa Oficial de Doctorado en Tecnolog\u00edas de la Informaci\u00f3n y Comunicaciones en Redes M\u00f3viles<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Direcci\u00f3n:<\/strong>\n<ol>NAVAS CORD\u00d3N, EVA (Director)<\/ol>\n<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Tribunal:<\/strong>\n<ol>HERN\u00c1EZ RIOJA, INMACULADA (presidente)<\/ol>\n<ol>ERRO ESLAVA, DANIEL (secretario)<\/ol>\n<ol>ORTEGA GIMENEZ, ALFONSO (vocal)<\/ol>\n<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Descriptores:<\/strong>\n<ol>TECNOLOGIA DE LAS TELECOMUNICACIONES<\/ol>\n<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Resumen:<\/strong>\n<ol>El objetivo de la diarizaci\u00f3n es detectar los cambios de locutor en una grabaci\u00f3n e identificar qu\u00e9 segmentos de voz corresponden a un mismo locutor, respondiendo a la pregunta \u00bfqui\u00e9n habl\u00f3 cu\u00e1ndo? El trabajo realizado en esta tesis abarca diferentes aspectos relacionados con el proceso de diarizaci\u00f3n de locutores, centrando el esfuerzo en los problemas comunes a los diferentes campos de aplicaci\u00f3n.En primer lugar, se han recopilado dos nuevas bases de datos que permitir\u00e1n el desarrollo y la implementaci\u00f3n de nuevos sistemas de diarizaci\u00f3n en los dos principales \u00e1mbitos de aplicaci\u00f3n. Adem\u00e1s, se han dise\u00f1ado dos nuevas t\u00e9cnicas de segmentaci\u00f3n de audio, refrendadas con \u00e9xito en distintas campa\u00f1as de evaluaci\u00f3n organizadas por la Red Tem\u00e1tica en Tecnolog\u00edas del Habla. Se ha desarrollado un m\u00e9todo de fusi\u00f3n de etiquetas que tiene en cuenta el desequilibrio entre clases, habitual en distintas \u00e1reas del procesado de la voz, como son la segmentaci\u00f3n de audio, el reconocimiento de emociones o el reconocimiento y verificaci\u00f3n de locutores. En cuanto a la tarea de segmentaci\u00f3n de locutores, se ha introducido en esta tesis una t\u00e9cnica de detecci\u00f3n de cambios de turno basada en el an\u00e1lisis trama a trama, que permite extender el funcionamiento online a los sistemas de diarizaci\u00f3n. Por \u00faltimo, se ha propuesto una t\u00e9cnica de mejora de la diarizaci\u00f3n basada en la identificaci\u00f3n y reagrupamiento de clusters pertenecientes a un mismo locutor.<\/ol>\n<\/li>\n<\/ul>","_eu_post_name":"tecnicas-de-mejora-del-rendimiento-de-los-sistemas-de-diarizacion-de-locutores","_eu_post_excerpt":"","_eu_post_title":"2016, David Tav\u00e1rez: T\u00e9cnicas de mejora del rendimiento de los sistemas de diarizaci\u00f3n de locutores","_en_post_content":"<ul>\r\n \t<li><strong>T\u00edtulo:<\/strong> T\u00c9CNICAS DE MEJORA DEL RENDIMIENTO DE LOS SISTEMAS DE DIARIZACI\u00d3N DE LOCUTORES<\/li>\r\n<\/ul>\r\n<ul>\r\n \t<li><strong>Autor:<\/strong> TAVAREZ ARRIBA, DAVID<\/li>\r\n<\/ul>\r\n<ul>\r\n \t<li><strong>Universidad:<\/strong> Universidad del Pa\u00eds Vasco\/Euskal Herriko Unibertsitatea<\/li>\r\n<\/ul>\r\n<ul>\r\n \t<li><strong>Departamento:<\/strong> Ingenier\u00eda de comunicaciones<\/li>\r\n<\/ul>\r\n<ul>\r\n \t<li><strong>Fecha de Lectura:<\/strong> 19\/12\/2016<\/li>\r\n<\/ul>\r\n<ul>\r\n \t<li><strong>Programa de doctorado:<\/strong> Programa Oficial de Doctorado en Tecnolog\u00edas de la Informaci\u00f3n y Comunicaciones en Redes M\u00f3viles<\/li>\r\n<\/ul>\r\n<ul>\r\n \t<li><strong>Direcci\u00f3n:<\/strong>\r\n<ol>NAVAS CORD\u00d3N, EVA (Director)<\/ol>\r\n<\/li>\r\n<\/ul>\r\n<ul>\r\n \t<li><strong>Tribunal:<\/strong>\r\n<ol>HERN\u00c1EZ RIOJA, INMACULADA (presidente)<\/ol>\r\n<ol>ERRO ESLAVA, DANIEL (secretario)<\/ol>\r\n<ol>ORTEGA GIMENEZ, ALFONSO (vocal)<\/ol>\r\n<\/li>\r\n<\/ul>\r\n<ul>\r\n \t<li><strong>Descriptores:<\/strong>\r\n<ol>TECNOLOGIA DE LAS TELECOMUNICACIONES<\/ol>\r\n<\/li>\r\n<\/ul>\r\n<ul>\r\n \t<li><strong>Resumen:<\/strong>\r\n<ol>El objetivo de la diarizaci\u00f3n es detectar los cambios de locutor en una grabaci\u00f3n e identificar qu\u00e9 segmentos de voz corresponden a un mismo locutor, respondiendo a la pregunta \u00bfqui\u00e9n habl\u00f3 cu\u00e1ndo? El trabajo realizado en esta tesis abarca diferentes aspectos relacionados con el proceso de diarizaci\u00f3n de locutores, centrando el esfuerzo en los problemas comunes a los diferentes campos de aplicaci\u00f3n.En primer lugar, se han recopilado dos nuevas bases de datos que permitir\u00e1n el desarrollo y la implementaci\u00f3n de nuevos sistemas de diarizaci\u00f3n en los dos principales \u00e1mbitos de aplicaci\u00f3n. Adem\u00e1s, se han dise\u00f1ado dos nuevas t\u00e9cnicas de segmentaci\u00f3n de audio, refrendadas con \u00e9xito en distintas campa\u00f1as de evaluaci\u00f3n organizadas por la Red Tem\u00e1tica en Tecnolog\u00edas del Habla. Se ha desarrollado un m\u00e9todo de fusi\u00f3n de etiquetas que tiene en cuenta el desequilibrio entre clases, habitual en distintas \u00e1reas del procesado de la voz, como son la segmentaci\u00f3n de audio, el reconocimiento de emociones o el reconocimiento y verificaci\u00f3n de locutores. En cuanto a la tarea de segmentaci\u00f3n de locutores, se ha introducido en esta tesis una t\u00e9cnica de detecci\u00f3n de cambios de turno basada en el an\u00e1lisis trama a trama, que permite extender el funcionamiento online a los sistemas de diarizaci\u00f3n. Por \u00faltimo, se ha propuesto una t\u00e9cnica de mejora de la diarizaci\u00f3n basada en la identificaci\u00f3n y reagrupamiento de clusters pertenecientes a un mismo locutor.<\/ol>\r\n<\/li>\r\n \t<li><a href=\"https:\/\/addi.ehu.es\/handle\/10810\/20700\"><strong>Document<\/strong><\/a><\/li>\r\n<\/ul>","_en_post_name":"tecnicas-de-mejora-del-rendimiento-de-los-sistemas-de-diarizacion-de-locutores","_en_post_excerpt":"","_en_post_title":"2016, David Tav\u00e1rez: T\u00e9cnicas de mejora del rendimiento de los sistemas de diarizaci\u00f3n de locutores","edit_language":"es","footnotes":""},"categories":[68],"tags":[],"class_list":["post-1957","post","type-post","status-publish","format-standard","hentry","category-phd-thesis-finished"],"_links":{"self":[{"href":"https:\/\/aholab.ehu.eus\/aholab\/es\/wp-json\/wp\/v2\/posts\/1957","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/aholab.ehu.eus\/aholab\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/aholab.ehu.eus\/aholab\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/aholab.ehu.eus\/aholab\/es\/wp-json\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/aholab.ehu.eus\/aholab\/es\/wp-json\/wp\/v2\/comments?post=1957"}],"version-history":[{"count":34,"href":"https:\/\/aholab.ehu.eus\/aholab\/es\/wp-json\/wp\/v2\/posts\/1957\/revisions"}],"predecessor-version":[{"id":3828,"href":"https:\/\/aholab.ehu.eus\/aholab\/es\/wp-json\/wp\/v2\/posts\/1957\/revisions\/3828"}],"wp:attachment":[{"href":"https:\/\/aholab.ehu.eus\/aholab\/es\/wp-json\/wp\/v2\/media?parent=1957"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/aholab.ehu.eus\/aholab\/es\/wp-json\/wp\/v2\/categories?post=1957"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/aholab.ehu.eus\/aholab\/es\/wp-json\/wp\/v2\/tags?post=1957"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}