{"id":1857,"date":"2016-02-05T16:04:38","date_gmt":"2016-02-05T15:04:38","guid":{"rendered":"http:\/\/aholab.ehu.eus\/aholab\/?p=1857"},"modified":"2025-06-05T13:35:40","modified_gmt":"2025-06-05T11:35:40","slug":"","status":"publish","type":"post","link":"https:\/\/aholab.ehu.eus\/aholab\/es\/utilizacion-de-la-fase-armonica-en-la-deteccion-de-voz-sintetica\/","title":{"rendered":"","raw":""},"content":{"rendered":"","protected":false,"raw":""},"excerpt":{"rendered":"T\u00edtulo: UTILIZACI\u00d3N DE LA FASE ARM\u00d3NICA EN LA DETECCI\u00d3N DE VOZ SINT\u00c9TICA Autor: SANCHEZ DE LA FUENTE, JON Universidad: Universidad del Pa\u00eds Vasco\/Euskal Herriko Unibertsitatea Departamento: Ingenier\u00eda de Comunicaciones Fecha de Lectura: 05\/02\/2016 Programa de doctorado: Programa Oficial de Doctorado en Tecnolog\u00edas de la Informaci\u00f3n, Electr\u00f3nica y Control Direcci\u00f3n: HERN\u00c1EZ RIOJA, INMACULADA SARATXAGA COUCEIRO, IBON...","protected":false,"raw":""},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_es_post_content":"","_es_post_name":"","_es_post_excerpt":"","_es_post_title":"","_eu_post_content":"","_eu_post_name":"","_eu_post_excerpt":"","_eu_post_title":"","_en_post_content":"<ul>\n \t<li><strong>T\u00edtulo:<\/strong> UTILIZACI\u00d3N DE LA FASE ARM\u00d3NICA EN LA DETECCI\u00d3N DE VOZ SINT\u00c9TICA<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Autor:<\/strong> SANCHEZ DE LA FUENTE, JON<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Universidad:<\/strong> Universidad del Pa\u00eds Vasco\/Euskal Herriko Unibertsitatea<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Departamento:<\/strong> Ingenier\u00eda de Comunicaciones<\/li>\n \t<li><strong>Fecha de Lectura:<\/strong> 05\/02\/2016<\/li>\n \t<li><strong>Programa de doctorado:<\/strong> Programa Oficial de Doctorado en Tecnolog\u00edas de la Informaci\u00f3n, Electr\u00f3nica y Control<\/li>\n \t<li><strong>Direcci\u00f3n:<\/strong><\/li>\n<\/ul>\n<ul>HERN\u00c1EZ RIOJA, INMACULADA<\/ul>\n<ul>SARATXAGA COUCEIRO, IBON<\/ul>\n<ul>\n \t<li><strong>Tribunal:<\/strong>\n<ol>MONTE MORENO, ENRIC (presidente)<\/ol>\n<ol>ERRO ESLAVA, DANIEL (secretario)<\/ol>\n<ol>ORTEGA GIMENEZ, ALFONSO (vocal)<\/ol>\n<\/li>\n<\/ul>\n<ul>\n \t<li><strong>Descriptores:<\/strong>\n<ol>TECNOLOGIA DE LAS TELECOMUNICACIONES<\/ol>\n<\/li>\n<\/ul>\n<ul>\n \t<li><a href=\"https:\/\/addi.ehu.es\/handle\/10810\/18491\"><strong>Documento<\/strong><\/a><\/li>\n \t<li><strong>Resumen:<\/strong><\/li>\n<\/ul>\nLos sistemas de verificaci\u00f3n de locutor (SV) tienen que enfrentarse a la posibilidad de ser atacados mediante t\u00e9cnicas de spoofing. Hoy en d\u00eda, las tecnolog\u00edas de conversi\u00f3n de voces y de s\u00edntesis de voz adaptada a locutor han avanzado lo suficiente para poder crear voces que sean capaces de enga\u00f1ar a un sistema SV. En esta tesis se propone un m\u00f3dulo de detecci\u00f3n de habla sint\u00e9tica (SSD) que puede utilizarse como complemento a un sistema SV, pero que es capaz de funcionar de manera independiente. <span id=\"more-102\"><\/span>Lo conforma un clasificador basado en GMM, dotado de modelos de habla humana y sint\u00e9tica. Cada entrada se compara con ambos, y, si la diferencia de verosimilitudes supera un determinado umbral, se acepta como humana, rechaz\u00e1ndose en caso contrario. El sistema desarrollado es independiente de locutor. Para la generaci\u00f3n de modelos se utilizar\u00e1n par\u00e1metros RPS. Se propone una t\u00e9cnica para reducir la complejidad del proceso de entrenamiento, evitando generar TTSs adaptados o un conversor de voz para cada locutor. Para ello, como la mayor\u00eda de los sistemas de adaptaci\u00f3n o s\u00edntesis modernos hacen uso de vocoders, se propone transcodificar las se\u00f1ales humanas mediante vocoders para obtener de esta forma sus versiones sint\u00e9ticas, con las que se generar\u00e1n los modelos sint\u00e9ticos del clasificador. Se demostrar\u00e1 que se pueden detectar se\u00f1ales sint\u00e9ticas detectando que se crearon mediante un vocoder. El rendimiento del sistema prueba en diferentes condiciones: con las propias se\u00f1ales transcodificadas o con ataques TTS. Por \u00faltimo, se plantean estrategias para el entrenamiento de modelos para sistemas SSD.\n\n[wpdm_package id='2969']","_en_post_name":"utilizacion-de-la-fase-armonica-en-la-deteccion-de-voz-sintetica","_en_post_excerpt":"","_en_post_title":"2016, Jon Sanchez: Utilizaci\u00f3n de la fase arm\u00f3nica en la detecci\u00f3n de voz sint\u00e9tica","edit_language":"es","footnotes":""},"categories":[68],"tags":[],"class_list":["post-1857","post","type-post","status-publish","format-standard","hentry","category-phd-thesis-finished"],"_links":{"self":[{"href":"https:\/\/aholab.ehu.eus\/aholab\/es\/wp-json\/wp\/v2\/posts\/1857","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/aholab.ehu.eus\/aholab\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/aholab.ehu.eus\/aholab\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/aholab.ehu.eus\/aholab\/es\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/aholab.ehu.eus\/aholab\/es\/wp-json\/wp\/v2\/comments?post=1857"}],"version-history":[{"count":5,"href":"https:\/\/aholab.ehu.eus\/aholab\/es\/wp-json\/wp\/v2\/posts\/1857\/revisions"}],"predecessor-version":[{"id":3825,"href":"https:\/\/aholab.ehu.eus\/aholab\/es\/wp-json\/wp\/v2\/posts\/1857\/revisions\/3825"}],"wp:attachment":[{"href":"https:\/\/aholab.ehu.eus\/aholab\/es\/wp-json\/wp\/v2\/media?parent=1857"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/aholab.ehu.eus\/aholab\/es\/wp-json\/wp\/v2\/categories?post=1857"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/aholab.ehu.eus\/aholab\/es\/wp-json\/wp\/v2\/tags?post=1857"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}