{"id":554,"date":"2003-12-21T11:47:58","date_gmt":"2003-12-21T10:47:58","guid":{"rendered":"http:\/\/aholab.ehu.eus\/wordpress\/?p=554"},"modified":"2021-07-12T22:16:41","modified_gmt":"2021-07-12T20:16:41","slug":"sintesis-de-voz-por-corpus","status":"publish","type":"post","link":"https:\/\/aholab.ehu.eus\/aholab\/sintesis-de-voz-por-corpus\/","title":{"rendered":"Lorea Mendizabal: Sintesis de voz por corpus"},"content":{"rendered":"<p>&nbsp;<\/p>\n<p style=\"text-align: justify;\"><strong><b><em>Project Title<\/em><\/b><\/strong>:S\u00edntesis de voz de alta calidad mediante t\u00e9cnicas basadas en corpus<\/p>\n<p style=\"text-align: justify;\"><strong><b><em>Project director<\/em><\/b><\/strong>:Eva Navas<\/p>\n<p style=\"text-align: justify;\"><strong><b><em>Student<\/em><\/b><\/strong>: Lorea Mendizabal<\/p>\n<p style=\"text-align: justify;\"><b><em>Starting date<\/em><\/b>: Jan 2003<\/p>\n<p style=\"text-align: justify;\"><b><em>Ending date<\/em><\/b>: Nov 2003<\/p>\n<p style=\"text-align: justify;\"><strong><b><em>Abstract<\/em><\/b><\/strong>:<\/p>\n<p style=\"text-align: justify;\">This project aims to develop a new text to speech synthesis (TTS) system based in unit selection techniques for Basque language. This TTS system will be able to express different emotions with high quality speech.<\/p>\n<p style=\"text-align: justify;\">El objetivo principal de este proyecto es la obtenci\u00f3n de un Conversor de Texto a Habla basado en corpus de forma que sea capaz de obtener una salida en la que sea perceptible la emoci\u00f3n particular que se desea que el locutor exprese.<\/p>\n<p style=\"text-align: justify;\">Algunos de los m\u00f3dulos necesarios para la consecuci\u00f3n de este objetivo global ya han sido desarrollados en otros proyectos que se han llevado a cabo en el grupo AhoLab del DET (Departamento de electr\u00f3nica y Telecomunicaciones). Este es el caso del dise\u00f1o y grabaci\u00f3n del corpus de voz, el bloque de procesado ling\u00fc\u00edstico o el modelado de la entonaci\u00f3n del euskara para diferentes emociones.<\/p>\n<p style=\"text-align: justify;\">Por tanto, existen una serie de tareas u objetivos parciales que todav\u00eda no han sido solventados y que ser\u00e1n objeto de este proyecto:<\/p>\n<ul>\n<li style=\"text-align: justify;\">Creaci\u00f3n de una base de datos con las unidades que forman el corpus pregrabado. Esta base de datos recopilar\u00e1 toda la informaci\u00f3n que se necesitar\u00e1 posteriormente acerca de cada unidad, en nuestro caso, de cada semifonema.<\/li>\n<li style=\"text-align: justify;\">Creaci\u00f3n de un motor de s\u00edntesis basado en la selecci\u00f3n de unidades. Este m\u00f3dulo ser\u00e1 capaz de elegir el conjunto de unidades del corpus de voz del que se dispone, que mejor se ajuste a una serie de caracter\u00edsticas. La selecci\u00f3n se realizar\u00e1 de forma que se minimice el coste total, suma de los costes de unidad y costes de concatenaci\u00f3n entre unidades.<\/li>\n<li style=\"text-align: justify;\">Creaci\u00f3n del m\u00f3dulo de concatenaci\u00f3n de unidades. Este m\u00f3dulo ser\u00e1 el encargado de concatenar los diferentes semifonemas que se hayan elegido mediante el algoritmo de selecci\u00f3n. Para que las transiciones entre unidades no sean perceptibles, habr\u00e1 que realizar un procesado sobre el resultado mediante el algoritmo TD-PSOLA. En consecuencia, ser\u00e1 necesario implementar otro m\u00f3dulo que obtenga las marcas a periodo de pitch o frecuencia fundamental de cada fichero de onda a partir de la correspondiente curva del laring\u00f3grafo. A su vez, deber\u00e1n corregirse en lo posible los fallos que el laring\u00f3grafo genere.<\/li>\n<li style=\"text-align: justify;\">Se persigue que el sistema sea lo m\u00e1s r\u00e1pido posible. Para ello, no solo se buscar\u00e1 la reducci\u00f3n de la carga computacional inherente a los programas desarrollados sino que tambi\u00e9n se seguir\u00e1 alguna estrategia para la organizaci\u00f3n de la base de datos de unidades que permita acelerar las b\u00fasquedas.<\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p>&nbsp; Project Title:S\u00edntesis de voz de alta calidad mediante t\u00e9cnicas basadas en corpus Project director:Eva Navas Student: Lorea Mendizabal Starting date: Jan 2003 Ending date: Nov 2003 Abstract: This project aims to develop a new text to speech synthesis (TTS) system based in unit selection techniques for Basque language. This TTS system will be able&#8230;<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_es_post_content":"","_es_post_name":"","_es_post_excerpt":"","_es_post_title":"","_eu_post_content":"","_eu_post_name":"","_eu_post_excerpt":"","_eu_post_title":"","_en_post_content":"&nbsp;\n<p style=\"text-align: justify;\"><strong><b><em>Project Title<\/em><\/b><\/strong>:S\u00edntesis de voz de alta calidad mediante t\u00e9cnicas basadas en corpus<\/p>\n<p style=\"text-align: justify;\"><strong><b><em>Project director<\/em><\/b><\/strong>:Eva Navas<\/p>\n<p style=\"text-align: justify;\"><strong><b><em>Student<\/em><\/b><\/strong>: Lorea Mendizabal<\/p>\n<p style=\"text-align: justify;\"><b><em>Starting date<\/em><\/b>: Jan 2003<\/p>\n<p style=\"text-align: justify;\"><b><em>Ending date<\/em><\/b>: Nov 2003<\/p>\n<p style=\"text-align: justify;\"><strong><b><em>Abstract<\/em><\/b><\/strong>:<\/p>\n<p style=\"text-align: justify;\">This project aims to develop a new text to speech synthesis (TTS) system based in unit selection techniques for Basque language. This TTS system will be able to express different emotions with high quality speech.<\/p>\n<p style=\"text-align: justify;\">El objetivo principal de este proyecto es la obtenci\u00f3n de un Conversor de Texto a Habla basado en corpus de forma que sea capaz de obtener una salida en la que sea perceptible la emoci\u00f3n particular que se desea que el locutor exprese.<\/p>\n<p style=\"text-align: justify;\">Algunos de los m\u00f3dulos necesarios para la consecuci\u00f3n de este objetivo global ya han sido desarrollados en otros proyectos que se han llevado a cabo en el grupo AhoLab del DET (Departamento de electr\u00f3nica y Telecomunicaciones). Este es el caso del dise\u00f1o y grabaci\u00f3n del corpus de voz, el bloque de procesado ling\u00fc\u00edstico o el modelado de la entonaci\u00f3n del euskara para diferentes emociones.<\/p>\n<p style=\"text-align: justify;\">Por tanto, existen una serie de tareas u objetivos parciales que todav\u00eda no han sido solventados y que ser\u00e1n objeto de este proyecto:<\/p>\n\n<ul>\n \t<li style=\"text-align: justify;\">Creaci\u00f3n de una base de datos con las unidades que forman el corpus pregrabado. Esta base de datos recopilar\u00e1 toda la informaci\u00f3n que se necesitar\u00e1 posteriormente acerca de cada unidad, en nuestro caso, de cada semifonema.<\/li>\n \t<li style=\"text-align: justify;\">Creaci\u00f3n de un motor de s\u00edntesis basado en la selecci\u00f3n de unidades. Este m\u00f3dulo ser\u00e1 capaz de elegir el conjunto de unidades del corpus de voz del que se dispone, que mejor se ajuste a una serie de caracter\u00edsticas. La selecci\u00f3n se realizar\u00e1 de forma que se minimice el coste total, suma de los costes de unidad y costes de concatenaci\u00f3n entre unidades.<\/li>\n \t<li style=\"text-align: justify;\">Creaci\u00f3n del m\u00f3dulo de concatenaci\u00f3n de unidades. Este m\u00f3dulo ser\u00e1 el encargado de concatenar los diferentes semifonemas que se hayan elegido mediante el algoritmo de selecci\u00f3n. Para que las transiciones entre unidades no sean perceptibles, habr\u00e1 que realizar un procesado sobre el resultado mediante el algoritmo TD-PSOLA. En consecuencia, ser\u00e1 necesario implementar otro m\u00f3dulo que obtenga las marcas a periodo de pitch o frecuencia fundamental de cada fichero de onda a partir de la correspondiente curva del laring\u00f3grafo. A su vez, deber\u00e1n corregirse en lo posible los fallos que el laring\u00f3grafo genere.<\/li>\n \t<li style=\"text-align: justify;\">Se persigue que el sistema sea lo m\u00e1s r\u00e1pido posible. Para ello, no solo se buscar\u00e1 la reducci\u00f3n de la carga computacional inherente a los programas desarrollados sino que tambi\u00e9n se seguir\u00e1 alguna estrategia para la organizaci\u00f3n de la base de datos de unidades que permita acelerar las b\u00fasquedas.<\/li>\n<\/ul>","_en_post_name":"sintesis-de-voz-por-corpus","_en_post_excerpt":"","_en_post_title":"Lorea Mendizabal: Sintesis de voz por corpus","edit_language":"en","footnotes":""},"categories":[62],"tags":[],"class_list":["post-554","post","type-post","status-publish","format-standard","hentry","category-master-thesis-finished"],"_links":{"self":[{"href":"https:\/\/aholab.ehu.eus\/aholab\/wp-json\/wp\/v2\/posts\/554","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/aholab.ehu.eus\/aholab\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/aholab.ehu.eus\/aholab\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/aholab.ehu.eus\/aholab\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/aholab.ehu.eus\/aholab\/wp-json\/wp\/v2\/comments?post=554"}],"version-history":[{"count":3,"href":"https:\/\/aholab.ehu.eus\/aholab\/wp-json\/wp\/v2\/posts\/554\/revisions"}],"predecessor-version":[{"id":3096,"href":"https:\/\/aholab.ehu.eus\/aholab\/wp-json\/wp\/v2\/posts\/554\/revisions\/3096"}],"wp:attachment":[{"href":"https:\/\/aholab.ehu.eus\/aholab\/wp-json\/wp\/v2\/media?parent=554"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/aholab.ehu.eus\/aholab\/wp-json\/wp\/v2\/categories?post=554"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/aholab.ehu.eus\/aholab\/wp-json\/wp\/v2\/tags?post=554"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}