Estudiante: Mariana FLores
Directoras: Dr. Eva Navas Cordón, PhD, Dr. Inma Hernaez Rioja, PhD
Fecha de defensa 04/07/2025
Esta tesis se centra en el desarrollo de una voz personalizada en español mexicano para la plataforma AhoMyTTS. Aprovechando la arquitectura VITS, se exploraron diversas estrategias de entrenamiento y configuraciones de voz, incluyendo la creación y curación de corpus en español mexicano y la adaptación de recursos fonéticos.
El proyecto evaluó si los módulos existentes para el español peninsular podían extenderse o adaptarse al español mexicano, y comparó la eficacia de modelos entrenados con distintas variedades del idioma. Los resultados demuestran que los modelos entrenados exclusivamente con datos en español mexicano capturan mejor las características fonéticas y prosódicas del dialecto, lo que se traduce en una mayor calidad y naturalidad en la síntesis.
Los métodos y recursos desarrollados ofrecen una base práctica para extender la personalización de sistemas TTS a otras variedades del español.