RT info:eu-repo/semantics/masterThesis T1 Estudio de la conversión texto a voz basada en DNN: modelo base y fine-tuning A1 Peñas Pérez, Irene A2 Universidad de Valladolid. Escuela de Ingeniería Informática de Valladolid K1 TTS K1 NeMo K1 Finetuning K1 DNN AB La síntesis de voz es un área de investigación en constante evolución, y que está siendo, enla actualidad, un campo de investigación para las DNN generativas. En este trabajo se abordala necesidad de desarrollar un sistema de síntesis de voz en español para superar las limitacioneslingüísticas que existen en este campo en el idioma español y tratar de mejorar la accesibilidadcomo puede ser en los asistentes virtuales. El objetivo del TFM se centra en explorar el usode técnicas neuronales de última generación para crear un modelo base español, a partir de unconjunto de datos en castellano. Más tarde, se procede a optimizar, para después realizar un finetuningcon otro conjunto de datos nuevo, obteniendo de esta manera una serie de modelos enespañol. Por último, se evalúan y se extraen una serie de conclusiones. Para la consecución de esteobjetivo, se hace uso de la herramienta NeMo. De esta manera, se crea un modelo base españolutilizando FastPitch y HiFiGAN. Además se dispone de 3 conjuntos de datos diferentes pararealizar los modelos y los consecuentes experimentos. Se evalúan las señales sonoras generadas porlos diferentes modelos, tanto el base, como los finetuned y más tarde se hacen dos evaluaciones,una objetiva con un conjunto de métricas, y otra perceptual, en la que se pregunta a una seriede personas sobre la calidad e inteligibilidad de los audios. En conclusión, mediante este trabajose aborda la necesidad imperante de desarrollar conjuntos de datos y sistemas de síntesis de vozen español para superar las limitaciones lingüísticas y mejorar la accesibilidad en aplicacionescomo los asistentes virtuales en castellano. YR 2023 FD 2023 LK https://uvadoc.uva.es/handle/10324/63040 UL https://uvadoc.uva.es/handle/10324/63040 LA spa NO Departamento de Informática (Arquitectura y Tecnología de Computadores, Ciencias de la Computación e Inteligencia Artificial, Lenguajes y Sistemas Informáticos) DS UVaDOC RD 19-jun-2024