• español
  • English
  • français
  • Deutsch
  • português (Brasil)
  • italiano
    • español
    • English
    • français
    • Deutsch
    • português (Brasil)
    • italiano
    • español
    • English
    • français
    • Deutsch
    • português (Brasil)
    • italiano
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    Parcourir

    Tout UVaDOCCommunautésPar date de publicationAuteursSujetsTitres

    Mon compte

    Ouvrir une session

    Statistiques

    Statistiques d'usage de visualisation

    Compartir

    Voir le document 
    •   Accueil de UVaDOC
    • PROJET DE FIN D'ÉTUDES
    • Trabajos Fin de Grado UVa
    • Voir le document
    •   Accueil de UVaDOC
    • PROJET DE FIN D'ÉTUDES
    • Trabajos Fin de Grado UVa
    • Voir le document
    • español
    • English
    • français
    • Deutsch
    • português (Brasil)
    • italiano

    Exportar

    RISMendeleyRefworksZotero
    • edm
    • marc
    • xoai
    • qdc
    • ore
    • ese
    • dim
    • uketd_dc
    • oai_dc
    • etdms
    • rdf
    • mods
    • mets
    • didl
    • premis

    Citas

    Por favor, use este identificador para citar o enlazar este ítem:https://uvadoc.uva.es/handle/10324/71349

    Título
    Deep Learning aplicado a reconocimiento y caracterización de habla en usuarios con síndrome de Down
    Autor
    Fernández García, David
    Director o Tutor
    Cardeñoso Payo, ValentínAutoridad UVA
    González Ferreras, CésarAutoridad UVA
    Editor
    Universidad de Valladolid. Escuela de Ingeniería Informática de ValladolidAutoridad UVA
    Año del Documento
    2024
    Titulación
    Grado en Ingeniería Informática
    Résumé
    Las personas con Síndrome de Down sufren muchos problemas a la hora de comunicarse debido a las dificultades propias de su condición. Los avances tecnológicos, en concreto la revolución del NLP, han hecho que nuestras vidas sean mucho mas fáciles y cómodas, pero estos sistemas no responden de igual forma a las personas con disfluencias. Por ello en este trabajo se pretende mejorar el rendimiento para habla anómala de estos modelos, para que sean usables por personas con disfluencias, y así poder mejorar su nivel de vida. Se plantean dos vías, la primera es el intento de conseguir un modelo reconocedor Voz-Texto para habla Down que garantice un rendimiento usable. Y la segunda corresponde a realizar una aproximación hacia la obtención de un evaluador automático del habla. En lo que respecta al reconocedor de Voz-Texto se han conseguido mejoras de hasta un 20 % con respecto al rendimiento que los mejores modelos de propósito general ofrecían para habla Down. Por último, en lo referente al evaluador automático, se puede concluir que dicha tarea no es para nada trivial y se necesita un estudio mucho más amplio y más profundo, que el que se ha realizado en este documento, para obtener un modelo usable y fiable.
     
    People with Down syndrome face many problems when communicating due to the difficulties inherent to their condition. Technological advances, specifically the revolution in NLP, have made our lives much easier and more comfortable, but these systems do not respond equally well to people with speech disfluencies. Therefore, this work aims to improve the performance of these models for anomalous speech so that they can be used by people with disfluencies, thereby improving their quality of life. Two approaches are proposed: the first attempt to achieve a Voice-to-Text recognition model for Down syndrome speech that ensures usable performance. The second approach involves working towards the development of an automatic speech evaluator. Regarding the Voice-to-Text recognizer, improvements of up to 20 % have been achieved compared to the performance of the best general-purpose models for Down syndrome speech. Finally, with respect to the automatic evaluator, it can be concluded that this task is by no means trivial, and a much broader and deeper study than what has been conducted in this document is needed to obtain a usable and reliable model.
    Palabras Clave
    ASR
    Habla Down
    Transformers
    Departamento
    Departamento de Informática (Arquitectura y Tecnología de Computadores, Ciencias de la Computación e Inteligencia Artificial, Lenguajes y Sistemas Informáticos)
    Idioma
    spa
    URI
    https://uvadoc.uva.es/handle/10324/71349
    Derechos
    openAccess
    Aparece en las colecciones
    • Trabajos Fin de Grado UVa [31268]
    Afficher la notice complète
    Fichier(s) constituant ce document
    Nombre:
    TFG-G6908.pdf
    Tamaño:
    5.943Mo
    Formato:
    Adobe PDF
    Thumbnail
    Voir/Ouvrir
    Attribution-NonCommercial-NoDerivatives 4.0 InternacionalExcepté là où spécifié autrement, la license de ce document est décrite en tant que Attribution-NonCommercial-NoDerivatives 4.0 Internacional

    Universidad de Valladolid

    Powered by MIT's. DSpace software, Version 5.10