Afficher la notice abrégée

dc.contributor.authorFernández-García, David
dc.contributor.authorCardeñoso-Payo, Valentín
dc.contributor.authorGonzález-Ferreras, César
dc.contributor.authorEscudero-Mancebo, David
dc.date.accessioned2026-01-23T09:01:48Z
dc.date.available2026-01-23T09:01:48Z
dc.date.issued2024
dc.identifier.citationProcesamiento Del Lenguaje Natural, septiembre 2024, n. 73, p. 209-220.es
dc.identifier.issn1135-5948es
dc.identifier.urihttps://uvadoc.uva.es/handle/10324/82053
dc.description.abstractEl habla de las personas con discapacidad intelectual (DI) plantea enormes retos a los sistemas de reconocimiento automático del habla (ASR), dificultando con ello el acceso de una población especialmente sensible a los servicios de información. En este trabajo se estudian las dificultades de los sistemas ASR para reconocer habla de personas DI y se muestra cómo esta limitación puede ser combatida con estrategias de ajuste fino de modelos. Se mide el rendimiento de ASR basado en whisper (v2 y v3) con un corpus de referencia de habla típica y habla DI, comprobando que hay diferencias importantes y significativas. Aplicando técnicas de fine-tuning, el rendimiento para hablantes DI mejora en al menos 30 puntos porcentuales. Nuestros resultados muestran que la inclusión de voz de personas DI en los corpus de entrenamiento es fundamental para mejorar la eficacia de los ASR.es
dc.format.mimetypeapplication/pdfes
dc.language.isospaes
dc.publisherSociedad Española para el Procesamiento del Lenguaje Naturales
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses
dc.subject.classificationASR, Pathologic Speech, whisper, Data Augmentationes
dc.titleAdaptación de ASR al habla de personas con síndrome de Downes
dc.typeinfo:eu-repo/semantics/articlees
dc.identifier.doi10.26342/2024-73-15es
dc.relation.publisherversionhttp://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/6611/4003es
dc.identifier.publicationfirstpage209es
dc.identifier.publicationissue73es
dc.identifier.publicationlastpage220es
dc.identifier.publicationtitleProcesamiento Del Lenguaje Natural,es
dc.peerreviewedSIes
dc.description.projectEste trabajo ha sido realizado en el marco del proyecto PID2021-126315OB-I00 que ha sido financiado por MCIN / AEI / 10.13039/501100011033 / FEDER, EU.es
dc.type.hasVersioninfo:eu-repo/semantics/publishedVersiones


Fichier(s) constituant ce document

Thumbnail

Ce document figure dans la(les) collection(s) suivante(s)

Afficher la notice abrégée