Mostrar el registro sencillo del ítem

dc.contributor.advisorGarcía Escudero, Luis Ángel es
dc.contributor.authorCabrero de Diego, Alfonso
dc.contributor.editorUniversidad de Valladolid. Facultad de Ciencias es
dc.date.accessioned2025-09-16T12:10:14Z
dc.date.available2025-09-16T12:10:14Z
dc.date.issued2025
dc.identifier.urihttps://uvadoc.uva.es/handle/10324/77792
dc.description.abstractEl análisis estadístico de texto es una especialización del Análisis de Datos que se enfrenta al reto de tratar y procesar textos con el objetivo de obtener información útil. Esta tarea presenta importantes desafíos, ya que el texto es un tipo de dato no estructurado, frecuentemente muy disperso, y el cual, además, suele representarse en espacios de elevada dimensionalidad. Estas características provocan que las técnicas tradicionales de Análisis de Datos obtengan resultados poco satisfactorios, o que, en algunos casos, no sean viables debido a su muy elevado coste computacional. Este Trabajo de Fin de Grado proporciona una revisión, tanto a nivel teórico como aplicado, de algunas de las técnicas estadísticas aplicadas en análisis de texto. En concreto, el trabajo se centra en tres de sus técnicas más representativas, que son: el Análisis de Sentimiento, el Clústering y la Clasificación. Para cada una de ellas, se realiza una breve introducción que describe las principales adaptaciones orientadas al tratamiento de texto, así como una demostración práctica con R, utilizando un conjunto de datos reales. Todo el código desarrollado en este trabajo se encuentra disponible en un repositorio público de GitHub.es
dc.description.abstractStatistical text analysis is a specialization within Data Analysis that addresses the challenge of handling and processing textual data in order to extract useful information. This task poses significant challenges, as text is an unstructured and often highly sparse type of data, which is typically represented in high-dimensional spaces. These characteristics lead traditional Data Analysis techniques to yield unsatisfactory results or, in some cases, to be infeasible due to their high computational cost. This Bachelor’s Thesis offers both a theoretical and applied review of several statistical techniques used in text analysis. Specifically, it focuses on three of the most representative methods: Sentiment Analysis, Clustering, and Classification. For each of these techniques, a brief introduction is provided, outlining the main adaptations required for text processing, along with a practical demonstration using R and a real-world dataset. All the code developed in this project is available in a public GitHub repository.es
dc.description.sponsorshipDepartamento de Estadística e Investigación Operativaes
dc.format.mimetypeapplication/pdfes
dc.language.isospaes
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subject.classificationAnálisis de textoes
dc.subject.classificationMinería de textoes
dc.titleAnálisis de texto con Res
dc.typeinfo:eu-repo/semantics/bachelorThesises
dc.description.degreeGrado en Estadísticaes
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*


Ficheros en el ítem

Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem