RT info:eu-repo/semantics/bachelorThesis T1 Desarrollo e implementación de un algoritmo basado en text mining aplicado a la atribución de autoría A1 Pedrosa Antón, Alejandro A2 Universidad de Valladolid. Escuela Técnica Superior de Ingenieros de Telecomunicación K1 Inteligencia artificial K1 Minería de datos AB El objetivo del presente Trabajo Fin de Grado es la implementación de un algoritmo basado en métodos de text mining que permita solventar el problema de la decisión de la autoría en textos españoles.La principal motivación que se persigue es el uso de dos elementos estilométricos, los TAGS y las palabras funcionales (function words, FW) que permitan identificar correctamente el estilo intrínseco de cada autor. De este modo, se pretende desarrollar una plataforma que dé solución al problema que se quiere resolver: la atribución de autoría.Para su desarrollo se han utilizado tres modelos basados en inteligencia artificial: máquinas de vectores de soporte (support vector machine, SVM), una red neuronal de tipo perceptrón multicapa (multilayer perceptron, MLP) y Näive Bayes. Estos algoritmos se han entrenado mediante la combinación de dos indicadores de estilo: las palabras funcionales y los TAGS. Dichos elementos se caracterizan por no presentar una naturaleza dependiente del contexto y por ello escapan de la manipulación por parte de la consciencia humana. Asimismo, se ha estudiado el efecto que ocasiona el uso del análisis de componentes principales (PCA) que permite la reducción de la dimensionalidad del espacio de características del problema. Por último, se ha utilizado un banco de 6 autores españoles contemporáneos para el conjunto de las pruebas, consiguiendo unos resultados de un 92.65% de precisión para experimentos realizados con dos sujetos.Con el presente Trabajo de Fin de Grado se concluye que efectivamente las características analizadas son útiles para el contexto del problema de la atribución de autoría y que además su combinación permite obtener mejores precisiones. Asimismo, el algoritmo implementado consigue precisiones de hasta el 92.65%, mejorando resultados de estudios previos en el ámbito español. YR 2014 FD 2014 LK http://uvadoc.uva.es/handle/10324/7998 UL http://uvadoc.uva.es/handle/10324/7998 LA spa DS UVaDOC RD 23-abr-2024