Por favor, use este identificador para citar o enlazar este ítem:http://uvadoc.uva.es/handle/10324/7998
Título
Desarrollo e implementación de un algoritmo basado en text mining aplicado a la atribución de autoría
Autor
Director o Tutor
Año del Documento
2014
Titulación
Grado en Ingeniería de Tecnologías Específicas de Telecomunicación
Resumen
El objetivo del presente Trabajo Fin de Grado es la implementación de un algoritmo basado en métodos de text mining que permita solventar el problema de la decisión de la autoría en textos españoles.
La principal motivación que se persigue es el uso de dos elementos estilométricos, los TAGS y las palabras funcionales (function words, FW) que permitan identificar correctamente el estilo intrínseco de cada autor. De este modo, se pretende desarrollar una plataforma que dé solución al problema que se quiere resolver: la atribución de autoría.
Para su desarrollo se han utilizado tres modelos basados en inteligencia artificial: máquinas de vectores de soporte (support vector machine, SVM), una red neuronal de tipo perceptrón multicapa (multilayer perceptron, MLP) y Näive Bayes. Estos algoritmos se han entrenado mediante la combinación de dos indicadores de estilo: las palabras funcionales y los TAGS. Dichos elementos se caracterizan por no presentar una naturaleza dependiente del contexto y por ello escapan de la manipulación por parte de la consciencia humana. Asimismo, se ha estudiado el efecto que ocasiona el uso del análisis de componentes principales (PCA) que permite la reducción de la dimensionalidad del espacio de características del problema. Por último, se ha utilizado un banco de 6 autores españoles contemporáneos para el conjunto de las pruebas, consiguiendo unos resultados de un 92.65% de precisión para experimentos realizados con dos sujetos.
Con el presente Trabajo de Fin de Grado se concluye que efectivamente las características analizadas son útiles para el contexto del problema de la atribución de autoría y que además su combinación permite obtener mejores precisiones. Asimismo, el algoritmo implementado consigue precisiones de hasta el 92.65%, mejorando resultados de estudios previos en el ámbito español.
Materias (normalizadas)
Inteligencia artificial
Minería de datos
Idioma
spa
Derechos
openAccess
Aparece en las colecciones
- Trabajos Fin de Grado UVa [30023]
Ficheros en el ítem
La licencia del ítem se describe como Attribution-NonCommercial-NoDerivatives 4.0 International