Por favor, use este identificador para citar o enlazar este ítem:http://uvadoc.uva.es/handle/10324/44147
Título
Reducción de dimensiones: revisión y aplicaciones en clasificación automática
Autor
Director o Tutor
Año del Documento
2020
Titulación
Grado en Ingeniería Informática
Resumen
En la actualidad es habitual encontrar conjuntos de datos de alta dimensión. Este tipo
de datos son difíciles de interpretar y presentan problemas como entrada a algoritmos de
clasificación debido a la maldición de la dimensionalidad. Una manera de mejorar estos
aspectos es la aplicación de métodos de reducción de la dimensión.
Este trabajo tiene como objetivo analizar y comparar un subconjunto de los métodos
de reducción de dimensión existentes. Además, se hace una evaluación de los mismos tanto
de una manera aislada mediante diferentes medidas de calidad como por su impacto en
diferentes métodos de clasificación. Ambas evaluaciones se realizan sobre un conjunto de
datos de referencia como es MNIST.
De una manera más concreta, se han evaluado los métodos de reducción usando medidas
cuantitativas para medir la conservación de las propiedades locales y globables de
los datos. Posteriormente se han comparado métodos de clasificación entrenados en un
conjunto de datos reducido con métodos entrenados con los datos originales. Los resultados
obtenidos muestran que cual es el mejor método de reducción de dimensión depende
de nuestro objetivo (visualización o preprocesamiento). Además se comprueba que la reducción
de dimensión es una estrategia viable para mejorar el comportamiento de un
clasificador o para reducir el coste de entrenarlo, almacenarlo o usarlo. Nowadays it is common to find high dimensional data sets. This type of data is difficult
to interpret and present problems as input to classification algorithms due to the curse of
dimensionality. One way to improve these aspects is the application of dimension reduction
methods This work aims to analyze and compare a subset of existing dimensional
reduction methods. In addition, they are evaluated both in an isolated way by different
quality measures and by their impact on different classification methods. Both evaluations
are carried out on a reference data set such as MNIST.
More specifically, reduction methods have been evaluated using quantitative measures
to measure the conservation of local and global properties of the data. Subsequently,
classification methods trained on a reduced data set have been compared with methods
trained on the original data.
The results obtained show that which is the best dimension reduction method depends
on our objective (visualization or pre-processing). In addition, it is proven that dimensional
reduction is a viable strategy to improve the behavior of a classifier or to reduce the
cost of training, storing or using it.
Palabras Clave
Reducción de dimensionalidad
UMAP
t-SNE
Idioma
spa
Derechos
openAccess
Aparece en las colecciones
- Trabajos Fin de Grado UVa [30023]
Ficheros en el ítem
La licencia del ítem se describe como Attribution-NonCommercial-NoDerivatives 4.0 Internacional