Por favor, use este identificador para citar o enlazar este ítem:https://uvadoc.uva.es/handle/10324/57971
Título
Análisis cluster robusto con contaminación por celdas
Autor
Director o Tutor
Año del Documento
2022
Titulación
Grado en Estadística
Abstract
Es frecuente en la práctica habitual de la Estadística contar con medidas atípicas que pueden
afectar muy negativamente a los procedimientos estadísticos aplicados. Para resolver esta
problemática en problemas de análisis de datos multivariantes, es común recurrir al recorte de
observaciones completas. Por tanto, filas enteras de la matriz de datos son recortadas cuando se
detecta algún valor atípico en alguna de las celdas o mediciones que conforman dichas filas de
la matriz de datos. Desgraciadamente, este tipo de recorte por observaciones también sacrifica
la información de las celdas no atípicas en las filas recortadas. En este Trabajo Fin de Grado
se han tratado aspectos computacionales para nuevos métodos de Análisis Cluster que buscan
recortar solo las celdas atípicas dentro de la matriz de datos. Este enfoque es más adecuado en
los problemas de dimensionalidad no necesariamente baja que ocurren en la práctica moderna de
la Estadística. It is common in the usual practice of Statistics to have atypical measures that can have a very
negative effect on the statistical procedures applied. To solve this problem in multivariate data
analysis problems, it is common to resort to trimming entire observations. Thus, entire rows of
the data matrix are trimmed when an outlier is detected in any of the cells or measurements that
make up these rows of the data matrix. Unfortunately, this type of trimming by observations also
sacrifices the information of the non-outlier cells in the trimmed rows. In this Bachelor’s Thesis,
computational aspects for new Cluster Analysis methods that seek to trim only the outlier cells
within the data matrix have been addressed. This approach is best suited to problems of not
necessarily low dimensionality that occur in modern statistical practice.
Palabras Clave
Análisis cluster
Estadística robusta
Reducción de la dimensionalidad
Departamento
Departamento de Estadística e Investigación Operativa
Idioma
spa
Derechos
openAccess
Aparece en las colecciones
- Trabajos Fin de Grado UVa [29810]
Files in questo item
La licencia del ítem se describe como Attribution-NonCommercial-NoDerivatives 4.0 Internacional