Por favor, use este identificador para citar o enlazar este ítem:http://uvadoc.uva.es/handle/10324/38298
Título
Métodos de selección de variables en clustering y análisis discriminante
Autor
Director o Tutor
Año del Documento
2019
Titulación
Grado en Estadística
Resumen
Hoy en día es muy común en cualquier disciplina el querer identificar las características de un
conjunto de individuos que permita diferenciar y separar a los mismos en dos o más grupos para posteriormente
poder clasificar nuevos casos de individuos como pertenecientes a un grupo u otro, desde la
medicina para saber si un medicamento va a ser beneficioso para cierto paciente dadas sus características
físicas e historial clínico, a la educación para saber si cierto alumno va a ser capaz de aprobar una
asignatura determinada dado su historial académico. Tradicionalmente esta discriminación en grupos
se ha hecho en base a la experiencia u otros criterios poco fiables y sin ninguna razón de peso, por
ello se han desarrollado técnicas estadísticas de Análisis discriminante que permiten detectar qué
variables son realmente relevantes para la discriminación de los grupos y en qué medida. Sin embargo,
a la hora de la práctica, existen muchas situaciones en las cuales el número de variables de los
individuos es incluso superior al número de individuos, en estas condiciones los métodos tradicionales
de análisis discriminante no son capaces de realizar buenas predicciones de clase puesto que tienen
demasiadas variables explicativas. En estas situaciones son donde se pueden aplicar los métodos de
selección de variables que prescindirían de las variables inútiles que sólo generarían ruido y las variables
redundantes cuya información ya está explicada por otras variables del modelo, reduciendo así
el número de variables del modelo a sólo las imprescindibles y la complejidad del mismo para que los
métodos de análisis discriminante puedan realizar la separación eficientemente. En este trabajo de Fin
de Grado se explorarán las diversas técnicas de análisis discriminante y selección de variables y se
pondrán a prueba tanto teórica como prácticamente hasta encontrar los métodos que mejor funcionen
según diversos escenarios propuestos.
Palabras Clave
Estadística
Análisis discriminante
Sparsity
Random forest
Idioma
spa
Derechos
openAccess
Aparece en las colecciones
- Trabajos Fin de Grado UVa [29436]
Ficheros en el ítem
La licencia del ítem se describe como Attribution-NonCommercial-NoDerivatives 4.0 Internacional