RT info:eu-repo/semantics/bachelorThesis T1 Métodos de selección de variables en clustering y análisis discriminante A1 Calvo Magaz, Luis Miguel A2 Universidad de Valladolid. Facultad de Ciencias K1 Estadística K1 Análisis discriminante K1 Sparsity K1 Random forest AB Hoy en día es muy común en cualquier disciplina el querer identificar las características de unconjunto de individuos que permita diferenciar y separar a los mismos en dos o más grupos para posteriormentepoder clasificar nuevos casos de individuos como pertenecientes a un grupo u otro, desde lamedicina para saber si un medicamento va a ser beneficioso para cierto paciente dadas sus característicasfísicas e historial clínico, a la educación para saber si cierto alumno va a ser capaz de aprobar unaasignatura determinada dado su historial académico. Tradicionalmente esta discriminación en gruposse ha hecho en base a la experiencia u otros criterios poco fiables y sin ninguna razón de peso, porello se han desarrollado técnicas estadísticas de Análisis discriminante que permiten detectar quévariables son realmente relevantes para la discriminación de los grupos y en qué medida. Sin embargo,a la hora de la práctica, existen muchas situaciones en las cuales el número de variables de losindividuos es incluso superior al número de individuos, en estas condiciones los métodos tradicionalesde análisis discriminante no son capaces de realizar buenas predicciones de clase puesto que tienendemasiadas variables explicativas. En estas situaciones son donde se pueden aplicar los métodos deselección de variables que prescindirían de las variables inútiles que sólo generarían ruido y las variablesredundantes cuya información ya está explicada por otras variables del modelo, reduciendo asíel número de variables del modelo a sólo las imprescindibles y la complejidad del mismo para que losmétodos de análisis discriminante puedan realizar la separación eficientemente. En este trabajo de Finde Grado se explorarán las diversas técnicas de análisis discriminante y selección de variables y sepondrán a prueba tanto teórica como prácticamente hasta encontrar los métodos que mejor funcionensegún diversos escenarios propuestos. YR 2019 FD 2019 LK http://uvadoc.uva.es/handle/10324/38298 UL http://uvadoc.uva.es/handle/10324/38298 LA spa DS UVaDOC RD 12-nov-2024