RT info:eu-repo/semantics/doctoralThesis T1 Desarrollo y aplicación de métodos estadísticos basados en recortes imparciales a datos de expresión génica de alta dimensionalidad A1 Fernández Martínez, Itziar A2 Universidad de Valladolid. Facultad de Ciencias K1 Estadística AB En esta Tesis proponemos la utilización de métodos estadísticos basados en recortes imparciales que, aplicadosa matrices de datos de expresión génica de alta dimensionalidad, permiten obtener estimadores confuncionamiento robusto mediante la eliminación de un porcentaje de individuos.La aplicación de este tipo de estrategias nos va a permitir caracterizar el nivel de expresión típico de cada genen medidas de escala genómica (genome-wide) como el que aparece asociado al comportamiento de unamayoría de condiciones, utilizando una adaptación del estimador smart a una situación unidimensional.Nuestra aproximación plantea utilizar como procedimiento de recorte de partida el estimador MCD , lo quepermite obtener una representación simplificada para el estimador smart y la obtención de un algoritmo máseficiente que el disponible actualmente. La estimación de los parámetros que describen el comportamientotípico de un gen, va a permitir identificar mejor condiciones que manifiestan expresión diferencial y nuevasdefiniciones para caracterizar genes que muestran comportamientos de expresión generalizada (tipo genhousekeeping). El estimador propuesto será la base de estadísticos para identificar comportamientos atípicosen muestras clasificadas inicialmente como homogéneas, y también para contrastar expresión diferencial entrecondiciones diferentes.Basado en los mismos principios, proponemos la utilización de metodología para encontrar grupos de genes(clústers) que co-expresan y para encontrar agrupaciones conjuntas de genes y de condiciones que compartenpatrones de co-expresión. Los procedimientos de agrupación propuestos incorporan el recorte de unporcentaje de genes y de condiciones para aumentar la robustez de la clasificación propuesta.Para todos los procedimientos propuestos se han desarrollado funciones, algoritmos y programas de R que losimplementan. El funcionamiento de los métodos se ha ilustrado utilizando datos simulados y sobre todoutilizando varios conjuntos de datos reales correspondientes a experimentos y estudios biológicos conmicroarrays de oligonucleótidos de alta densidad, que es una de las tecnologías genómicas de gran escala másutilizadas para el estudio de la expresión génica. YR 2012 FD 2012 LK http://uvadoc.uva.es/handle/10324/1754 UL http://uvadoc.uva.es/handle/10324/1754 LA spa NO Departamento de Estadística e Investigación Operativa DS UVaDOC RD 24-abr-2024