Por favor, use este identificador para citar o enlazar este ítem:http://uvadoc.uva.es/handle/10324/1754
Título
Desarrollo y aplicación de métodos estadísticos basados en recortes imparciales a datos de expresión génica de alta dimensionalidad
Director o Tutor
Año del Documento
2012
Resumen
En esta Tesis proponemos la utilización de métodos estadísticos basados en recortes imparciales que, aplicados
a matrices de datos de expresión génica de alta dimensionalidad, permiten obtener estimadores con
funcionamiento robusto mediante la eliminación de un porcentaje de individuos.
La aplicación de este tipo de estrategias nos va a permitir caracterizar el nivel de expresión típico de cada gen
en medidas de escala genómica (genome-wide) como el que aparece asociado al comportamiento de una
mayoría de condiciones, utilizando una adaptación del estimador smart a una situación unidimensional.
Nuestra aproximación plantea utilizar como procedimiento de recorte de partida el estimador MCD , lo que
permite obtener una representación simplificada para el estimador smart y la obtención de un algoritmo más
eficiente que el disponible actualmente. La estimación de los parámetros que describen el comportamiento
típico de un gen, va a permitir identificar mejor condiciones que manifiestan expresión diferencial y nuevas
definiciones para caracterizar genes que muestran comportamientos de expresión generalizada (tipo gen
housekeeping). El estimador propuesto será la base de estadísticos para identificar comportamientos atípicos
en muestras clasificadas inicialmente como homogéneas, y también para contrastar expresión diferencial entre
condiciones diferentes.
Basado en los mismos principios, proponemos la utilización de metodología para encontrar grupos de genes
(clústers) que co-expresan y para encontrar agrupaciones conjuntas de genes y de condiciones que comparten
patrones de co-expresión. Los procedimientos de agrupación propuestos incorporan el recorte de un
porcentaje de genes y de condiciones para aumentar la robustez de la clasificación propuesta.
Para todos los procedimientos propuestos se han desarrollado funciones, algoritmos y programas de R que los
implementan. El funcionamiento de los métodos se ha ilustrado utilizando datos simulados y sobre todo
utilizando varios conjuntos de datos reales correspondientes a experimentos y estudios biológicos con
microarrays de oligonucleótidos de alta densidad, que es una de las tecnologías genómicas de gran escala más
utilizadas para el estudio de la expresión génica.
Materias (normalizadas)
Estadística
Departamento
Departamento de Estadística e Investigación Operativa
Idioma
spa
Derechos
openAccess
Aparece en las colecciones
- Tesis doctorales UVa [2322]
Ficheros en el ítem
La licencia del ítem se describe como Attribution-NonCommercial-NoDerivs 3.0 Unported