2024-03-29T07:58:20Zhttp://uvadoc.uva.es/oai/requestoai:uvadoc.uva.es:10324/17542021-06-23T16:43:53Zcom_10324_30605com_10324_894col_10324_41
Rivas Sanz, Javier de las
Mayo Iscar, Agustín
Fernández Martínez, Itziar
Universidad de Valladolid. Facultad de Ciencias
2012-11-07T09:25:17Z
2012-11-12T12:39:53Z
2012
http://uvadoc.uva.es/handle/10324/1754
b1646656
10.35376/10324/1754
En esta Tesis proponemos la utilización de métodos estadísticos basados en recortes imparciales que, aplicados
a matrices de datos de expresión génica de alta dimensionalidad, permiten obtener estimadores con
funcionamiento robusto mediante la eliminación de un porcentaje de individuos.
La aplicación de este tipo de estrategias nos va a permitir caracterizar el nivel de expresión típico de cada gen
en medidas de escala genómica (genome-wide) como el que aparece asociado al comportamiento de una
mayoría de condiciones, utilizando una adaptación del estimador smart a una situación unidimensional.
Nuestra aproximación plantea utilizar como procedimiento de recorte de partida el estimador MCD , lo que
permite obtener una representación simplificada para el estimador smart y la obtención de un algoritmo más
eficiente que el disponible actualmente. La estimación de los parámetros que describen el comportamiento
típico de un gen, va a permitir identificar mejor condiciones que manifiestan expresión diferencial y nuevas
definiciones para caracterizar genes que muestran comportamientos de expresión generalizada (tipo gen
housekeeping). El estimador propuesto será la base de estadísticos para identificar comportamientos atípicos
en muestras clasificadas inicialmente como homogéneas, y también para contrastar expresión diferencial entre
condiciones diferentes.
Basado en los mismos principios, proponemos la utilización de metodología para encontrar grupos de genes
(clústers) que co-expresan y para encontrar agrupaciones conjuntas de genes y de condiciones que comparten
patrones de co-expresión. Los procedimientos de agrupación propuestos incorporan el recorte de un
porcentaje de genes y de condiciones para aumentar la robustez de la clasificación propuesta.
Para todos los procedimientos propuestos se han desarrollado funciones, algoritmos y programas de R que los
implementan. El funcionamiento de los métodos se ha ilustrado utilizando datos simulados y sobre todo
utilizando varios conjuntos de datos reales correspondientes a experimentos y estudios biológicos con
microarrays de oligonucleótidos de alta densidad, que es una de las tecnologías genómicas de gran escala más
utilizadas para el estudio de la expresión génica.
Departamento de Estadística e Investigación Operativa
2012-11-08
application/pdf
spa
info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-nd/3.0/es/
Attribution-NonCommercial-NoDerivs 3.0 Unported
Estadística
Desarrollo y aplicación de métodos estadísticos basados en recortes imparciales a datos de expresión génica de alta dimensionalidad
info:eu-repo/semantics/doctoralThesis