Por favor, use este identificador para citar o enlazar este ítem:https://uvadoc.uva.es/handle/10324/77873
Título
Evaluación de métodos de machine learning en la detección de genes circadianos
Autor
Director o Tutor
Año del Documento
2025
Titulación
Grado en Estadística
Resumen
Los ritmos circadianos en los seres vivos están controlados por un sistema interno de sincronización que regula la expresión génica en ciclos de aproximadamente 24 horas. Estos
ritmos son fundamentales para numerosos procesos fisiológicos, lo que otorga a su estudio
una gran relevancia en el ámbito biomédico actual. No obstante, el análisis de genes circadianos en humanos presenta importantes desafíos. Uno de los principales desafíos radica
en la imposibilidad de obtener muestras biológicas repetidas en distintos momentos del
día, dado que este procedimiento sería muy invasivo y difícilmente justificable éticamente. Por ello, muchos estudios recurren al uso de tejidos accesibles o datos postmortem, en
los que las muestras proceden de distintos individuos con características diferentes y el
momento exacto de extracción suele ser desconocido o incierto.
Ante estas limitaciones, es necesario recurrir a métodos que permitan estimar el orden
temporal relativo de las muestras como paso previo a la caracterización de los patrones
rítmicos en la expresión génica. En este contexto, este trabajo compara dos de las metodologías más utilizadas para esta tarea, CIRCUST y CYCLOPS, aplicadas a un conjunto
de datos de expresión génica en tejido muscular humano. A partir del orden temporal
estimado, se procede a caracterizar el ritmo de expresión de cada gen mediante el ajuste
de un modelo Cosinor, estimando parámetros como la amplitud, mesor y acrofase. Esta
caracterización permite clasificar los genes en rítmicos o no rítmicos. Posteriormente, se
evaluará la utilidad del orden estimado mediante la aplicación de diferentes algoritmos
supervisados de machine learning (ML), con el objetivo de predecir la ritmicidad génica
y comparar los resultados obtenidos en función del enfoque utilizado. Circadian rhythms in living organisms are governed by an internal synchronization system that regulates gene expression in cycles of approximately 24 hours. These rhythms
are essential for numerous physiological processes, making their study highly relevant in
contemporary biomedical research. However, the analysis of circadian gene expression in
humans poses significant challenges. A major limitation lies in the impossibility of collecting repeated biological samples from the same individuals at different times of day, as
this would be highly invasive and ethically difficult to justify. As a result, many studies
rely on accessible tissues or postmortem data, where samples are derived from different individuals with varying characteristics and the precise time of extraction is often unknown
or uncertain.
Given these limitations, it is necessary to employ methods that can estimate the relative
temporal ordering of samples as a preliminary step to characterizing rhythmic patterns in
gene expression. In this context, the present work compares two of the most widely used
methodologies for this task—CIRCUST and CYCLOPS—applied to a gene expression
dataset from human muscle tissue. Based on the estimated temporal order, the rhythmic
expression of each gene is characterized using a Cosinor model, from which parameters
such as amplitude, mesor, and acrophase are estimated. This characterization enables
the classification of genes as rhythmic or non-rhythmic. Subsequently, the utility of the
estimated temporal order is evaluated through the application of various supervised machine learning (ML) algorithms aimed at predicting gene rhythmicity and comparing the
results obtained under each methodological approach.
Palabras Clave
Ritmos circadianos
Machine learning
Estimación del orden temporal
Departamento
Departamento de Estadística e Investigación Operativa
Idioma
spa
Derechos
openAccess
Aparece en las colecciones
- Trabajos Fin de Grado UVa [31812]
Ficheros en el ítem
