<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="static/style.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2026-05-05T20:25:19Z</responseDate><request verb="GetRecord" identifier="oai:uvadoc.uva.es:10324/77921" metadataPrefix="ese">https://uvadoc.uva.es/oai/request</request><GetRecord><record><header><identifier>oai:uvadoc.uva.es:10324/77921</identifier><datestamp>2025-09-19T19:04:35Z</datestamp><setSpec>com_10324_38</setSpec><setSpec>col_10324_852</setSpec></header><metadata><europeana:record xmlns:europeana="http://www.europeana.eu/schemas/ese/" xmlns:confman="org.dspace.core.ConfigurationManager" xmlns:doc="http://www.lyncode.com/xoai" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:dc="http://purl.org/dc/elements/1.1/" xsi:schemaLocation="http://www.europeana.eu/schemas/ese/ http://www.europeana.eu/schemas/ese/ESE-V3.4.xsd">
<dc:title>Técnicas para la corrección del desplazamiento de covarianzas en clasificación supervisada</dc:title>
<dc:creator>Ramos Jimeno, Javier</dc:creator>
<dc:contributor>Segovia Martín, José Ignacio</dc:contributor>
<dc:contributor>Universidad de Valladolid. Facultad de Ciencias</dc:contributor>
<dc:subject>Desplazamiento de covarianzas</dc:subject>
<dc:subject>Covariate Shift</dc:subject>
<dc:subject>Métodos de estimación de importancia</dc:subject>
<dc:description>En los métodos de aprendizaje supervisado se suele asumir que la distribución de los datos&#xd;
de entrenamiento y test son iguales lo que permite simplificar el desarrollo de los modelos. Sin&#xd;
embargo, en muchas ocasiones esto no es cierto, lo que puede llevar a malos resultados. Por&#xd;
este motivo, se han desarrollado metodologías que permiten adaptarse a estos cambios en las&#xd;
distribuciones.&#xd;
En concreto, este trabajo se centra en el covariate shift donde las distribuciones marginales de&#xd;
las instancias son distintas pero las condicionales respecto de las etiquetas permanecen constantes. Para adaptarse al covariate shift se utiliza un peso, al que se denomina importancia, que&#xd;
se aplica a las muestras de entrenamiento para intentar corregir la diferencia entre las distribuciones. De forma que, el valor del peso dependerá, únicamente, de cómo de probable es que&#xd;
una muestra de entrenamiento pueda aparecer dentro del conjunto de test. El problema es que&#xd;
para calcularlo de manera exacta es necesario conocer las distribuciones de los datos, lo que en&#xd;
la práctica, no es posible.&#xd;
Por este motivo, existen diferentes métodos que permiten estimar la importancia. En este&#xd;
trabajo se profundiza en algunos de los métodos del estado del arte para hacer esta estimación&#xd;
como son KDE, obtención de los pesos usando regresión logística, KMM, KLIEP, LSIF o uLSIF.&#xd;
Además, también se han implementado todos en Python y con ellos se han realizado multitud&#xd;
de experimentos usando datos sintéticos.</dc:description>
<dc:description>In supervised learning methods, it is usually assumed that the distribution of the training and&#xd;
test data is the same, which simplifies the development of models. However, in many cases this&#xd;
is not true, which can lead to bad results. For this reason, methodologies have been developed&#xd;
to adapt to these changes in the distributions.&#xd;
Specifically, this work focuses on covariate shift, where the marginal distributions of the instances are different but the conditional distributions regarding the labels remain constant. To&#xd;
adapt to covariate shift, a weight, known as importance, is applied to the training samples to try&#xd;
to correct the difference between the distributions. The value of the weight will depend only on&#xd;
how likely it is that a training sample could appear in the test set. The problem is that, to calculate&#xd;
it exactly, it is necessary to know the data distributions, which in practice is not possible.&#xd;
For this reason, there are different methods to estimate importance. In this work, some stateof-the-art methods to make this estimation, such as KDE, obtaining weights using logistic regression, KMM, KLIEP, LSIF, and uLSIF are discussed in detail. In addition, all of them have been&#xd;
implemented in Python, and several experiments have been carried out using synthetic data.</dc:description>
<dc:description>Departamento de Estadística e Investigación Operativa</dc:description>
<dc:description>Grado en Estadística</dc:description>
<dc:date>2025-09-19T06:23:20Z</dc:date>
<dc:date>2025-09-19T06:23:20Z</dc:date>
<dc:date>2025</dc:date>
<dc:type>info:eu-repo/semantics/bachelorThesis</dc:type>
<dc:identifier>https://uvadoc.uva.es/handle/10324/77921</dc:identifier>
<dc:language>spa</dc:language>
<dc:rights>Attribution-NonCommercial-NoDerivatives 4.0 Internacional</dc:rights>
<dc:rights>info:eu-repo/semantics/openAccess</dc:rights>
<dc:rights>http://creativecommons.org/licenses/by-nc-nd/4.0/</dc:rights>
<dc:format>application/pdf</dc:format>
<europeana:object>https://uvadoc.uva.es/bitstream/10324/77921/4/TFG-G7460.pdf.jpg</europeana:object>
<europeana:provider>Hispana</europeana:provider>
<europeana:type>TEXT</europeana:type>
<europeana:rights>http://creativecommons.org/licenses/by-nc-nd/4.0/</europeana:rights>
<europeana:dataProvider>UVaDOC. Repositorio Documental de la Universidad de Valladolid</europeana:dataProvider>
<europeana:isShownAt>https://uvadoc.uva.es/handle/10324/77921</europeana:isShownAt>
</europeana:record></metadata></record></GetRecord></OAI-PMH>