<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="static/style.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2026-04-27T21:28:12Z</responseDate><request verb="GetRecord" identifier="oai:uvadoc.uva.es:10324/77921" metadataPrefix="rdf">https://uvadoc.uva.es/oai/request</request><GetRecord><record><header><identifier>oai:uvadoc.uva.es:10324/77921</identifier><datestamp>2025-09-19T19:04:35Z</datestamp><setSpec>com_10324_38</setSpec><setSpec>col_10324_852</setSpec></header><metadata><rdf:RDF xmlns:rdf="http://www.openarchives.org/OAI/2.0/rdf/" xmlns:doc="http://www.lyncode.com/xoai" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:ds="http://dspace.org/ds/elements/1.1/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:ow="http://www.ontoweb.org/ontology/1#" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/rdf/ http://www.openarchives.org/OAI/2.0/rdf.xsd">
<ow:Publication rdf:about="oai:uvadoc.uva.es:10324/77921">
<dc:title>Técnicas para la corrección del desplazamiento de covarianzas en clasificación supervisada</dc:title>
<dc:creator>Ramos Jimeno, Javier</dc:creator>
<dc:contributor>Segovia Martín, José Ignacio</dc:contributor>
<dc:contributor>Universidad de Valladolid. Facultad de Ciencias</dc:contributor>
<dc:description>En los métodos de aprendizaje supervisado se suele asumir que la distribución de los datos&#xd;
de entrenamiento y test son iguales lo que permite simplificar el desarrollo de los modelos. Sin&#xd;
embargo, en muchas ocasiones esto no es cierto, lo que puede llevar a malos resultados. Por&#xd;
este motivo, se han desarrollado metodologías que permiten adaptarse a estos cambios en las&#xd;
distribuciones.&#xd;
En concreto, este trabajo se centra en el covariate shift donde las distribuciones marginales de&#xd;
las instancias son distintas pero las condicionales respecto de las etiquetas permanecen constantes. Para adaptarse al covariate shift se utiliza un peso, al que se denomina importancia, que&#xd;
se aplica a las muestras de entrenamiento para intentar corregir la diferencia entre las distribuciones. De forma que, el valor del peso dependerá, únicamente, de cómo de probable es que&#xd;
una muestra de entrenamiento pueda aparecer dentro del conjunto de test. El problema es que&#xd;
para calcularlo de manera exacta es necesario conocer las distribuciones de los datos, lo que en&#xd;
la práctica, no es posible.&#xd;
Por este motivo, existen diferentes métodos que permiten estimar la importancia. En este&#xd;
trabajo se profundiza en algunos de los métodos del estado del arte para hacer esta estimación&#xd;
como son KDE, obtención de los pesos usando regresión logística, KMM, KLIEP, LSIF o uLSIF.&#xd;
Además, también se han implementado todos en Python y con ellos se han realizado multitud&#xd;
de experimentos usando datos sintéticos.</dc:description>
<dc:description>In supervised learning methods, it is usually assumed that the distribution of the training and&#xd;
test data is the same, which simplifies the development of models. However, in many cases this&#xd;
is not true, which can lead to bad results. For this reason, methodologies have been developed&#xd;
to adapt to these changes in the distributions.&#xd;
Specifically, this work focuses on covariate shift, where the marginal distributions of the instances are different but the conditional distributions regarding the labels remain constant. To&#xd;
adapt to covariate shift, a weight, known as importance, is applied to the training samples to try&#xd;
to correct the difference between the distributions. The value of the weight will depend only on&#xd;
how likely it is that a training sample could appear in the test set. The problem is that, to calculate&#xd;
it exactly, it is necessary to know the data distributions, which in practice is not possible.&#xd;
For this reason, there are different methods to estimate importance. In this work, some stateof-the-art methods to make this estimation, such as KDE, obtaining weights using logistic regression, KMM, KLIEP, LSIF, and uLSIF are discussed in detail. In addition, all of them have been&#xd;
implemented in Python, and several experiments have been carried out using synthetic data.</dc:description>
<dc:date>2025-09-19T06:23:20Z</dc:date>
<dc:date>2025-09-19T06:23:20Z</dc:date>
<dc:date>2025</dc:date>
<dc:type>info:eu-repo/semantics/bachelorThesis</dc:type>
<dc:identifier>https://uvadoc.uva.es/handle/10324/77921</dc:identifier>
<dc:language>spa</dc:language>
<dc:rights>info:eu-repo/semantics/openAccess</dc:rights>
<dc:rights>http://creativecommons.org/licenses/by-nc-nd/4.0/</dc:rights>
<dc:rights>Attribution-NonCommercial-NoDerivatives 4.0 Internacional</dc:rights>
</ow:Publication>
</rdf:RDF></metadata></record></GetRecord></OAI-PMH>