Por favor, use este identificador para citar o enlazar este ítem:https://uvadoc.uva.es/handle/10324/74159
Título
Cálculo variacional en el espacio de Wasserstein
Autor
Director o Tutor
Año del Documento
2024
Titulación
Máster en Matemáticas
Zusammenfassung
Numerosas aplicaciones recientes en análisis de datos se basan en la consideración del conjunto de observaciones como una realización con ruido de una medida de probabilidad. En este contexto es habitual el uso de
métodos en los que se compara esta probabilidad observada con los elementos de una familia de distribuciones,
buscando la que mejor se ajusta en el sentido de minimizar una distancia o divergencia. La métrica de Wasserstein, asociada el problema de transporte óptimo, es una de las opciones más estudiadas en tiempos recientes,
por sus buenas propiedades de adaptación a la geometría de los datos [1]. Esto justifica el interés de estudiar los
problemas de minimización de distancias de Wasserstein respecto a familias de probabilidades. En la práctica
esta minimización requiere el desarrollo de algoritmos de tipo descenso de gradiente en el espacio de Wasserstein, lo que resulta factible gracias a su estructura pseudo-Riemanniana (ver [2]). En algunos casos el paso de
gradiente se puede implementar de forma explícita (familias univariantes, familias elípticas, ver [3]). En otros
casos es necesario recurrir a algún tipo de discretización. En este Trabajo de Fin de Máster se estudiarán las dos
formas principales de discretización: Euleriana (discretización del espacio de referencia en celdas fijas y cuantización correspondiente de las probabilidades) o Lagrangiana (aproximación de las probabilidades mediante
versiones empíricas). Se analizará las ventajas e inconvenientes de las dos aproximaciones en problemas de alta
dimensión y se prestará atención a las posibles ganancias computacionales asociadas a la paralelización masiva
de cálculos. Many recent applications in data analysis are based on considering the set of observations as a noisy realisation of a probability measure. In this context it is common to use methods in which this observed probability
is compared with the elements of a family of distributions, looking for the best fit in the sense of minimising
a distance or divergence. The Wasserstein metric, associated with the optimal transport problem, is one of the
most studied options in recent times, due to its good properties of adaptation to the geometry of the data [1].
This justifies the interest in studying Wasserstein distance minimisation problems with respect to probability
families. In practice this minimisation requires the development of gradient descent type algorithms in Wasserstein space, which is feasible thanks to its pseudo-Riemannian structure (see [2]). In some cases the gradient
step can be implemented explicitly (univariate families, elliptic families, see [3]). In other cases it is necessary
to resort to some kind of discretisation. In this Master Thesis we will study the two main forms of discretisation: Eulerian (discretisation of the reference space into fixed cells and corresponding quantization of the
probabilities) or Lagrangian (approximation of the probabilities by empirical versions). The advantages and
disadvantages of the two approaches in high-dimensional problems will be analysed and attention will be paid
to the possible computational gains associated with the massive parallelisation of computations.
Palabras Clave
Transporte óptimo
Regularización entrópica
Algoritmo de Sinkhorn
Espacio de Wasserstein
Departamento
Departamento de Estadística e Investigación Operativa
Idioma
spa
Derechos
openAccess
Aparece en las colecciones
- Trabajos Fin de Máster UVa [7002]
Dateien zu dieser Ressource
