RT info:eu-repo/semantics/bachelorThesis T1 Solapamiento transparente de tareas de comunicación y computación en dispositivos GPU CUDA A1 Taboada Rodero, Ismael José A2 Universidad de Valladolid. Escuela Técnica Superior de Ingeniería Informática K1 Computación de alto rendimiento (HPC) K1 Tecnología CUDA K1 Arquitectura GPU AB La computación paralela ha adquirido importancia significativa en diversos campos de la ciencia y latecnología, presente en el incremento de trabajos de investigación donde se consigue mejorar el rendimientodel uso de los recursos de los diferentes dispositivos de un sistema. Estos trabajos son, como ejemplo, elentrenamiento de grandes redes neuronales dedicadas al aprendizaje profundo, las simulaciones de fluidosque exigen cada vez más precisión, o la creciente tendencia de uso de algoritmos paralelos para el minadode cripto-monedas.Actualmente, la programación paralela basa sus soluciones sobre todos los tipos de hardware existentes.La construcción de granjas de computación –como las presentes en la lista TOP 500–, la fabricación deunidades de proceso cada vez con mayor número de núcleos, el uso de unidades de computo gráfico –tambiénconocidas como GPU– para cálculos genéricos (General-Purpose Computing on Graphics Processing Unitsó GP-GPU) o el diseño de nuevos co-procesadores como Xeon Phi, muestran el amplio abanico de máquinasy dispositivos donde se realizan las ejecuciones de dichos programas.En particular, la diversidad de dispositivos GPU (compatibles con la computación de propósito general)hace que se deba implementar soluciones específicas pensando en los dispositivos donde va a ser ejecutadas.La programación de estos dispositivos necesita de unos conocimientos de alto nivel sobre la arquitectura ylas librerías de desarrollo de cada dispositivo, las cuales se renuevan cada poco tiempo. Esta dificultadaumenta cuando se pretende explotar, de forma eficiente, los diferentes recursos hardware de un dispositivo.Este trabajo propone un modelo de programación que permite el solapamiento de operaciones decomunicación y computación en dispositivos GPU mejorando el rendimiento de las aplicaciones. Nuestroestudio experimental muestra que este modelo oculta, de forma automática y transparente para el usuario,el solapamiento de estas operaciones ahorrando esfuerzo de desarrollo al usuario. Con este modelo seobtiene hasta un 50% de mejora de rendimiento comparado con una implementación puramente secuencial. YR 2018 FD 2018 LK http://uvadoc.uva.es/handle/10324/33256 UL http://uvadoc.uva.es/handle/10324/33256 LA spa DS UVaDOC RD 25-abr-2024