dc.contributor.author | Alonso Pascual, Sergio | |
dc.contributor.author | González Escribano, Arturo | |
dc.date.accessioned | 2025-05-16T11:39:58Z | |
dc.date.available | 2025-05-16T11:39:58Z | |
dc.date.issued | 2024 | |
dc.identifier.citation | XXXIV Jornadas de Paralelismo (JP2024), Jornadas SARTECO, A Coruña, 17-19 de Junio de 2024, p. 181-188 | es |
dc.identifier.isbn | 978-84-09-61749-4 | es |
dc.identifier.uri | https://uvadoc.uva.es/handle/10324/75765 | |
dc.description | Producción Científica | es |
dc.description.abstract | Los sistemas paralelos actuales son cada vez más heterogéneos, con dispositivos de diferentes tipos y capacidades de cómputo. Explotar múltiples dispositivos diferentes para una misma aplicación sigue siendo un reto donde intervienen desde problemas técnicos relacionados con sincronizar y comunicar diferentes dispositivos hasta problemas de reparto de carga y flexibilidad para ajustar el cómputo a los recursos de la plataforma. En este trabajo estudiamos la programación y adaptación a plataformas heterogéneas de HSOpticalFlow, una aplicación de streaming orientada a estimar el movimiento aparente de objetos en una secuencia de imágenes. Partiendo del código original en CUDA, presentamos la metodologı́a para implementarlo en forma de pipeline entre múltiples dispositivos utilizando el modelo de programación Controller, y para introducir un mecanismo de reparto de carga que permite el ajuste cuando las
capacidades de cómputo son distintas. Esto permite no solo construir soluciones paralelas muy eficientes
entre dispositivos similares, sino también aprovechar dispositivos de poca capacidad de cómputo para aliviar la carga y aumentar la productividad de dispositivos mucho más potentes. Presentamos resultados de un estudio experimental utilizando varias GPUs de NVIDIA de diferentes arquitecturas y generaciones que muestran que nuestra solución permite explotar de forma combinada varios dispositivos para reducir los tiempos de ejecución y conseguir un mejor ratio de fotogramas por segundo. En concreto, los resultados muestran aceleraciones de 2x utilizando dos GPUs NVIDIA V100 y hasta 1,37x con una GPU NVIDIA
A100 y tres GPUs Titan Black, que son aproximadamente 8 veces más lentas para esta aplicación. | es |
dc.format.extent | 8 p. | es |
dc.format.mimetype | application/pdf | es |
dc.language.iso | spa | es |
dc.publisher | Jornadas SARTECO | es |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | es |
dc.subject | Informática | es |
dc.subject.classification | Programación heterogénea, Streaming, Equilibrio de carga, Flujo óptico | es |
dc.title | Programación de múltiples dispositivos heterogéneos: El caso de Optical Flow | es |
dc.type | info:eu-repo/semantics/conferenceObject | es |
dc.title.event | XXXIV Jornadas de Paralelismo (JP2024), Jornadas SARTECO | es |
dc.description.project | El presente trabajo es parte de la actuación PID2022-142292NB-I00 (Proyecto de Generación de Conocimiento 2022), financiada por MICIU/AEI /10.13039/501100011033 y por FEDER, UE. También se ha recibido el soporte del Programa Investigo del Servicio Público de Empleo Estatal, Convocato ria para la Contratación de Personal Investigador, financiado por la Unión Europea-NextGenerationEU. Las plataformas de experimentación han sido financiadas parcialmente por el programa NVIDIA Aca demic Hardware Grant Program. | es |
dc.type.hasVersion | info:eu-repo/semantics/submittedVersion | es |
dc.subject.unesco | 1203 Ciencia de Los Ordenadores | es |
dc.subject.unesco | 3304 Tecnología de Los Ordenadores | es |