Show simple item record

dc.contributor.authorAlonso Pascual, Sergio
dc.contributor.authorGonzález Escribano, Arturo 
dc.date.accessioned2025-05-16T11:39:58Z
dc.date.available2025-05-16T11:39:58Z
dc.date.issued2024
dc.identifier.citationXXXIV Jornadas de Paralelismo (JP2024), Jornadas SARTECO, A Coruña, 17-19 de Junio de 2024, p. 181-188es
dc.identifier.isbn978-84-09-61749-4es
dc.identifier.urihttps://uvadoc.uva.es/handle/10324/75765
dc.descriptionProducción Científicaes
dc.description.abstractLos sistemas paralelos actuales son cada vez más heterogéneos, con dispositivos de diferentes tipos y capacidades de cómputo. Explotar múltiples dispositivos diferentes para una misma aplicación sigue siendo un reto donde intervienen desde problemas técnicos relacionados con sincronizar y comunicar diferentes dispositivos hasta problemas de reparto de carga y flexibilidad para ajustar el cómputo a los recursos de la plataforma. En este trabajo estudiamos la programación y adaptación a plataformas heterogéneas de HSOpticalFlow, una aplicación de streaming orientada a estimar el movimiento aparente de objetos en una secuencia de imágenes. Partiendo del código original en CUDA, presentamos la metodologı́a para implementarlo en forma de pipeline entre múltiples dispositivos utilizando el modelo de programación Controller, y para introducir un mecanismo de reparto de carga que permite el ajuste cuando las capacidades de cómputo son distintas. Esto permite no solo construir soluciones paralelas muy eficientes entre dispositivos similares, sino también aprovechar dispositivos de poca capacidad de cómputo para aliviar la carga y aumentar la productividad de dispositivos mucho más potentes. Presentamos resultados de un estudio experimental utilizando varias GPUs de NVIDIA de diferentes arquitecturas y generaciones que muestran que nuestra solución permite explotar de forma combinada varios dispositivos para reducir los tiempos de ejecución y conseguir un mejor ratio de fotogramas por segundo. En concreto, los resultados muestran aceleraciones de 2x utilizando dos GPUs NVIDIA V100 y hasta 1,37x con una GPU NVIDIA A100 y tres GPUs Titan Black, que son aproximadamente 8 veces más lentas para esta aplicación.es
dc.format.extent8 p.es
dc.format.mimetypeapplication/pdfes
dc.language.isospaes
dc.publisherJornadas SARTECOes
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses
dc.subjectInformáticaes
dc.subject.classificationProgramación heterogénea, Streaming, Equilibrio de carga, Flujo ópticoes
dc.titleProgramación de múltiples dispositivos heterogéneos: El caso de Optical Flowes
dc.typeinfo:eu-repo/semantics/conferenceObjectes
dc.title.eventXXXIV Jornadas de Paralelismo (JP2024), Jornadas SARTECOes
dc.description.projectEl presente trabajo es parte de la actuación PID2022-142292NB-I00 (Proyecto de Generación de Conocimiento 2022), financiada por MICIU/AEI /10.13039/501100011033 y por FEDER, UE. También se ha recibido el soporte del Programa Investigo del Servicio Público de Empleo Estatal, Convocato ria para la Contratación de Personal Investigador, financiado por la Unión Europea-NextGenerationEU. Las plataformas de experimentación han sido financiadas parcialmente por el programa NVIDIA Aca demic Hardware Grant Program.es
dc.type.hasVersioninfo:eu-repo/semantics/submittedVersiones
dc.subject.unesco1203 Ciencia de Los Ordenadoreses
dc.subject.unesco3304 Tecnología de Los Ordenadoreses


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record