RT info:eu-repo/semantics/conferenceObject T1 Transferencias de datos asíncronas y transparentes en plataformas heterogéneas A1 Lara-Mongil, Víctor A1 Taboada-Romero, Ismael A1 Rodríguez Gutiez, Eduardo A1 Torres de la Sierra, Yuri A1 González Escribano, Arturo A1 Llanos Ferraris, Diego Rafael K1 Informática K1 Computación heterogénea K1 Sistemas en tiempo de ejecución K1 Ocultación de latencia K1 Ejecución asíncrona K1 1203 Ciencia de Los Ordenadores K1 3304 Tecnología de Los Ordenadores AB Los coprocesadores de alto rendimiento, como las Unidades de Procesamiento Gráfico (GPUs), presentan un ratio alto entre rendimiento y coste jun-to con un bajo consumo de energía. Por ello, los sistemas heterogéneos que los incluyen han experimentado un crecimiento significativo. Sin embargo, la programación de estos dispositivos sigue suponiendo un reto. Uno de los problemas está relacionado con la gestión de la memoria. Estos dispositivos tiene su propio espacio de memoria y es necesario realizar costosas transferencias de datos entre la máquina anfitriona y el dispositivo. En este trabajo proponemos una novedosa solución en tiempo de ejecución que analiza las dependencias de las diferentes transferencia de datos, ejecución de kernels y operaciones de host, solapándolas, en la medida de lo posible, de forma automática. Esta solución puede ocultar las latencias de forma transparente, mejorando significativamente el rendimiento de la aplicación. La técnica propuesta está implementada en el modelo de programación de Controllers para plataformas heterogéneas. Presentamos un estudio experimental que compara programas desarrollados utilizando nuestra solución con programas desarrollados con CUDA y OpenCL. Las versiones implementadas consideran tanto transferencias síncronas como asíncronas. El estudio muestra que la abstracción propuesta introduce un sobrecoste despreciable, mientras que mejora el tiempo de ejecución y reduce el esfuerzo de desarrollo del pro-grama, evitando el uso explícito de mecanismo de asincronía. Los resultados ofrecen hasta un 44.6% de reducción del tiempo de ejecución de una aplicación real de retransmisión de vídeo, debido al solapamiento de las transferencias de datos y la ejecución de los kernels. PB Servicio de Publicaciones de la Universidad de Extremadura SN 978-84-09-12127-4 YR 2019 FD 2019 LK https://uvadoc.uva.es/handle/10324/70909 UL https://uvadoc.uva.es/handle/10324/70909 LA spa NO XXX Jornadas de Paralelismo (JP 2019), Cáceres, España, 18 a 20 de septiembre de 2019 NO Producción Científica DS UVaDOC RD 22-nov-2024