RT info:eu-repo/semantics/conferenceObject T1 Técnicas de implementación de Stencils en multi-GPU distribuidas A1 Ji Ye, Senmao A1 González Escribano, Arturo A1 Llanos Ferraris, Diego Rafael AB En el patrón de computación denominado stencil cada elemento de una estructura de datosde tipo array se actualiza iterativamente en función de los valores de sus vecinos. Entre otras aplicaciones, este patrón permite resolver numéricamente sistemas de ecuaciones en derivadas parciales, por lo que es de gran interés en el computo científico, creciendoincesantemente los requerimientos de tamaño de datos y carga computacional en problemas reales. La estructura de este patrón permite utilizar estrategias sencillas de paralelismo de datos, por lo que su paralelización, tanto en CPUs como en aceleradores es de gran interés. Sin embargo, la necesidad de sincronización y comunicación entre elementos de proceso deriva en problemas relacionados con la capacidad de distribuir la carga y explotar multiplesdispositivos simultaneamente. En este trabajo presentamos un repaso y actualización de técnicas de programación eficientes basadas en MPI y CUDA para explotar este patrón de computación en sistemas multi-GPU distribuidos. Nuestros resultados muestran cómo las técnicas utilizadas pueden aliviar los problemas de comunicación entre host y GPUs, obteniendo rendimientos y escalabilidad en función de las capacidades del sistema de interconexión entre nodos. PB Universidad de Málaga YR 2017 FD 2017 LK http://uvadoc.uva.es/handle/10324/29138 UL http://uvadoc.uva.es/handle/10324/29138 LA spa NO Jornadas SARTECO, XXVIII Jornadas de Paralelismo 2017, Málaga, septiembre 2017 NO Producción Científica DS UVaDOC RD 19-ene-2025