• español
  • English
  • français
  • Deutsch
  • português (Brasil)
  • italiano
    • español
    • English
    • français
    • Deutsch
    • português (Brasil)
    • italiano
    • español
    • English
    • français
    • Deutsch
    • português (Brasil)
    • italiano
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    Listar

    Todo UVaDOCComunidadesPor fecha de publicaciónAutoresMateriasTítulos

    Mi cuenta

    Acceder

    Estadísticas

    Ver Estadísticas de uso

    Compartir

    Ver ítem 
    •   UVaDOC Principal
    • PRODUCCIÓN CIENTÍFICA
    • Departamentos
    • Dpto. Informática (Arquitectura y Tecnología de Computadores, Ciencias de la Computación e Inteligencia ...)
    • DEP41 - Artículos de revista
    • Ver ítem
    •   UVaDOC Principal
    • PRODUCCIÓN CIENTÍFICA
    • Departamentos
    • Dpto. Informática (Arquitectura y Tecnología de Computadores, Ciencias de la Computación e Inteligencia ...)
    • DEP41 - Artículos de revista
    • Ver ítem
    • español
    • English
    • français
    • Deutsch
    • português (Brasil)
    • italiano

    Exportar

    RISMendeleyRefworksZotero
    • edm
    • marc
    • xoai
    • qdc
    • ore
    • ese
    • dim
    • uketd_dc
    • oai_dc
    • etdms
    • rdf
    • mods
    • mets
    • didl
    • premis

    Citas

    Por favor, use este identificador para citar o enlazar este ítem:https://uvadoc.uva.es/handle/10324/75227

    Título
    An autotuning approach to select the inter-GPU communication library on heterogeneous systems
    Autor
    Cámara Moreno, JesúsAutoridad UVA Orcid
    Cuenca, Javier
    Galindo, Víctor
    Vicente, Arturo
    Boratto, Murilo
    Año del Documento
    2024
    Editorial
    Springer
    Descripción
    Producción Científica
    Documento Fuente
    The Journal of Supercomputing, 2024, vol. 81, n. 1
    Resumen
    In this work, an automatic optimisation approach for parallel routines on multi-GPU systems is presented. Several inter-GPU communication libraries (such as CUDA- Aware MPI or NCCL) are used with a set of routines to perform the numerical oper- ations among the GPUs located on the compute nodes. The main objective is the selection of the most appropriate communication library, the number of GPUs to be used and the workload to be distributed among them in order to reduce the cost of data movements, which represent a large percentage of the total execution time. To this end, a hierarchical modelling of the execution time of each routine to be opti- mised is proposed, combining experimental and theoretical approaches. The results show that near-optimal decisions are taken in all the scenarios analysed.
    Materias Unesco
    1203.17 Informática
    Palabras Clave
    Autotuning
    Communication libraries
    Multi-GPU
    Heterogeneous computing
    ISSN
    0920-8542
    Revisión por pares
    SI
    DOI
    10.1007/s11227-024-06794-3
    Patrocinador
    Publicación en abierto financiada por el Consorcio de Bibliotecas Universitarias de Castilla y León (BUCLE), con cargo al Programa Operativo 2014ES16RFOP009 FEDER 2014-2020 DE CASTILLA Y LEÓN, Actuación:20007-CL - Apoyo Consorcio BUCLE
    This work is supported by Grant PID2022-136315OB-I00 and Grant PID2022-142292NB-I00, both funded by MCIN/AEI/10.13039/501100011033/ and by “ERDF A way of making Europe”, EU
    Version del Editor
    https://link.springer.com/article/10.1007/s11227-024-06794-3
    Propietario de los Derechos
    © 2024 The Author(s)
    Idioma
    eng
    URI
    https://uvadoc.uva.es/handle/10324/75227
    Tipo de versión
    info:eu-repo/semantics/publishedVersion
    Derechos
    openAccess
    Aparece en las colecciones
    • DEP41 - Artículos de revista [109]
    Mostrar el registro completo del ítem
    Ficheros en el ítem
    Nombre:
    An-autotuning-approach-select.pdf
    Tamaño:
    1.218Mb
    Formato:
    Adobe PDF
    Thumbnail
    Visualizar/Abrir
    Atribución 4.0 InternacionalLa licencia del ítem se describe como Atribución 4.0 Internacional

    Universidad de Valladolid

    Powered by MIT's. DSpace software, Version 5.10