• español
  • English
  • français
  • Deutsch
  • português (Brasil)
  • italiano
    • español
    • English
    • français
    • Deutsch
    • português (Brasil)
    • italiano
    • español
    • English
    • français
    • Deutsch
    • português (Brasil)
    • italiano
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    Listar

    Todo UVaDOCComunidadesPor fecha de publicaciónAutoresMateriasTítulos

    Mi cuenta

    Acceder

    Estadísticas

    Ver Estadísticas de uso

    Compartir

    Ver ítem 
    •   UVaDOC Principal
    • PRODUCCIÓN CIENTÍFICA
    • Departamentos
    • Dpto. Informática (Arquitectura y Tecnología de Computadores, Ciencias de la Computación e Inteligencia ...)
    • DEP41 - Artículos de revista
    • Ver ítem
    •   UVaDOC Principal
    • PRODUCCIÓN CIENTÍFICA
    • Departamentos
    • Dpto. Informática (Arquitectura y Tecnología de Computadores, Ciencias de la Computación e Inteligencia ...)
    • DEP41 - Artículos de revista
    • Ver ítem
    • español
    • English
    • français
    • Deutsch
    • português (Brasil)
    • italiano

    Exportar

    RISMendeleyRefworksZotero
    • edm
    • marc
    • xoai
    • qdc
    • ore
    • ese
    • dim
    • uketd_dc
    • oai_dc
    • etdms
    • rdf
    • mods
    • mets
    • didl
    • premis

    Citas

    Por favor, use este identificador para citar o enlazar este ítem:https://uvadoc.uva.es/handle/10324/74462

    Título
    Auto-tuned nested parallelism: A way to reduce the execution time of scientific software in NUMA systems
    Autor
    Cámara Moreno, JesúsAutoridad UVA Orcid
    Cuenca, Javier
    García, Luis Pedro
    Giménez, Domingo
    Año del Documento
    2014
    Editorial
    Elsevier
    Descripción
    Producción Científica
    Documento Fuente
    Parallel Computing, 2014, Volume 40, Issue 7, Pages 309-327
    Resumen
    The most computationally demanding scientific problems are solved with large parallel systems. In some cases these systems are Non-Uniform Memory Access (NUMA) multiprocessors made up of a large number of cores which share a hierarchically organized memory. The main basic component of these scientific codes is often matrix multiplication, and the efficient development of other linear algebra packages is directly based on the matrix multiplication routine implemented in the BLAS library. BLAS library is used in the form of packages implemented by the vendors or free implementations. The latest versions of this library are multithreaded and can be used efficiently in multicore systems, but when they are used inside parallel codes, the two parallelism levels can interfere and produce a degradation of the performance. In this work, an auto-tuning method is proposed to select automatically the optimum number of threads to use at each parallel level when multithreaded linear algebra routines are called from OpenMP parallel codes. The method is based on a simple but effective theoretical model of the execution time of the two-level routines. The methodology is applied to a two-level matrix–matrix multiplication and to different matrix factorizations (LU, QR and Cholesky) by blocks. Traditional schemes which directly use the multithreaded routine of BLAS, dgemm, are compared with schemes combining the multithreaded dgemm with OpenMP.
    Materias (normalizadas)
    Computación Paralela
    Auto-Tuning
    Materias Unesco
    1203 Ciencia de Los Ordenadores
    3304 Tecnología de Los Ordenadores
    Palabras Clave
    Auto-tuning
    Linear Algebra
    Performance Modeling
    ISSN
    0167-8191
    Revisión por pares
    SI
    DOI
    10.1016/j.parco.2014.03.011
    Patrocinador
    Este trabajo forma parte del proyecto de investigación TIN2012-38341-C04-03 financiado por el Ministerio de Economía (MINECO)
    Version del Editor
    https://www.sciencedirect.com/science/article/abs/pii/S0167819114000416
    Propietario de los Derechos
    Elsevier B.V.
    Idioma
    eng
    URI
    https://uvadoc.uva.es/handle/10324/74462
    Tipo de versión
    info:eu-repo/semantics/publishedVersion
    Derechos
    restrictedAccess
    Aparece en las colecciones
    • DEP41 - Artículos de revista [109]
    Mostrar el registro completo del ítem
    Ficheros en el ítem
    Nombre:
    Autotuned_Nested_Parallelism_PC_2014.pdf
    Tamaño:
    668.1Kb
    Formato:
    Adobe PDF
    Thumbnail
    Visualizar/Abrir

    Universidad de Valladolid

    Powered by MIT's. DSpace software, Version 5.10