Optimizing an APSP implementation for NVIDIA GPUs using kernel characterization criteria

Ortega Arranz, Héctor; Torres de la Sierra, Yuri; González Escribano, Arturo; Llanos Ferraris, Diego Rafael

doi:10.1007/s11227-014-1212-z

Título

Optimizing an APSP implementation for NVIDIA GPUs using kernel characterization criteria

dc.contributor.author	Ortega Arranz, Héctor
dc.contributor.author	Torres de la Sierra, Yuri
dc.contributor.author	González Escribano, Arturo
dc.contributor.author	Llanos Ferraris, Diego Rafael
dc.date.accessioned	2024-10-04T08:02:26Z
dc.date.available	2024-10-04T08:02:26Z
dc.date.issued	2014
dc.identifier.citation	The Journal of Supercomputing, Vol. 70, Issue 2, November 2014, pags. 786-798, ISSN 0920-8542	es
dc.identifier.issn	0920-8542	es
dc.identifier.uri	https://uvadoc.uva.es/handle/10324/70416
dc.description	Producción Científica	es
dc.description.abstract	During the last years, GPU manycore devices have demonstrated their usefulness to accelerate computationally intensive problems. Although arriving at a parallelization of a highly parallel algorithm is an affordable task, the optimization of GPU codes is a challenging activity. The main reason for this is the number of parameters, programming choices, and tuning techniques available, many of them related with complex and sometimes hidden architecture details. A useful strategy to systematically attack these optimization problems is to characterize the different kernels of the application, and use this knowledge to select appropriate configuration parameters. The All-Pair Shortest-Path (APSP) problem is a well-known problem in graph theory whose objective is to find the shortest paths between any pairs of nodes in a graph. This problem can be solved by highly parallel and computational intensive tasks, being a good candidate to be exploited by manycore devices. In this paper, we use kernel characterization criteria to optimize an APSP algorithm implementation for NVIDIA GPUs. Our experimental results show that the combined use of proper configuration policies, and the concurrent kernels capability of new CUDA architectures, leads to a performance improvement of up to 62 % with respect to one of the possible configurations recommended by CUDA, considered as baseline.	es
dc.format.mimetype	application/pdf	es
dc.language.iso	eng	es
dc.publisher	Springer	es
dc.rights.accessRights	info:eu-repo/semantics/openAccess	es
dc.subject	Informática	es
dc.subject.classification	APSP	es
dc.subject.classification	Cache configuration	es
dc.subject.classification	Concurrent kernel	es
dc.subject.classification	GPU	es
dc.subject.classification	Kernel characterization	es
dc.subject.classification	Threadblock size	es
dc.title	Optimizing an APSP implementation for NVIDIA GPUs using kernel characterization criteria	es
dc.type	info:eu-repo/semantics/article	es
dc.identifier.doi	10.1007/s11227-014-1212-z	es
dc.relation.publisherversion	https://link.springer.com/article/10.1007/s11227-014-1212-z	es
dc.identifier.publicationfirstpage	786	es
dc.identifier.publicationissue	2	es
dc.identifier.publicationlastpage	798	es
dc.identifier.publicationtitle	The Journal of Supercomputing	es
dc.identifier.publicationvolume	70	es
dc.peerreviewed	SI	es
dc.description.project	This research has been partially supported by Ministerio de Economía y Competitividad (Spain) and ERDF program of the European Union: CAPAP-H4 network (TIN2011-15734-E), MOGECOPP project (TIN2011-25639); and Junta de Castilla y León (Spain) ATLAS project (VA172A12-2).	es
dc.identifier.essn	1573-0484	es
dc.type.hasVersion	info:eu-repo/semantics/publishedVersion	es
dc.subject.unesco	1203 Ciencia de Los Ordenadores	es
dc.subject.unesco	3304 Tecnología de Los Ordenadores	es

Ficheros en el ítem

Nombre:: s11227-014-1212-z.pdf
Tamaño:: 198.8Kb
Formato:: PDF

Visualizar/Abrir

Este ítem aparece en la(s) siguiente(s) colección(ones)

DEP41 - Artículos de revista [139]

Mostrar el registro sencillo del ítem