RT info:eu-repo/semantics/article
T1 OpenCLIPER: An OpenCL-Based C++ Framework for Overhead-Reduced Medical Image Processing and Reconstruction on Heterogeneous Devices
A1 Simmross Wattenberg, Federico Jesús
A1 Rodríguez Cayetano, Manuel
A1 Royuela-del-Val, Javier
A1 Martín González, Elena
A1 Moya Saez, Elisa
A1 Martín Fernández, Marcos Antonio
A1 Alberola López, Carlos
K1 Computación de alto rendimiento (HPC)
K1 C++
K1 GPU
K1 medical imaging
K1 OpenCL
K1 1203.17 Informática
K1 2209.90 Tratamiento Digital. Imágenes
AB Este artículo describe una infraestructura basada en OpenCL que permite implementar algoritmos de cálculo masivamente paralelizables. OpenCL es un entorno de programación (lenguaje y API) que permite aprovechar las capacidades de dispositivos con gran número de núcleos de cálculo, como las GPUs, para acelerar notablemente el cálculo de este tipo de algoritmos.Uno de los principales problemas de OpenCL es la complejidad de las tareas de preparación previas al cálculo propiamente dicho (selección del dispositivo que se va a usar y su inicialización, sincronización de los datos entre la CPU y el dispositivo de cálculo, etc.). Todas estas dificultades hacen más laborioso el uso de OpenCL de lo que sería deseable. Este artículo describe una infraestructura basada en OpenCL(OpenCLIPER) que es capaz de utilizar dispositivos de cálculo soportados por OpenCL de forma sencilla, lo que permite al desarrollador concentrarse en la implementación del algoritmo. Nuestra infraestructura se encarga automáticamente del descubrimiento de los dispositivos disponibles y su inicialización, transferencias de datos entre el sistema de ficheros, la CPU y el dispositivo de cálculo, y la carga y compilación de kernels (el código que implementa el algoritmo). Las estructuras de datos solamente tienen que ser definidas una vez, independientemente del dispositivo de cálculo, al igual que el código que las usa. Además, se usa memoria pinned (memoria accesible por la CPU asociada de forma fija a la memoria física) para los búferes de datos para lograr la máxima velocidad en las transferencias de estosentre la CPU y el dispositivo de cálculo escogido. Los algoritmos son implementados como operadores matemáticos con una entrada y una salida y parámetros opcionales, lo que permite encadenarlos fácilmente y de forma eficiente. Además, es posible separar las tareas de inicialización y ejecución del algoritmo, lo que conlleva mejores prestaciones al ser encadenados y/o usados en bucles.Toda la infraestructura ha sido probada en el desarrollo de algoritmos de procesamiento de imágenes, en concreto en el procesamiento de imágenes de resonancia magnética submuestreadas.
PB IEEE
SN 2168-2194
YR 2019
FD 2019
LK https://uvadoc.uva.es/handle/10324/65575
UL https://uvadoc.uva.es/handle/10324/65575
LA eng
NO IEEE Journal of Biomedical and Health Informatics. Julio 2019, vo. 23, n. 4, p 1702-1709.
NO Producción Científica
DS UVaDOC
RD 01-mar-2026