Mostra i principali dati dell'item

dc.contributor.authorCerdeira-Pena, Ana
dc.contributor.authorde Bernardo, Guillermo
dc.contributor.authorFariña, Antonio
dc.contributor.authorFernández García, Javier David 
dc.contributor.authorMartínez Prieto, Miguel Angel 
dc.date.accessioned2026-01-21T13:05:30Z
dc.date.available2026-01-21T13:05:30Z
dc.date.issued2023
dc.identifier.citationKnowledge and Information Systems, 2024, vol. 66, n. 1. p. 381-417es
dc.identifier.issn0219-1377es
dc.identifier.urihttps://uvadoc.uva.es/handle/10324/81933
dc.descriptionProducción Científicaes
dc.description.abstractLa compresión y la consulta de RDF son temas consolidados en la Web de los Datos, donde existe una amplia variedad de soluciones que permiten almacenar y consultar de forma eficiente colecciones de datos estáticos. Sin embargo, los datos RDF evolucionan a lo largo del tiempo y esto hace necesario conservar diferentes versiones de los mismos, lo que se conoce como un archivo RDF. En el caso de archivos de gran tamaño, las técnicas básicas utilizadas para su almacenamiento presentan importantes problemas de escalabilidad. En este artículo se presenta v-RDF-SI, una de las primeras soluciones de archivado RDF cuyo objetivo es combinar tanto la compresión como la consulta eficiente. En v-RDF-SI se extienden representaciones RDF existentes basadas en estructuras de datos compactas, con el fin de proporcionar un soporte eficiente para consultas basadas en versiones en un espacio comprimido. Se presentan dos implementaciones de v-RDF-SI, denominadas v-RDFCSA y v-HDT, basadas, respectivamente, en RDFCSA (un autoíndice RDF) y en HDT (una representación RDF comprimida respaldada por el W3C). El artículo presenta una evaluación experimental exhaustiva de v-RDF-SI utilizando el benchmark BEAR, cuyos resultados muestran que v-RDF-SI reduce drásticamente los requisitos de almacenamiento, llegando a utilizar hasta 40 veces menos espacio que los baselines proporcionados por BEAR, consolidando representaciones que utilizan un cuarto del espacio requerido por las alternativas basadas en estructuras de datos compactas. Asimismo, v-RDF-SI ofrece tiempos de consulta significativamente más rápidos en la mayoría de los casos. En promedio, las variantes más rápidas de v-RDF-SI superan al resto de las alternativas estudiadas en casi un orden de magnitud.es
dc.description.abstractRDF compression and querying are consolidated topics in the Web of Data, with a plethora of solutions to efficiently store and query static datasets. However, as RDF data changes along time, it becomes necessary to keep different versions of RDF datasets, in what is called an RDF archive. For large RDF datasets, naive techniques to store these versions lead to significant scalability problems. In this paper, we present v-RDF-SI, one of the first RDF archiving solutions that aim at joining both compression and fast querying. In v-RDF-SI, we extend existing RDF representations based on compact data structures to provide efficient support of version-based queries in compressed space. We present two implementations of v-RDF-SI, named v-RDFCSA and v-HDT, based, respectively, on RDFCSA (an RDF self-index) and HDT (a W3C-supported compressed RDF representation). We experimentally evaluate v-RDF-SI over a public benchmark named BEAR, showing that v-RDF-SI drastically reduces space requirements, being up to 40 times smaller than the baselines provided by BEAR, and 4 times smaller than alternatives based on compact data structures, while yielding significantly faster query times in most cases. On average, the fastest variants of v-RDF-SI outperform the alternatives by almost an order of magnitude.es
dc.format.mimetypeapplication/pdfes
dc.language.isoenges
dc.publisherSpringeres
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/4.0/*
dc.subject.classificationRDFes
dc.subject.classificationArchivos RDFes
dc.subject.classificationCompresión RDFes
dc.subject.classificationAutoíndicees
dc.titleCompressed and queryable self-indexes for RDF archiveses
dc.typeinfo:eu-repo/semantics/articlees
dc.identifier.doi10.1007/S10115-023-01967-7es
dc.relation.publisherversionhttps://link.springer.com/article/10.1007/s10115-023-01967-7es
dc.identifier.publicationfirstpage381es
dc.identifier.publicationissue1es
dc.identifier.publicationlastpage417es
dc.identifier.publicationtitleKnowledge and Information Systemses
dc.identifier.publicationvolume66es
dc.peerreviewedSIes
dc.description.projectMICINN [Magist: PID2019-105221RB-C41; FLATCity-POC: PDC2021-121239-C31; SIGTRANS: PDC2021-120917-C21; EXTRA-Compact: PID2020-114635RB-I00; PID2019-105221RB-C41]es
dc.description.projectMCIU-AEI/FEDER-UE [BIZDEVOPS: RTI2018-098309-B-C32]es
dc.description.projectXunta de Galicia/FEDER-UE [ED431C 2021/53]es
dc.description.projectXunta de Galicia/Igape/IG240.2020.1.185es
dc.identifier.essn0219-3116es
dc.rightsAtribución-NoComercial-CompartirIgual 4.0 Internacional*
dc.type.hasVersioninfo:eu-repo/semantics/acceptedVersiones
dc.subject.unesco1203.18 Sistemas de Información, Diseño Componenteses
dc.subject.unesco1203.12 Bancos de Datoses
dc.subject.unesco1203.04 Inteligencia Artificiales


Files in questo item

Thumbnail

Questo item appare nelle seguenti collezioni

Mostra i principali dati dell'item