RT info:eu-repo/semantics/article T1 RDF-TR: Exploiting structural redundancies to boost RDF compression A1 Hernández Illera, Antonio A1 Martínez Prieto, Miguel Angel A1 Fernández, Javier D. K1 Inteligencia artificial K1 RDF (Resource Description Framework) K1 K1 1203.18 Sistemas de Información, Diseño Componentes K1 1203.12 Bancos de Datos AB El número y el volumen de los datos semánticos han crecido de forma notable durante la última década, lo que ha convertido la compresión en una herramienta esencial para la preservación, el intercambio y la gestión de datos RDF. A diferencia de los compresores universales, las técnicas de compresión RDF son capaces de detectar y aprovechar redundancias específicas presentes en RDF. Así, estos compresores destacan por su capacidad para detectar y eliminar redundancias sintácticas y semánticas, es decir, repeticiones en el formato de serialización e información que puede inferirse de manera implícita. Sin embargo, se ha prestado poca atención a la existencia de patrones estructurales dentro de los conjuntos de datos RDF, esto es, a la redundancia estructural. En este trabajo analizamos las regularidades estructurales presentes en conjuntos de datos reales y presentamos tres fuentes de redundancia basadas en el esquema que subyace a la naturaleza flexible de RDF. A continuación, proponemos RDF-Tr (RDF Triples Reorganizer), una técnica de preprocesamiento que descubre y elimina este tipo de redundancia antes llevar a cabo el proceso de compresión, propiamente dicho. En particular, RDF-Tr agrupa sujetos que están descritos mediante los mismos predicados y recodifica localmente los objetos asociados a dichos predicados. Finalmente, integramos RDF-Tr con dos compresores RDF, HDT y k2-triples. Los experimentos realizados muestran que el uso de RDF-Tr junto con estos compresores mejora su efectividad original hasta en un factor de 2,3, superando a las técnicas más destacadas del estado del arte. PB Elsevier SN 0020-0255 YR 2020 FD 2020 LK https://uvadoc.uva.es/handle/10324/81886 UL https://uvadoc.uva.es/handle/10324/81886 LA spa NO Information Sciences, Volume 508, 2020, Pages 234-259 NO Producción Científica DS UVaDOC RD 12-feb-2026