Show simple item record

dc.contributor.advisorMartínez Prieto, Miguel Ángeles
dc.contributor.authorHernández Herrero, Cristina
dc.contributor.editorUniversidad de Valladolid. Escuela Universitaria de Informática es
dc.date.accessioned2014-09-03T08:16:49Z
dc.date.available2014-09-03T08:16:49Z
dc.date.issued2014
dc.identifier.urihttp://uvadoc.uva.es/handle/10324/5794
dc.description.abstractEn este proyecto estudiaremos el concepto de Web Scraping y cómo su utilización puede ayudar a extraer de forma estructurada la información contenida en un conjunto de páginas web pertenecientes a un mismo dominio. En nuestro trabajo revisaremos las técnicas fundamentales de scraping, y las utilizaremos, de acuerdo a nuestras necesidades, para extraer la información de un sitio web de interés general como es el Boletín Oficial de Castilla y León. (BOCyL). A nivel práctico, se propone un algoritmo genérico de scraping capaz de “arañar” los datos del boletín y almacenarlos de forma estructurada en una base de datos relacional cuyo esquema responde a las propiedades conceptuales del BOCyL. Finalmente, se muestra un ejemplo de reutilización de la misma, así como varias recomendaciones prácticas destinadas a mejorar la política de publicación en la WWW del BOCyL.es
dc.format.mimetypeapplication/pdfes
dc.language.isospaes
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectSitios web-Programas y sistemas de programaciónes
dc.titleAplicación de Técnicas de Web Scraping al Boletín Oficial de Castilla y León (BOCyL)es
dc.typeinfo:eu-repo/semantics/bachelorThesises
dc.description.degreeGrado en Ingeniería Informática de Servicios y Aplicacioneses
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record