RT info:eu-repo/semantics/bachelorThesis T1 Plataforma para la extracción y análisis de noticias de la web A1 Marcos Parra, Pablo A2 Universidad de Valladolid. Escuela de Ingeniería Informática de Valladolid K1 Interacción Hombre Máquina K1 Scraping Web K1 Procesamiento del lenguaje natural K1 Procesos ETL AB En la actualidad el flujo de noticias e informaciones es más grande que nunca y es necesariosometer a escrutinio público el valor que aportan a la sociedad algunas de estasnoticias. Actualmente, la única manera de analizar dichas noticias es recurriendo a unapersona o grupos de personas para que extraigan las noticias de la web y vayan estudiandola información que aportan dichas noticias, todo ello de manera manual. Es unatarea importante, pero costosa y repetitiva.Este trabajo se centra en la automatización de la extracción y análisis de las noticiasde la web mediante la creación de una plataforma web que permita acceder y filtrarrápidamente las noticias y realizar un análisis preliminar de su estructura y otros aspectosrelevantes, como el análisis de sentimientos.Para la parte de extracción, se han extraído las noticias de diferentes fuentes web yblogs de noticias en castellano mediante métodos de web scraping, se han estructuradomediante un proceso ETL (Extract, Transform y Load) y se han almacenado en una basede datos.Para la parte de análisis, se han aplicado técnicas de Procesamiento de Lenguaje Natural(PLN). Primero, se realiza un análisis de sentimientos sobre la noticia y posteriormente,un Reconocimiento de Entidades Nombradas (REN) para identificar a las organizaciones,lugares o personas mencionadas.Finalmente, se crea una plataforma web donde se muestran las noticias extraídas y elresultado del análisis. YR 2023 FD 2023 LK https://uvadoc.uva.es/handle/10324/62986 UL https://uvadoc.uva.es/handle/10324/62986 LA spa NO Departamento de Informática (Arquitectura y Tecnología de Computadores, Ciencias de la Computación e Inteligencia Artificial, Lenguajes y Sistemas Informáticos) DS UVaDOC RD 02-may-2025