<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="static/style.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2026-05-05T11:24:14Z</responseDate><request verb="GetRecord" identifier="oai:uvadoc.uva.es:10324/49995" metadataPrefix="rdf">https://uvadoc.uva.es/oai/request</request><GetRecord><record><header><identifier>oai:uvadoc.uva.es:10324/49995</identifier><datestamp>2025-02-20T07:14:29Z</datestamp><setSpec>com_10324_38</setSpec><setSpec>col_10324_787</setSpec></header><metadata><rdf:RDF xmlns:rdf="http://www.openarchives.org/OAI/2.0/rdf/" xmlns:doc="http://www.lyncode.com/xoai" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:ds="http://dspace.org/ds/elements/1.1/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:ow="http://www.ontoweb.org/ontology/1#" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/rdf/ http://www.openarchives.org/OAI/2.0/rdf.xsd">
<ow:Publication rdf:about="oai:uvadoc.uva.es:10324/49995">
<dc:title>Implementación de una herramienta basada en PLN para la detección y anonimización de datos personales en documentos</dc:title>
<dc:creator>Simón Ramos, José Manuel</dc:creator>
<dc:contributor>Bregón Bregón, Aníbal</dc:contributor>
<dc:contributor>Silvestre Vilches, Jorge</dc:contributor>
<dc:contributor>Universidad de Valladolid. Escuela de Ingeniería Informática de Valladolid</dc:contributor>
<dc:description>En los últimos años, el avance en el campo del Aprendizaje Automático,&#xd;
unido a las mejoras del hardware, y al aumento del volumen de los datos,&#xd;
ha motivado la utilización de técnicas de aprendizaje que empleen estos&#xd;
datos para automatizar procesos o extraer conocimiento a partir de&#xd;
los mismos. Desde el punto de vista del campo del Procesamiento del&#xd;
Lenguaje Natural (PLN), la utilización de los datos para generar nuevos&#xd;
modelos se encuentra afectada debido a la existencia de información&#xd;
de carácter personal en los mismos. Esto, unido a la fuerte legislación&#xd;
vigente sobre la Protección de Datos, hace que las administraciones y&#xd;
organizaciones deban tener una mayor precaución y control a la hora&#xd;
de utilizar o compartir documentos en los que se aparezca información&#xd;
personal.&#xd;
El presente Trabajo Fin de Máster aborda la problemática de la&#xd;
detección y anonimización de entidades personales existentes en documentos&#xd;
administrativos (permisos, inspecciones, convenios, etc). En la línea&#xd;
con lo anterior, el proyecto plantea una propuesta genérica y eficiente de&#xd;
pipeline enfocada a la anonimización y generación de reemplazos para las&#xd;
entidades detectadas. Esta propuesta busca no solo poder ser empleada&#xd;
para detectar y anonimizar entidades en este tipo de documentos, sino&#xd;
que pretende ser una solución genérica para abordar la problemática de la&#xd;
detección y anonimización de entidades en cualquier tipo de documentos.</dc:description>
<dc:description>In recent years, progress in the area of Machine Learning, together&#xd;
with hardware improvements, and the increase in the volume of data,&#xd;
has motivated the use of learning techniques that use this data to&#xd;
automate processes or extract knowledge. From the point of view of&#xd;
Natural Language Processing (NLP), the use of data to generate new&#xd;
models is affected by the existence of personal information in them.&#xd;
This, combined with the strong legislation in force on Data Protection,&#xd;
means that administrations and organizations must be more cautious and&#xd;
have greater control when using or sharing documents which personal&#xd;
information appears.&#xd;
This Master Thesis addresses the problem of detection and anonymization&#xd;
of personal entities in administrative documents (permits, inspections,&#xd;
agreements, etc.). In addition, the project presents a generic and efficient&#xd;
proposal of pipeline focused on the anonymization and generation of&#xd;
replacements for the detected entities. This proposal aims not only to&#xd;
be used to detect and anonymize entities in this type of documents, but&#xd;
also to be a generic solution to address the problem of detecting and&#xd;
anonymizing entities in any type of documents.</dc:description>
<dc:date>2021-11-12T16:08:31Z</dc:date>
<dc:date>2021-11-12T16:08:31Z</dc:date>
<dc:date>2021</dc:date>
<dc:type>info:eu-repo/semantics/masterThesis</dc:type>
<dc:identifier>https://uvadoc.uva.es/handle/10324/49995</dc:identifier>
<dc:language>spa</dc:language>
<dc:rights>info:eu-repo/semantics/openAccess</dc:rights>
<dc:rights>http://creativecommons.org/licenses/by-nc-nd/4.0/</dc:rights>
<dc:rights>Attribution-NonCommercial-NoDerivatives 4.0 Internacional</dc:rights>
</ow:Publication>
</rdf:RDF></metadata></record></GetRecord></OAI-PMH>