RT info:eu-repo/semantics/bachelorThesis T1 DocScan: Deep Learning para la segmentación de documentos escaneados A1 San José Lorza, Jorge A2 Universidad de Valladolid. Escuela de Ingeniería Informática de Valladolid K1 Aprendizaje profundo K1 Segmentación K1 Documentos AB Desde que existe Internet, los grandes archivos de documentos se han convertido enuno de los sitios más interesantes para acceder. Sus consultas exigen cada díaa una recuperación de información más sofisticada. Estas técnicas de búsqueda se basan en varios paradigmas diferentes. En particular, la Inteligencia Artificial se está aplicando hoy en día en el procesamiento emergente de la gestión de documentos, por ejemplo, identificación de áreas de papel como fotos, gráficos, encabezados, resumenes, pies de página, etc. Unaposterior ejecución de OCR nos traerá el texto al interior de cada una de las zonas de papel mencionadas. Esta información se almacena en el campo correspondiente en el Sistema de Base de Datos disponible a nivel mundial, ya que estos campos serán el objetivo de la búsqueda de los usuarios.Además, el reconocimiento de áreas mencionadas en un determinado papel también se puede utilizar para convertir el documento original escaneado a otro formato más adecuado como XML. En el presente trabajo, esta tarea se presenta bajo un problema de Visión Artificial, en particular, como una segmentación de imágenes que reconocerá cada una de estas áreas del documento.Concretamente, nuestro enfoque se basa en Redes Neuronales Artificiales Convolucionales bajo una arquitectura UNET. Originalmente se propuso en 2015 para ser utilizado en un reconocimiento de imágenes biomédicas. La implementación se ha realizado utilizando PyTorch con una precisión satisfactoria.Finalmente, con el fin de mejorar la accesibilidad de nuestro sistema, se creó un servidor html. El escaneo de documentos se introducirá en esta aplicación y devolverá su verdad básica. YR 2021 FD 2021 LK https://uvadoc.uva.es/handle/10324/50455 UL https://uvadoc.uva.es/handle/10324/50455 LA spa DS UVaDOC RD 29-may-2024