• español
  • English
  • français
  • Deutsch
  • português (Brasil)
  • italiano
    • español
    • English
    • français
    • Deutsch
    • português (Brasil)
    • italiano
    • español
    • English
    • français
    • Deutsch
    • português (Brasil)
    • italiano
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    Ricerca

    Tutto UVaDOCArchiviData di pubblicazioneAutoriSoggettiTitoli

    My Account

    Login

    Estadísticas

    Ver Estadísticas de uso

    Compartir

    Mostra Item 
    •   UVaDOC Home
    • PROGETTI DI LAUREA FINALE
    • Trabajos Fin de Grado UVa
    • Mostra Item
    •   UVaDOC Home
    • PROGETTI DI LAUREA FINALE
    • Trabajos Fin de Grado UVa
    • Mostra Item
    • español
    • English
    • français
    • Deutsch
    • português (Brasil)
    • italiano

    Exportar

    RISMendeleyRefworksZotero
    • edm
    • marc
    • xoai
    • qdc
    • ore
    • ese
    • dim
    • uketd_dc
    • oai_dc
    • etdms
    • rdf
    • mods
    • mets
    • didl
    • premis

    Citas

    Por favor, use este identificador para citar o enlazar este ítem:https://uvadoc.uva.es/handle/10324/50455

    Título
    DocScan: Deep Learning para la segmentación de documentos escaneados
    Autor
    San José Lorza, Jorge
    Director o Tutor
    Calonge Cano, TeodoroAutoridad UVA
    Editor
    Universidad de Valladolid. Escuela de Ingeniería Informática de ValladolidAutoridad UVA
    Año del Documento
    2021
    Titulación
    Grado en Ingeniería Informática
    Abstract
    Desde que existe Internet, los grandes archivos de documentos se han convertido en uno de los sitios más interesantes para acceder. Sus consultas exigen cada díaa una recuperación de información más sofisticada. Estas técnicas de búsqueda se basan en varios paradigmas diferentes. En particular, la Inteligencia Artificial se está aplicando hoy en día en el procesamiento emergente de la gestión de documentos, por ejemplo, identificación de áreas de papel como fotos, gráficos, encabezados, resumenes, pies de página, etc. Una posterior ejecución de OCR nos traerá el texto al interior de cada una de las zonas de papel mencionadas. Esta información se almacena en el campo correspondiente en el Sistema de Base de Datos disponible a nivel mundial, ya que estos campos serán el objetivo de la búsqueda de los usuarios. Además, el reconocimiento de áreas mencionadas en un determinado papel también se puede utilizar para convertir el documento original escaneado a otro formato más adecuado como XML. En el presente trabajo, esta tarea se presenta bajo un problema de Visión Artificial, en particular, como una segmentación de imágenes que reconocerá cada una de estas áreas del documento. Concretamente, nuestro enfoque se basa en Redes Neuronales Artificiales Convolucionales bajo una arquitectura UNET. Originalmente se propuso en 2015 para ser utilizado en un reconocimiento de imágenes biomédicas. La implementación se ha realizado utilizando PyTorch con una precisión satisfactoria. Finalmente, con el fin de mejorar la accesibilidad de nuestro sistema, se creó un servidor html. El escaneo de documentos se introducirá en esta aplicación y devolverá su verdad básica.
     
    Since internet exits, the large document archives became one of the most interesting sites to be accessed. Theirs consults are demanding more sophisticated information retrieving everyday. These searching techniques are based on several different paradigms. In particular, the Artificial Intelligence is nowadays applying in the emergent document managing processing, for instance, paper areas identification like photo, graphics, header, abstract, footer, etc. It is really the first step to lead to a useful document searching, because a posterior OCR execution will bring us the text inside in each of the mentioned paper zones. This information is stored in the corresponding field in the Database System available worldwide, since these fields will be the target of the users searching. In addition, the mentioned areas recognition in a given paper can be also used to convert the original scanning document into another more suitable format like XML. In the present work, this task is presented under a Vision Artificial problem, in particular, as image segmentation that will recognize each one of these document areas. More precisely, our approach is based on Convolutional Artificial Neuronal Networks under a UNET architecture. It was originally proposed en 2015 to be used in a biomedical image recognition. The implementation has been made using PyTorch with a satisfactory accuracy. Finally, in order to improve the accessibility of our system, a html server was created. Scanning documents will be introduce to this application and it will return their groundtruth.
    Palabras Clave
    Aprendizaje profundo
    Segmentación
    Documentos
    Idioma
    spa
    URI
    https://uvadoc.uva.es/handle/10324/50455
    Derechos
    openAccess
    Aparece en las colecciones
    • Trabajos Fin de Grado UVa [30857]
    Mostra tutti i dati dell'item
    Files in questo item
    Nombre:
    TFG-G5279.pdf
    Tamaño:
    46.29Mb
    Formato:
    Adobe PDF
    Thumbnail
    Mostra/Apri
    Attribution-NonCommercial-NoDerivatives 4.0 InternacionalLa licencia del ítem se describe como Attribution-NonCommercial-NoDerivatives 4.0 Internacional

    Universidad de Valladolid

    Powered by MIT's. DSpace software, Version 5.10