RT info:eu-repo/semantics/masterThesis T1 Implementación de técnicas de RAG (Retrieval Augmented Generation) sobre LLM (Large Language Models) para la extracción y generación de documentos en las entidades públicas A1 Collado Alonso, Miguel Ángel A2 Universidad de Valladolid. Escuela de Ingeniería Informática de Valladolid K1 Inteligencia Artificial (IA) K1 Procesamiento del Lenguaje Natural (PLN) K1 Modelo Grande del Lenguaje (LLM) K1 Generación Aumentada por Recuperación (RAG) AB Un viejo desafío en el campo de la inteligencia artificial es “enseñar” a las máquinas a entendercómo hablan y escriben los humanos, conocido como procesamiento de lenguaje natural (PLN).Sin embargo, desde hace poco más de dos años, estamos asistiendo a la caída de este antiguobastión con la llegada de los modelos grandes del lenguaje (LLM) y los interfacesconversacionales. Los LLM son modelos de inteligencia artificial que se entrenan utilizandoalgoritmos de Deep Learning sobre conjuntos enormes de información generada por humanos.De esta manera, una vez entrenados, han aprendido la forma en la que los humanos utilizamosla palabra hablada y escrita, así que son capaces de ofrecernos respuestas generales y con unpatrón muy parecido a nuestra forma de contestar a las preguntas que les hacemos. Sin embargo,si buscamos respuestas precisas en un contexto determinado, los LLM por sí solos noproporcionarán respuestas concretas o habrá una alta probabilidad de que se inventencompletamente la respuesta. En este trabajo, se explica y desarrolla una de las técnicas claveque hace posible que estos sistemas nos respondan con relativa precisión a las preguntas queles hacemos, esta tecnología se denomina Generación Aumentada por Recuperación o RAG,del inglés Retrieval Augmented Generation. Para ello se comparan diversos modelos LLM, seconfiguran un conjunto de herramientas para lograr inferir los modelos, y se desarrolla uncódigo fuente para, finalmente, lograr realizar una interfaz web, a modo de chatbot, que permitainteractuar con el usuario y realizar RAG sobre un documento elegido por el mismo. YR 2024 FD 2024 LK https://uvadoc.uva.es/handle/10324/71509 UL https://uvadoc.uva.es/handle/10324/71509 LA spa NO Departamento de Informática (Arquitectura y Tecnología de Computadores, Ciencias de la Computación e Inteligencia Artificial, Lenguajes y Sistemas Informáticos) DS UVaDOC RD 29-nov-2024