<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="static/style.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2026-04-27T01:38:43Z</responseDate><request verb="GetRecord" identifier="oai:uvadoc.uva.es:10324/71501" metadataPrefix="mods">https://uvadoc.uva.es/oai/request</request><GetRecord><record><header><identifier>oai:uvadoc.uva.es:10324/71501</identifier><datestamp>2024-11-15T20:02:14Z</datestamp><setSpec>com_10324_38</setSpec><setSpec>col_10324_787</setSpec></header><metadata><mods:mods xmlns:mods="http://www.loc.gov/mods/v3" xmlns:doc="http://www.lyncode.com/xoai" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.loc.gov/mods/v3 http://www.loc.gov/standards/mods/v3/mods-3-1.xsd">
<mods:name>
<mods:namePart>Quintana Angulo, Gino Jesús</mods:namePart>
</mods:name>
<mods:extension>
<mods:dateAvailable encoding="iso8601">2024-11-15T08:26:12Z</mods:dateAvailable>
</mods:extension>
<mods:extension>
<mods:dateAccessioned encoding="iso8601">2024-11-15T08:26:12Z</mods:dateAccessioned>
</mods:extension>
<mods:originInfo>
<mods:dateIssued encoding="iso8601">2024</mods:dateIssued>
</mods:originInfo>
<mods:identifier type="uri">https://uvadoc.uva.es/handle/10324/71501</mods:identifier>
<mods:abstract>El objetivo de este proyecto es el desarrollo de un servicio web que permita la&#xd;
transcripción de voz a texto (speech to text) de manera precisa y con un rendimiento&#xd;
aceptable. Para lograrlo, se emplearán tecnologías ASR como Whisper y Wav2Vec.&#xd;
Además, este servicio establecerá un marco de referencia para la construcción de&#xd;
sistemas similares en este campo tecnológico en constante evolución. El desarrollo del&#xd;
servicio se llevará a cabo siguiendo la metodología ágil Scrum, dividiendo el proceso&#xd;
en iteraciones incrementales (sprints). Se destacan hitos como la implementación&#xd;
de microservicios usando Docker y Docker Compose, la creación de un prototipo&#xd;
funcional y la mejora continua del servicio, la calidad y velocidad de transcripción. El&#xd;
servicio se diseñará con las siguientes características: escalable, modular y accesible.</mods:abstract>
<mods:abstract>The objective of this project is the development of a web service that allows&#xd;
speech to text conversion in an accurate way and with an acceptable performance.&#xd;
To achieve this, ASR technologies such as Whisper and Wav2Vec will be used. In&#xd;
addition, this service will establish a reference framework for the construction of&#xd;
similar systems in this constantly evolving field of technology. The development of&#xd;
the service will be carried out following the agile Scrum methodology, dividing the&#xd;
process into incremental iterations (sprints). Milestones such as the implementation&#xd;
of microservices using Docker and Docker Compose, the creation of a functional&#xd;
prototype and the continuous improvement of the service, the quality and speed&#xd;
of transcription are highlighted. The service will be designed with the following&#xd;
characteristics: scalable, modular and accessible.</mods:abstract>
<mods:language>
<mods:languageTerm>spa</mods:languageTerm>
</mods:language>
<mods:accessCondition type="useAndReproduction">info:eu-repo/semantics/openAccess</mods:accessCondition>
<mods:accessCondition type="useAndReproduction">http://creativecommons.org/licenses/by-nc-nd/4.0/</mods:accessCondition>
<mods:accessCondition type="useAndReproduction">Attribution-NonCommercial-NoDerivatives 4.0 Internacional</mods:accessCondition>
<mods:titleInfo>
<mods:title>TuVozATexto: Servicio web para la conversión de voz a texto</mods:title>
</mods:titleInfo>
<mods:genre>info:eu-repo/semantics/masterThesis</mods:genre>
</mods:mods></metadata></record></GetRecord></OAI-PMH>