Diseño y evaluación de exámenes de tipo test mediante IA
Design and evaluation of multiple choice tests using AI
Ver/ Abrir
Identificadores
URI: https://hdl.handle.net/10902/36805Registro completo
Mostrar el registro completo DCAutoría
Gómez Gómez, DiegoFecha
2025-07-15Director/es
Derechos
Attribution-NonCommercial-NoDerivatives 4.0 International
Resumen/Abstract
En este Trabajo de Fin de Grado, se realiza la búsqueda del mejor modelo para ser utilizado de manera local mediante la aplicación LM Studio con el objetivo de corregir exámenes de tipo test mediante plantillas. Para ello se estudian los comportamientos de distintos modelos frente a distintas pruebas y se valora mediante gráficas y tablas cual es el más apto para la tarea buscada. El modelo Phi 4 destaca por su equilibrio entre velocidad, precisión (90 % en corrección automática) y facilidad de uso en entornos con hardware limitado. Así se demuestra que su implementación local aporta beneficios claros frente al uso de servicios en la nube: mejora la privacidad de los datos, elimina costes por uso y facilita la personalización del sistema para tareas concretas. Además, se ha desarrollado una API con la intención de integrar el modelo en aplicaciones educativas, y se han documentado todas las fases del proceso: desde la selección e instalación de los modelos, hasta la puesta en marcha de un servidor funcional. Las pruebas prácticas realizadas mostraron un rendimiento estable y confiable. En conclusión, este proyecto evidencia la viabilidad de utilizar modelos de lenguaje locales para optimizar procesos educativos, especialmente en contextos con restricciones presupuestarias o de conectividad. La inteligencia artificial, aplicada correctamente, puede convertirse en una herramienta clave para liberar tiempo docente, mejorar la calidad de la evaluación y facilitar el aprendizaje personalizado.
In this Final Degree Project, the search for the best model to be used locally through the LM Studio application is carried out with the aim of grading multiple-choice exams using templates. To achieve this, the behaviour of different models is studied through various tests and evaluated using graphs and tables to determine which is most suitable for the intended task. The Phi 4 model stands out for its balance between speed, accuracy (90% in automated grading), and ease of use in environments with limited hardware. It is thus demonstrated that local implementation provides clear benefits compared to the use of cloud services: improved data privacy, elimination of usage costs, and easier system customization for specific tasks. Additionally, an API has been developed with the intention of integrating the model into educational applications, and all stages of the process have been documented—from model selection and installation to the deployment of a functional server. Practical tests showed stable and reliable performance. In conclusion, this project demonstrates the feasibility of using local language models to optimize educational processes, especially in contexts with budget or connectivity constraints. When applied correctly, artificial intelligence can become a key tool for reducing teacher workload, improving assessment quality, and facilitating personalized learning.