Desarrollo de técnicas de aprendizaje automático para la planificación radioterapéutica
Development of Machine Learning Techniques for Radiotherapeutic Planning
Ver/ Abrir
Identificadores
URI: http://hdl.handle.net/10902/24782Registro completo
Mostrar el registro completo DCAutoría
Sordo Veci, DavidFecha
2021-07-19Derechos
Atribución-NoComercial-SinDerivadas 3.0 España
Palabras clave
Redes bayesianas
Bosques aleatorios
Minería de datos
Radioterapia
Oncología clínica
Bayesian networks
Random forests
Data mining
Radiotherapy
Clinical oncology
Resumen/Abstract
RESUMEN: El rápido desarrollo de las técnicas de aprendizaje automático ha dado lugar en los últimos años a una creciente adopción de las mismas en el campo de la sanidad, como apoyo a la toma de decisiones tanto de carácter clínico (diagnóstico, tratamiento etc.) como operativo (organización de citas etc.). En este trabajo se explota la información contenida en la base de datos del sistema ARIA Oncology Information System, usado por el Departamento de Radioterapia del Hospital Universitario Marqués de Valdecilla para organizar y gestionar toda la actividad del servicio, con el fin de extraer información relevante para la mejora y optimización del sistema de citas actualmente vigente. La primera fase de este trabajo consiste en la extracción, organización y curado de los datos, para dar lugar a dos datasets principales, uno con datos relativos a los planes de radioterapia que se diseñan en el Servicio (más de 8,000 registros) y otro que contiene información sobre las más de 70,000 sesiones de tratamiento realizadas. Sobre estos datos se han realizado dos aproximaciones complementarias a través de técnicas de minería de datos: una de tipo no supervisado, usando Redes Bayesianas y otro de tipo supervisado usando random forests. El primer análisis tiene como objetivo el desarrollo de un sistema experto que permita la realización de consultas avanzadas, con el fin de extraer patrones y relaciones relevantes de cara a la organización del sistema de citas, así como otros aspectos clínicos referentes a los tratamientos que pudieran ser de interés. El segundo análisis se centra en una variable respuesta de especial interés, el tiempo de duración de las sesiones de tratamiento, con el fin de desarrollar un modelo predictivo que permita distribuir mejor las citas en el calendario y así mejorar la organización operativa del servicio y optimizar el tiempo de uso de los aceleradores lineales, cuyo coste de funcionamiento es elevado.
ABSTRACT: The rapid development of machine learning techniques has led in recent years to a growing adoption of them in the field of health, as support for decision-making both clinical (diagnosis, treatment, etc.) and operational (organization of appointments etc.). This work exploits the information contained in the ARIA Oncology Information System database, used by the Radiotherapy Department of the Marqués de Valdecilla University Hospital to organize and manage all the activity of the service, in order to extract relevant information for the improvement and optimization of the current scheduling system. The first phase of this work consists of the extraction, organization and curation of the data, producing two main datasets, one with data related to the radiotherapy plans that are designed in the Service (more than 8,000 records) and the other that contains information about more than 70,000 treatment sessions. Two complementary approaches have been made on these data through data mining techniques: one unsupervised, using Bayesian Networks, and the other supervised, using random forests. The first analysis aims to develop an expert system to perform advanced queries, in order to extract relevant patterns and relationships for the organization of the scheduling system, as well as other clinical aspects regarding the treatments. The second analysis focuses on a response variable of special interest, the duration of treatment sessions, in order to develop a predictive model that allows better distribution of appointments on the calendar, in order to improve the operational organization of the service and optimize the use time of linear accelerators, whose operating cost is high.