Data-driven insights into ischaemic heart disease: exploring individual, environmental and social influences through machine learning
Análisis de datos sobre la cardiopatía isquémica: exploración de influencias individuales, ambientales y sociales mediante el aprendizaje automático
Ver/ Abrir
Identificadores
URI: https://hdl.handle.net/10902/35352Registro completo
Mostrar el registro completo DCAutoría
Cano Mazón, Juan MiguelFecha
2024-07Derechos
Attribution-NonCommercial-NoDerivatives 4.0 International
Palabras clave
Ischemic heart disease
Bayesian networks
Machine learning
Random forests
Healthcare
Cardiovascular disease prediction
Cardiopatía isquémica
Redes bayesianas
Aprendizaje automático
Bosques aleatorios
Asistencia sanitaria
Predicción de enfermedades cardiovasculares
Resumen/Abstract
This Master’s Thesis presents a pioneering approach in the field by utilizing a unique, predictor-rich database to advance our understanding of ischaemic disease. Despite the database’s limited size, it offers a wealth of predictors, including underexplored socio- health descriptors. More precisely, the study analyzes data from approximately 2400 patients at the Hospital Universitario Marqu´es de Valdecilla’s Cardiology Unit from June 2016 to March 2020. The data includes a broad spectrum of variables, from medical history and treatments to social factors and lifestyle behaviors, often overlooked in similar studies. The research focuses on predicting three critical determinants of a patient’s clinical condition: cardiovascular death, heart attack, and hemorrhage. We employ Bayesian Networks, supplemented with random forest algorithms, to enhance model robustness and interpretability. These results are further expanded with additional classification algorithms that provide further support to the validity of the network models built. The primary goal is to assess the influence of various factors on patients’ cardiovascular health, leading to improved risk understanding and the development of more personalized interventions. Although some of the target variables attain low predictive accuracy, our results have been generally positive and promising, indicating the potential of our approach in improving the understanding of cardiovascular health risks and developing more personalized interventions.
Esta tesis de máster presenta un enfoque pionero en el campo de la investigación de la cardiopatía isquémica al utilizar una base de datos única y rica en predictores para avanzar en nuestra comprensión de la enfermedad isquémica. A pesar del tamaño limitado de la base de datos, ofrece una gran cantidad de predictores, incluidos descriptores sociosanitarios poco explorados. En concreto, el estudio analiza datos de aproximadamente 2400 pacientes de la Unidad de Cardiología del Hospital Universitario Marqués de Valdecilla desde junio de 2016 hasta marzo de 2020. Los datos incluyen un amplio espectro de variables, desde la historia clínica y los tratamientos hasta factores sociales y comportamientos de estilo de vida, a menudo pasados por alto en estudios similares. La investigación se centra en la predicción de tres determinantes críticos del estado clínico de un paciente: muerte cardiovascular, infarto de miocardio y hemorragia. Empleamos redes bayesianas, complementadas con bosques aleatorios (random forests), para mejorar la robustez y la interpretabilidad del modelo. Estos resultados se amplían con algoritmos de clasificación adicionales que respaldan aún más la validez de los modelos de red construidos. El objetivo principal es evaluar la influencia de diversos factores en la salud cardiovascular de los pacientes, lo que permitirá comprender mejor los riesgos y desarrollar intervenciones más personalizadas. Aunque algunas de las variables objetivo obtienen una precisión predictiva baja, nuestros resultados han sido en general positivos y prometedores, lo que indica el potencial de nuestro enfoque para mejorar la comprensión de los riesgos para la salud cardiovascular y desarrollar intervenciones más personalizadas y efectivas.