Aplicación de técnicas de Machine Learning al estudio del cáncer de endometrio
Ver/ Abrir
Identificadores
URI: http://hdl.handle.net/10902/20783Registro completo
Mostrar el registro completo DCAutoría
Shallcrass Susinos, JuanFecha
2020-09Derechos
Atribución-NoComercial-SinDerivadas 3.0 España
Palabras clave
Cáncer de endometrio
Estadio FIGO
Árbol de clasificación
Test de Fisher
Intervalo de confianza binomial
Endometrial cancer
FIGO staging
Classi cation trees
Fisher's test
Binomial confidence interval
Resumen/Abstract
RESUMEN: En este trabajo, se estudiará la influencia de distintas variables en el exitus de pacientes operadas de cáncer de endometrio. Para ello, se analizarán dos grupos de variables, uno que contiene aquellas variables que dan información sobre la paciente y el tumor, y otro que contiene variables que dan información sobre el tratamiento aplicado. Con este fin, se utilizará un modelo mixto combinando técnicas de Machine Learning basadas en árboles de clasificación y técnicas de estadística clásica para entrar más en detalle en la influencia de las variables. Con las técnicas de Machine Learning, se definirán dos grupos de pacientes a partir de una división en la variable Estadio FIGO, donde uno de los grupos tiene un diagnóstico a priori positivo mientras que el otro tiene un diagnóstico inicial negativo. Finalmente, se estudiará para los dos grupos qué variables influyen en el exitus de la paciente utilizando el Test de Fisher, y si estas influyen aumentando o disminuyendo las probabilidades de supervivencia, empleando para ello el intervalo de confianza binomial según la modificación del intervalo de Clopper-Pearson propuesta por Lancaster.
ABSTRACT: In the present work, the inuence of several variables on the exitus of patients operated on for endometrial cancer will be studied. In order to do so, two groups of variables will be analyzed, one containing those variables that provide information about the patient and the tumor, and another one including those that inform about the treatment applied to the patient. For this purpose, a mixed model will be used combining Machine Learning techniques based on classi_cation trees and classical statistics techniques to analyze more in detail the influence of the variables. With the Machine Learning techniques, two groups of patients will be defined from a division in the variable Estadio FIGO, where one of the groups has a positive initial diagnosis while the other one has a negative initial diagnosis. Finally, Fisher's test will be used to study which variables influence the most on the patient's exitus for both these groups, and the binomial confidence interval as the modification of the Clopper-Pearson interval proposed by Lancaster will be employed to understand whether these variables increase or decrease the probability of survival.