La enfermedad tromboembólica venosa (ETV) es una complicación frecuente de los pacientes con cáncer. El riesgo de recurrencia de ETV y de sangrado mayor (SM), tras el primer evento, está aumentado en los pacientes oncológicos que reciben terapia anticoagulante. Sería útil conocer qué pacientes van a presentar estas complicaciones para implementar una terapia anticoagulante más dirigida. Hasta ahora sólo se había propuesto el modelo predictivo de recurrencia Ottawa, específico para pacientes oncológicos, pero no se emplea en la práctica clínica y dos recientes modelos predictivos de sangrado específicos, el modelo predictivo CAT-BLEED y el B-CAT, pero hasta la fecha tampoco se han validado externamente. El desarrollo de la Inteligencia Artificial (IA), con el aprendizaje automático (ML) y el desarrollo del procesamiento del lenguaje natural (PLN), y la gran cantidad de datos del mundo real (RWD) en el sistema sanitario pueden ser una herramienta para desarrollar nuevos modelos predictivos basados en estas nuevas tecnologías. La hipótesis que esta tesis plantea es que con técnicas de Big Data y utilizando ML y PLN es posible predecir la recurrencia de ETV y el SM en pacientes con cáncer y ETV tratados con terapia anticoagulante. El objetivo principal es desarrollar modelos predictivos de riesgo que nos permitan predecir estas dos complicaciones durante los primeros 6 meses en los pacientes con cáncer que reciben terapia anticoagulante por ETV. Como objetivos secundarios se planteó la validación externa de los modelos predictivos obtenidos, intentar la validación externa del modelo predictivo CAT-BLEED en nuestra población PREDICT-IA y analizar nuevos factores de riesgo de recurrencia de ETV y de SM en esta población. Mediante la tecnología EHReadÒ basada en PLN y ML se extrajeron datos no estructurados de historias clínicas electrónicas (HCE) de 9 hospitales españoles entre 2014 y 2018 (población PREDICT-IA). Se seleccionaron las variables de recurrencia de ETV y de SM utilizando criterios médicos y ML identificándose variables predictoras de ETV y de SM. Para obtener los modelos predictivos se usaron algoritmos de regresión logística (RL), bosque aleatorio (BA) y árbol de decisión (AD). Las variables predictoras identificadas de recurrencia de ETV, en los primeros 6 meses tras el primer ETV en pacientes con cáncer que usan terapia anticoagulante, fueron el antecedente familiar de ETV, la presencia de embolia pulmonar (EP), la trombosis venosa profunda (TVP), presencia de metástasis, adenocarcinoma, la edad del paciente, la cifra de hemoglobina, el recuento plaquetario, el nivel de creatinina sérica y el recuento de leucocitos. En cuanto al SM, las 6 variables predictoras obtenidas fueron la edad, la presencia de metástasis, la cifra de hemoglobina, el recuento plaquetario, el nivel de creatinina sérica y el recuento de leucocitos. La validación externa del modelo de recurrencia de ETV PREDICT-IA en el registro independiente no fue factible porque la variable "antecedentes familiares de ETV", que resultó ser la variable predictora con más peso en el modelo, no estaba recogida. Se sugiere fuerte asociación de los antecedentes familiares de ETV con el riesgo de recurrencia trombótica venosa. Los resultados de la validación externa del modelo de SM PREDICT-IA en el registro independiente alcanzaron un AUC-ROC(IC95%) de 0,59 (0,53-0,65) para el modelo de RL y de 0,56 (0,51-0,62) para el modelo BA, resultando estadísticamente significativo. La leucocitosis se asoció a un incremento del riesgo de sangrado tanto en la cohorte de desarrollo como de validación, sugiriendo ser un nuevo factor de riesgo independiente de SM en esta población. No se consiguió validar externamente el modelo CAT-BLEED en nuestra población. Destacamos el uso de la IA para el desarrollo de los dos modelos predictivos, validándose externamente el modelo de SM y siendo el primer modelo que se consigue validar de forma independiente en población oncológica.
© 2001-2025 Fundación Dialnet · Todos los derechos reservados