28 - IMPORTANCIA DE PREDICTORES EN EL RIESGO DE HOSPITALIZACIÓN POR COVID-19: USO PRÁCTICO DE MACHINE LEARNING
Hospital Universitario de Móstoles, Móstoles, España.
Objetivos: Las condiciones médicas asociadas al síndrome metabólico como obesidad, hipertensión arterial, dislipemia o resistencia insulínica son comunes en pacientes ingresados con COVID-19 grave. Estas condiciones pueden actuar sinérgicamente y empeorar el pronóstico de los pacientes. Sin embargo, existen muchas variables de interés, en ocasiones ruidosas y poco relevantes, que confunden los resultados de un modelo estadístico. Mediante el uso de machine learning analizamos la relevancia de cada factor de riego y su grado de contribución a la gravedad del COVID-19.
Métodos: Diseñamos un estudio transversal retrospectivo con pacientes ingresados con el diagnóstico de COVID-19 durante las primeras semanas de la pandemia. Se recogieron datos demográficos de pacientes que acudieron a nuestro centro con PCR positiva para SARS-CoV-2. También se recogieron datos relacionados con el síndrome metabólico (diabetes, IMC, dislipemia, HTA, etc.). La resistencia insulínica se determinó mediante HOMA-IR (Homeostatic Model Assessment of Insulin Resistance). Se usó regresión logística estándar y la necesidad de hospitalización por COVID-19 grave como variable dependiente. Como métodos de machine learning se optó por la regresión logística penalizada (least absolute shrinkage and selection operator o LASSO), recursive feature elimination (RFE) y random forest para conseguir un modelo de interpretación global. Se usó también local interpretable model-agnostic explanations (LIME) para conseguir un modelo de interpretación local. Este estudio tiene la aprobación del Comité de Investigación de nuestro centro.
Resultados: Se incluyeron 2.716 pacientes con PCR positiva para COVID-19, de los cuales 2.504 fueron dados de alta (controles) y 212 fueron hospitalizados por enfermedad grave (casos). El modelo de regresión penalizada (LASSO) produjo un modelo más parsimonioso (menos variables) que la regresión logística estándar, identificando el sexo, la edad, la obesidad, el síndrome metabólico, la presión arterial sistólica y la resistencia insulínica medida mediante HOMA-IR (tabla). La combinación de RFE y random forest estableció la importancia de cada variable (fig. 1). La interpretación de los resultados mejoró con la aplicación de LIME, que analizó el comportamiento del modelo a nivel local (es decir, a casos individuales), justificando el resultado del modelo mediante la observación de la magnitud del efecto de cada variable (fig. 2).
|
Regresión logística estándar |
LASSO (regresión penalizada) |
|||
|
Coeficiente beta |
OR (IC95%) |
p |
Coeficiente beta |
OR |
Varón |
0,462 |
1,58 (1,08-2,32) |
0,018 |
0,223 |
1,250 |
Edad |
0,082 |
1,08 (1,06-1,10) |
0,001 |
0,062 |
1,064 |
IMC |
0,212 |
1,23 (1,19-1,27) |
0,001 |
0,197 |
1,217 |
Diabetes |
-0,837 |
0,43 (0,25-0,74) |
0,003 |
||
Sd. metabólico |
0,283 |
1,32 (1,19-1,71) |
0,001 |
0,164 |
1,178 |
Presión sistólica |
0,009 |
1,02 (1,01-1,03) |
0,033 |
0,003 |
1,002 |
Ácido úrico |
-0,092 |
0,91 (0,81-1,02) |
0,127 |
||
Triglicéridos |
0,003 |
1,04 (1,02-1,05) |
0,001 |
||
HbA1c |
-0,175 |
0,84 (0,65-1,07) |
0,167 |
||
Insulina |
-0,048 |
0,95 (0,92-0,98) |
0,007 |
||
HOMA-IR |
0,112 |
1,12 (1,02-1,22) |
0,014 |
0,082 |
1,085 |
Filtrador glomerular renal |
0,019 |
1,02 (1,01-1,03) |
0,009 |
||
Log-likelihood = -456,7, chi cuadrado = 147,7, p = 0,001. |
Conclusiones: El síndrome metabólico y sus comorbilidades asociadas ya han sido establecidos como factores de riesgo para hospitalización y muerte por COVID-19, sobre todo por su efecto de riesgo acumulativo. La contribución de nuestro estudio es la de conseguir, por una parte, un modelo parsimonioso con respecto al que ofrecía la regresión logística convencional, sin perder su rendimiento y, por otra, conseguir un modelo fácil de entender e interpretar por los clínicos, que lo pueden aplicar a casos individuales.