Durante la pandemia de COVID se especuló que los pacientes con el virus que tenían relación con el tabaco podrían tener una menor probabilidad de agravamiento de la enfermedad o muerte. Para evaluar si existe una asociación entre el tabaquismo y el riesgo de mortalidad intrahospitalaria se utiliza la tecnología de Big Data y Procesamiento del Lenguaje Natural (PLN) de SAVANA.
MétodoSe llevó a cabo un estudio de cohortes retrospectivo, observacional y sin intervención basado en datos de vida real extraídos de registros médicos de toda Castilla-La Mancha utilizando las técnicas de PLN e inteligencia artificial desarrolladas por SAVANA. El estudio abarcó toda la población de esta Comunidad con historia clínica electrónica en SESCAM que presentara diagnóstico de COVID desde el 1 de marzo de 2020 al 28 de febrero de 2021.
ResultadosLos fumadores tienen mayor porcentaje de factores de riesgo cardiovascular (hipertensión arterial, dislipemia y diabetes), EPOC, asma, EPID, CI, ECV, TEP, cáncer en general y cáncer de pulmón en particular, bronquiectasias, insuficiencia cardíaca y antecedentes de neumonía, de forma significativa (p<0,0001). Los pacientes exfumadores, fumadores y no fumadores tienen una diferencia de edad significativa. En cuanto a las muertes hospitalarias, fueron más frecuentes en el caso de los exfumadores, siguiendo los fumadores y luego los no fumadores (p<0,0001).
ConclusiónExiste un mayor riesgo de mortalidad intrahospitalaria en los pacientes infectados por SARS-CoV-2 que sean fumadores activos o hayan fumado en el pasado.
During the COVID pandemic, it was speculated that patients with the virus who were smoking-related might have a lower likelihood of disease exacerbation or death. To assess whether there is an association between smoking and risk of in-hospital mortality, SAVANA's big data and natural language processing (NLP) technology is used.
MethodA retrospective, observational, non-interventional cohort study was conducted based on real-life data extracted from medical records throughout Castilla-La Mancha using natural language processing and artificial intelligence techniques developed by SAVANA. The study covered the entire population of this region with Electronic Medical Records in SESCAM presenting with a diagnosis of COVID from March 1, 2020 to February 28, 2021.
ResultsSmokers had a significantly higher percentage of cardiovascular risk factors (hypertension, dyslipidemia and diabetes), COPD, asthma, IDP, IC, CVD, PTE, cancer in general and lung cancer in particular, bronchiectasis, heart failure and a history of pneumonia (P<.0001). Former smokers, current smokers and non-smokers have a significant age difference. As for in-hospital deaths, they were more frequent in the case of ex-smokers, followed by smokers and then non-smokers (P<.0001).
ConclusionThere is an increased risk of dying in hospital in SARS-CoV-2-infected patients who are active smokers or have smoked in the past.
El virus SARS-CoV-2 es un coronavirus que empezó a producir neumonías en Wuhan (China) en diciembre de 20191. El diagnóstico se hace fundamentalmente por la evaluación clínica y la detección del virus por la reacción en cadena de la polimerasa (PCR) en diferentes secreciones2. El 30 de enero de 2020 la Organización Mundial de la Salud (OMS) consideró la COVID (enfermedad por SARS-CoV-2) una emergencia de salud pública de importancia internacional, declarándola epidemia3. En pocas semanas se convirtió en una pandemia4, en la cual Italia fue completamente superada por el virus5, siendo el ejemplo más cercano de lo que sucedería en España. Posteriormente, el virus se extendió rápidamente por todo el territorio español6. Ha afectado a todas las comunidades del territorio nacional, si bien se han observado variaciones en la tasa de contagio y en la mortalidad en función de la región. Castilla-La Mancha, en particular, ha sido una de las regiones con mayor tasa de mortalidad y mayor incidencia de casos por cada 100.000 habitantes7, lo que ha supuesto una carga importante de trabajo para los profesionales sanitarios de esta comunidad autónoma, quienes han tenido que dedicar importantes recursos y esfuerzos en la atención a los enfermos por coronavirus. Además, las escasas medidas de protección8 y los cambios en protocolos, a pesar de que las sociedades científicas se pronunciaron pronto sobre el tema9,10, han contribuido a la elevada tasa de contagios en España en general y en Castilla-La Mancha en particular11.
Durante esta situación se señalaron diferentes factores de riesgo: la edad, el sexo masculino y la hipertensión arterial, entre ellos. La relación entre la enfermedad y el tabaquismo era incierta, y se plantearon diversas hipótesis acerca de la posible eficacia terapéutica de la nicotina o su potencial papel defensivo frente a la COVID-1912. Diferentes metaanálisis no han terminado de aclarar si el tabaco actúa como factor agravante o protector ante esta enfermedad13.
En este estudio se utiliza SAVANA Manager® v3.0, una plataforma clínica desarrollada por la empresa médica SAVANA que permite analizar la información incluida en el texto libre de las historias clínicas electrónicas (HCE).
Utilizando esta tecnología ya aplicada en SESCAM para indagar sobre cómo afecta la COVID-19 a los pacientes con asma14, se plantea aclarar cómo afecta el tabaquismo a pacientes con infección por SARS-CoV-2 a nivel de ingreso en la UCI y mortalidad intrahospitalaria, determinando si puede considerarse factor protector o agravante.
MétodosDiseño del estudioSe realiza un estudio retrospectivo, observacional y no intervencionista utilizando SAVANA Manager® v3.0 para capturar la información del texto libre contenido en las HCE. Se incluyeron en este estudio los datos de las HCE de todos los pacientes mayores de 18años diagnosticados de COVID entre el 1 de marzo de 2020 y el 28 de febrero de 2021 de Castilla-La Mancha registrados en SESCAM.
Consideraciones éticasEl estudio se ha llevado a cabo de acuerdo con los requisitos legales y reglamentarios, así como con propósito, valor y rigor científicos, y ha seguido las prácticas de investigación generalmente aceptadas descritas en la Guía de Buenas Prácticas Clínicas, la Declaración de Helsinki en su última edición y Buenas Prácticas de Farmacoepidemiología.
El estudio fue aprobado por el Comité Ético de investigación del Complejo Hospitalario Universitario de Albacete.
Análisis de datosLos datos fueron recogidos de los informes de alta de consultas externas, hospitalización y urgencias e informes de farmacia de los diferentes hospitales del SESCAM, así como de las HCE de atención primaria.
SAVANA permite la extracción, la integración y la explotación de los datos clínicos no estructurados que existen dentro de la HCE15. Para ello, ha desarrollado EHRead®, una tecnología que aplica Procesamiento de Lenguaje Natural (PLN), aprendizaje automático y aprendizaje profundo al texto libre de las HCE extrayendo las variables clínicas de interés.
VariablesEl cómputo de conceptos o terminología considerado por SAVANA se basa en SNOMEDCT que contiene códigos, conceptos, sinónimos y definiciones16 y se amplía con términos generados por SAVANA.
Para cumplir con los objetivos del estudio se extrajeron las siguientes variables estructuradas: género, edad, ingreso en la UCI y días de hospitalización, así como las siguientes variables de texto libre contempladas en la terminología: infección por COVID, tabaquismo (no fumador, fumador y exfumador), exitus hospitalario, hipertensión arterial (HTA), dislipemia, diabetes, enfermedad pulmonar obstructiva crónica (EPOC), asma, enfermedad intersticial pulmonar difusa (EPID), cardiopatía isquémica (CI), enfermedad cerebrovascular (ECV), embolismo pulmonar (TEP), cáncer, cáncer de pulmón, neumonía, bronquiectasias, insuficiencia cardíaca y el uso de corticoides (triamcinolona, dexametasona, prednisona, prednisolona, hidrocortisona, parametasona acetato, metilprednisolona, betametasona, fludrocortisona, deflazacort).
Manejo de los datosTodo el proceso comienza con la fase de adquisición de datos. Los servicios de informática realizan una descarga y seudonimización de los datos para enviarlos a SAVANA a través de un protocolo de transferencia segura de archivos (SFTP).
Una vez se realiza la extracción, se procesa con la tecnología EHRead® para identificar y extraer las variables clínicas de interés del texto libre, generando así una base de datos estructurada con toda la información agregada por paciente y por episodio. Si se cumple la condición en uno de los documentos de cada paciente, se toma dicha condición como afirmada; también se han agrupado los diagnósticos y los antecedentes personales, de tal forma que se considera que el paciente cumple la condición si se detecta la entidad como diagnóstico o como antecedente personal. Los que estaban en la base de datos como fumadores y exfumadores han sido identificados como fumadores.
Savana Manager no utiliza HCE de pacientes individuales, sino información clínica agregada. Esta tecnología permite una completa disociación entre los datos obtenidos para el presente estudio y los datos personales del paciente, debido a la seudonimización de los datos y la posterior obtención de la información de forma agregada.
El rendimiento y la precisión de la tecnología EHRead en la identificación de las variables del estudio vienen indicados por la Precisión (P), la cobertura (R) y la F-score. Para este estudio se reutilizaron las métricas obtenidas para los mismos modelos aplicados a los mismos datos en el contexto de otros estudios. Dichos estudios provienen del mismo conjunto de hospitales y se centran en pacientes con EPOC17, asma18 y COVID14.
Análisis estadísticoSe realizó un análisis descriptivo de las variables. Para las variables cualitativas se utilizaron frecuencias relativas y absolutas, mientras que para las variables cuantitativas se emplearon medidas estadísticas, como la media y la desviación estándar. Con el fin de examinar la posible relación entre las variables se utilizó la prueba de chi-cuadrado para las variables cualitativas, y para las cuantitativas, la t de Student. Se estableció un nivel de significación de 0,05 para determinar si los resultados fueron estadísticamente significativos.
ResultadosDel total de pacientes de la población de Castilla-La Mancha con HCE disponible durante el periodo de estudio (1 de marzo de 2020 a 28 de febrero de 2021), se identificaron 293.126 pacientes con infección por el virus SARS-CoV-2. La evaluación lingüística del término «infección por el virus SARS-CoV-2» obtuvo, para otros estudios que utilizaron los mismos modelos de detección de entidades, una precisión, cobertura y F-score de 0,99, 0,75 y 0,93, respectivamente, indicando la correcta identificación de estos pacientes14. La identificación de pacientes se llevó a cabo exclusivamente mediante diagnósticos confirmados e indicados en la historia clínica, sin recurrir a inferencias médicas para la detección de casos de infección. Esto implica que aunque un paciente presente síntomas de la enfermedad o un resultado confirmado de PCR para SARS-CoV-2, dicho paciente no se ha identificado en nuestra población. Se asume esta limitación con la posibilidad de que se hayan pasado por alto algunos casos de la enfermedad.
La tabla 1 presenta las principales características demográficas y clínicas de estos 293.126 pacientes identificados. La edad media de la población de estudio fue de 56,8años (DE: 26,7), siendo 55,2años (DE: 26.4) para no fumadores, 56,8 (DE: 15,3) para fumadores y más elevada en el caso de exfumadores: 65,5 (DE: 15,3). Todas estas diferencias de edad fueron significativas. El 47% de los pacientes con SARS-CoV-2 en el SESCAM eran hombres.
Características clínicas y demográficas de los pacientes con diagnóstico de COVID
Total | No fumador | Fumador | Exfumador | Estadísticos (p)Nofu-fu/fu-exfu | |
---|---|---|---|---|---|
Pacientes, n | 293.126 | 252.388 | 17.646 | 23.092 | |
Edad, años | 56,8±26,7 | 55,2±26,4 | 56,8±15,3 | 65,5±15,3 | p<0,0001/p<0,0001 |
Hombres, n | 136.573 | 643.034 | 16.567 | 48.832 | |
Indicadores hospitalarios | |||||
Exitus hospitalario, n | 7.278 | 5.243 | 589 | 1.446 | p<0,00001/ p<0,00001 |
Pacientes con ingreso en la UCI, n | 148 | 99 | 13 | 36 | p=0,029717/p=0,017661 |
Media de hospitalización (días) | 4,29 | 4,34 | 4,02 | 4,32 | p<0,0001/p<0,0001 |
Comorbilidades | |||||
HTA, n | 75.444 | 51.601 | 8.003 | 15.840 | p<0,00001/ p<0,00001 |
Dislipemia, n | 61.846 | 41.093 | 7.207 | 13.546 | p<0,00001/ p<0,00001 |
Diabetes, n | 53.113 | 34.687 | 6.494 | 11.932 | p<0,00001/ p<0,00001 |
EPOC, n | 8.539 | 2.285 | 1.881 | 4.373 | p<0,00001/ p<0,00001 |
ASMA, n | 17.103 | 13.290 | 1.829 | 1.984 | p<0,00001/ p<0,00001 |
EPID, n | 542 | 259 | 82 | 201 | p<0,00001/ p<0,00001 |
Cardiopatía isquémica, n | 10.410 | 5.541 | 1.010 | 3.859 | p<0,00001/ p<0,00001 |
ECV, n | 7.148 | 4.765 | 668 | 1.715 | p<0,00001/ p<0,00001 |
TEP, n | 4.121 | 2.648 | 460 | 1.013 | p<0,00001/ p<0,00001 |
Cáncer, n | 5.958 | 3.329 | 946 | 1.683 | p<0,00001/ p<0,00001 |
Cáncer de pulmón, n | 904 | 299 | 186 | 419 | p<0,00001/ p<0,00001 |
Neumonía, n | 29.074 | 19.956 | 2.543 | 6.575 | p<0,00001/ p<0,00001 |
Bronquiectasias, n | 1.814 | 934 | 253 | 627 | p<0,00001/ p<0,00001 |
Insuficiencia cardíaca, n | 12.650 | 8.408 | 1.180 | 3.062 | p<0,00001/ p<0,00001 |
Corticoides, n | 31.355 | 24.366 | 3.081 | 3.908 | p<0,00001/ p=0,154707 |
Los test empleados fueron la t de Student en el caso de las variables cuantitativas y la chi-cuadrado en las cualitativas.
Se observó que los fumadores tienen mayor porcentaje de factores de riesgo cardiovascular (hipertensión arterial, dislipemia y diabetes), EPOC, asma, EPID, CI, ECV, TEP, cáncer en general y cáncer de pulmón en particular, bronquiectasias, insuficiencia cardíaca y antecedentes de neumonía (tablas 1 y 2). Todo esto de forma significativa (p<0,0001).
Resultados principales y comorbilidades absolutos y transformados en porcentajes, globales y por género en pacientes con diagnóstico de COVID
Población total 293.126 | Mujeres (53,4%) | Varones (46,6%) | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
Total | No fumador | Fumador | Ex fumador | Total | No fumador | Fumador | Ex fumador | Total | No fumador | Fumador | Ex fumador | |
Exitus | 7.278 (2,48%) | 5.243 (2,08%) | 589 (3,34%) | 1.446 (6,26%) | 3.575 (2,28%) | 3.058 (2,22%) | 337 (2,68%) | 180 (3,05%) | 1.718 (2,74%) | 2.207 (1,93%) | 256 (5,02%) | 1.275 (7,39%) |
UCI | 148 (0,05%) | 99 (0,04%) | 13 (0,07%) | 36 (0,02%) | 50 (0,03%) | 42 (0,03%) | 4 (0,03%) | 4 (0,07%) | 89 (0,07%) | 51 (0,04%) | 7 (0,14%) | 31 (0,18%) |
HTA | 75.444 (25,74%) | 51.601 (20,45%) | 8.003 (45,35%) | 15.840 (68,60%) | 38.613 (24,67%) | 30.664 (22,22%) | 5.005 (39,77%) | 2.944 (49,82%) | 36.823 (26,96%) | 20.929 (18,32%) | 2.998 (58,74%) | 12.896 (74,77%) |
Dislipemia | 75.444 (21,10%) | 41.093 (16,28%) | 7.207 (40,84%) | 13.546 (58,66%) | 31.719 (20,27%) | 26.090 (18,91%) | 4.542 (36,09%) | 1.087 (18,40%) | 30.125 (22,06%) | 24.688 (21,61%) | 2.665 (52,21%) | 2.772 (16,07%) |
Diabetes | 53.113 (18,12%) | 34.687 (13,74%) | 6.494 (36,80%) | 11.932 (51,67%) | 26.175 (16,73%) | 19.828 (14,37%) | 4.019 (31,93%) | 2.328 (39,40%) | 27.098 (19,84%) | 14.970 (13,11%) | 2.491 (48,80%) | 9.637 (55,88%) |
EPOC | 8.539 (2,91%) | 2.285 (0,91%) | 1.881 (10,66%) | 4.373 (18,94%) | 1.647 (1,05%) | 512 (0,37%) | 706 (5,61%) | 429 (7,26%) | 6.917 (5,06%) | 1.780 (1,56%) | 1.180 (23,12%) | 3.857 (22,94%) |
ASMA | 17.103 (5,83%) | 13.290 (5,27%) | 1.829 (10,36%) | 1.984 (8,59%) | 10.541 (6,74%) | 8.070 (5,85%) | 1.534 (12,19%) | 937 (15,86%) | 6.613 (4,84%) | 5.263 (4,61%) | 298 (5,84%) | 1.052 (6,10%) |
EPID | 542 (0,18%) | 259 (0,10%) | 82 (0,46%) | 201 (0,87% | 241 (0,15%) | 163 (0,12%) | 42 (0,33%) | 36 (0,61%) | 303 (0,22%) | 96 (0,08%) | 40 (0,78%) | 167 (0,97%) |
Cardiopatía isquémica | 10.410 (3,55%) | 5.541 (2,20%) | 1.010 (5,72%) | 3.859 (16,71%) | 3.498 (2,24%) | 2.682 (1,94%) | 425 (3,38%) | 391 (6,62%) | 6.955 (5,09%) | 2.880 (2,52%) | 588 (11,52%) | 3.487 (20,22%) |
ECV | 7.148 (2,44%) | 4.765 (1,89%) | 668 (3,79%) | 1.715 (7,43%) | 3.466 (2,21%) | 2.873 (2,08%) | 358 (2,84%) | 235 (3,98%) | 3.706 (2,71%) | 1.905 (1,67%) | 316 (6,19%) | 1.485 (8,61%) |
TEP | 4.121 (1,41%) | 2.648 (1,05%) | 460 (2,61%) | 1.013 (4,39%) | 2.114 (1,35%) | 1.659 (1,20%) | 272 (2,16%) | 183 (3,10%) | 2.018 (1,48%) | 994 (0,87%) | 190 (3,72%) | 834 (4,84%) |
Cáncer | 5.958 (2,03%) | 3.329 (1,32%) | 946 (5,36%) | 1.683 (7,23%) | 2.879 (1,84%) | 1.987 (1,44%) | 557 (4,43%) | 335 (5,67%) | 3.089 (2,26%) | 1.344 (1,18%) | 393 (7,70%) | 1.352 (7,84%) |
Cáncer pulmón | 904 (0,31%) | 299 (0,12%) | 186 (1,05%) | 419 (1,81%) | 260 (0,17%) | 145 (0,11%) | 69 (0,55%) | 46 (0,78%) | 646 (0,47%) | 155 (0,14%) | 117 (2,29%) | 374 (2,17%) |
Neumonía | 29.074 (9,92%) | 19.956 (7,91%) | 2.543 (14,41%) | 6.575 (28,47%) | 13.005 (8,31%) | 10.451 (7,57%) | 1.434 (11,39%) | 1.120 (18,95%) | 16.181 (11,85%) | 9.585 (8,39%) | 1.119 (21,92%) | 5.477 (31,76%) |
Bronquiectasias | 1.814 (0,62%) | 934 (0,37%) | 253 (1,43%) | 627 (2,72%) | 813 (0,52%) | 586 (0,42%) | 123 (0,98%) | 104 (1,76%) | 1.007 (0,74%) | 352 (0,31%) | 130 (2,55%) | 525 (3,04%) |
Insuficiencia cardíaca | 12.650 (4,32%) | 8.408 (3,33%) | 1.180 (6,69%) | 3.062 (13,26%) | 6.629 (4,24%) | 5.568 (4,03%) | 667 (5,30%) | 394 (6,67%) | 6.065 (4,44%) | 2.871 (2,51%) | 517 (10,13%) | 2.677 (15,52%) |
Corticoides | 31.355 (10,70%) | 24.366 (9,65%) | 3.081 (17,46%) | 3.908 (16,92%) | 19.573 (12,51%) | 15.399 (11,16%) | 2.568 (20,40%) | 1.606 (27,18%) | 11.782 (8,63%) | 8.967 (7,85%) | 513 (10,05%) | 2.302 (13,35%) |
En cuanto al uso de corticoides, fue porcentualmente mayor en los fumadores y exfumadores con respecto a los no fumadores (p<0,0001), no existiendo diferencias significativas entre los fumadores y lo exfumadores (p=0,15).
En todos los subgrupos, la estancia media hospitalaria fue de 4días. En cuanto a los ingresos en la UCI, el porcentaje de pacientes fumadores ingresados fue mayor que el de los no fumadores (p<0,03), siendo menor en los exfumadores respecto a los fumadores (p<0,02).
En cuanto al exitus hospitalario (fig. 1), fue mayor en el caso de los fumadores con respecto a los no fumadores, siendo los exfumadores los que presentaban mayor porcentaje (p<0,0001), si bien estos resultados pueden deberse a la mayor edad presentada en este último subgrupo.
En el caso de los hombres (tabla 2), la edad media era de 57años; la de los no fumadores, de 52; la de los fumadores, de 60, y la de los exfumadores, de 67 (estas diferencias fueron significativas). Al igual que en el global de la población de estudio, se observó un mayor porcentaje de todas las comorbilidades testadas en los fumadores frente a los no fumadores, así como en los ingresos en la UCI y en las muertes intrahospitalarias. Entre los fumadores y exfumadores no se observó un cambio significativo en el porcentaje de pacientes con EPOC, asma, EPID, cáncer y bronquiectasias, ni en el porcentaje de pacientes ingresados en la UCI, aunque sí hubo un cambio significativo a nivel de mortalidad intrahospitalaria y el resto de comorbilidades no mencionadas.
Cuando se tiene en cuenta la cohorte de mujeres (tabla 2), la edad media era de 56años, siendo de 57años en el caso de las no fumadoras, de 51 para las fumadoras y de 55 para las no fumadoras (las diferencias de edad fueron significativas). Las comorbilidades y las muertes aumentaron en las que habían tenido relación con el tabaco con respecto a las que no. Todas las comorbilidades también aumentaron de forma significativa entre las que dejaron de fumar y las que continuaban, excepto el cáncer de pulmón. Las muertes intrahospitalarias y los ingresos en la UCI tampoco aumentaron de forma significativa entre exfumadoras y fumadoras.
DiscusiónEste estudio tiene una importancia transcendental, ya que se ha utilizado a toda la población de Castilla-La Mancha, en vez de seleccionar una muestra de la misma. Así, se han podido verificar los diferentes porcentajes en las diferentes poblaciones de no fumadores, fumadores y exfumadores en los pacientes con diagnóstico de COVID en el SESCAM. En el estudio se observa que los fumadores tienen más proporción de comorbilidades que los no fumadores, y que los exfumadores tienen incluso una mayor proporción.
En cuanto a las muertes intrahospitalarias, eran mayores en los fumadores que en los no fumadores (p<0,0001). Estas muertes, además de por el tabaco en sí, podrían estar mediadas por el aumento de las comorbilidades. No se considera la edad como un factor influyente, ya que esta era prácticamente la misma entre los fumadores y los no fumadores (56,83±15,3 vs 55,2±26,4). En el caso del aumento de la mortalidad en los exfumadores, sí podría tener más peso el aumento de edad (65,52±15) como factor de riesgo para la mayoría de las comorbilidades y la mortalidad. Este efecto ya se vio en un metaanálisis publicado en el año 2022, donde se observaba un aumento de mortalidad en fumadores y en exfumadores19. El aumento relativo de la mortalidad en los exfumadores respecto a los otros se puede explicar por este incremento de edad.
En cuanto a la edad teniendo en cuenta el estudio sobre mujeres, se puede observar que las fumadoras y exfumadoras presentan más mortalidad y comorbilidades que las no fumadoras, a pesar de ser 6años más jóvenes las fumadoras y 2años las exfumadoras. Refuerza la idea de la relación entre el tabaquismo y las comorbilidades, como ya se ha observado en diferentes estudios20-22.
En este estudio se confirman los aspectos observados en revisiones anteriores, donde se relacionaba el tabaco actual y pasado con el aumento de ingresos en la UCI y el de muertes23,24. Hay que destacar en España el estudio SEMI-COVID25, donde se registraron más de 14.000 pacientes que estuvieron hospitalizados durante los primeros meses de la pandemia y se vio, como en este estudio, que la mortalidad hospitalaria está asociada al hecho de fumar o haber fumado. Además, el fumar o haber fumado se observó que era factor independiente para un peor pronóstico en estos pacientes.
Este trabajo es coherente con diferentes metaanálisis, como se ha demostrado, pero también con estudios casos-controles, como el de Irán26, o con cohortes inglesas27. Es el estudio que ha tenido en cuenta a la mayor muestra de pacientes infectados con el virus SARS-CoV-2, con 293.126 enfermos.
Los resultados obtenidos no respaldan la polémica hipótesis que se inició al principio de la pandemia, en la que se especuló que el tabaco podía ser un factor protector contra la infección por COVID28,29.
Se observan otras consistencias importantes con el conocimiento actual de la medicina y con la literatura previa. Siendo el tabaquismo el principal factor de riesgo para desarrollar EPOC30, sería esperable que el porcentaje de no fumadores que desarrollan esta enfermedad fuera mínimo. Con los datos se comprueba que es menor al 1% de la población estudiada (0,91%), mientras que en fumadores y exfumadores sobrepasa el 10% (10,66% y 18,94%, respectivamente). Pasa algo parecido con el cáncer de pulmón, una patología en la que el tabaquismo es un factor de riesgo muy importante31, siendo del 0,12% la proporción en no fumadores.
Hay que considerar que es un estudio retrospectivo y observacional; sin embargo, la principal fortaleza de esta metodología basada en datos es que no existe un sesgo en la selección de la población a nivel hospitalario, a diferencia de los estudios observacionales tradicionales. La aplicación de PLN en las historias clínicas permite analizar el curso clínico completo de los pacientes del centro participante, por lo que el número de pacientes es la cantidad total de pacientes existentes, incluidos aquellos pacientes fallecidos o sin seguimiento; la naturaleza de la información no está influenciada por el estudio o el observador, y el número de variables es tan grande como la cantidad total de información clínica recopilada a lo largo de los contactos previos con el centro.
A pesar de ser una herramienta novedosa, ya se ha visto la utilidad práctica en este tipo de estudios, como por ejemplo en el análisis que se realizó en pacientes con EPOC de Castilla-La Mancha y que concluyó que había importantes deficiencias tanto en el diagnóstico como en el tratamiento de esta enfermedad32, por lo que esta tecnología tiene importantes aplicaciones diagnósticas y pronósticas33,34.
En cuanto a las limitaciones, al tratarse de un estudio basado en Big Data, el número potencial de variables a incluir se limita exclusivamente a la información contenida en las HCE. Además, la falta de estandarización en las HCE en cuanto al tipo de datos recogidos, el uso de terminología médica estándar frente a la propia y la omisión de información o el mal uso de las secciones en las HCE son posibles limitaciones. Estas limitaciones se ven compensadas por la gran cantidad de pacientes incluidos y por la enorme cantidad de datos que maneja esta tecnología.
En conclusión, existe un mayor riesgo de mortalidad hospitalaria o ingreso en la UCI en los pacientes infectados por SARS-CoV-2 que sean fumadores activos o hayan fumado en el pasado. Además, estos pacientes presentan un aumento de comorbilidades importantes con respecto a los no fumadores. Probablemente, estas relaciones no se puedan explicar completamente por la diferencia de edad.
FinanciaciónEsta investigación no recibió financiación de entidades públicas, comerciales ni sin ánimo de lucro.
Conflicto de interesesLos autores declaran carecer de conflictos de intereses.
AgradecimientosAgradecemos la colaboración a SAVANA para la elaboración de este artículo.