Suggestions
Share
Journal Information
Visits
112
Original Breve
Available online 15 December 2025
Integración de modelos de lenguaje natural en el diagnóstico de enfermedades autoinmunes sistémicas: validación de GPT-4 en un centro de tercer nivel
Integration of natural language models in the diagnosis of systemic autoimmune diseases: Validation of GPT-4 in a tertiary care center
Visits
112
A. Carrasco Larañaa,
Corresponding author
anacarrascolarana@gmail.com

Autor para correspondencia.
, J. Álvarez Troncosoa,b, J.J. Ríos Blancoa,b
a Universidad Autónoma de Madrid, Madrid, España
b Unidad de Enfermedades Inmunomediadas Sistémicas, Servicio Medicina Interna, Hospital Universitario La Paz, Madrid, España
This item has received
Article information
Abstract
Full Text
Bibliography
Download PDF
Statistics
Figures (3)
Show moreShow less
Resumen
Introducción

Las enfermedades autoinmunes sistémicas (EAS) constituyen un reto diagnóstico debido a la heterogeneidad de sus manifestaciones y a la frecuente superposición de síntomas. La integración de modelos de lenguaje de gran escala (LLM), como GPT-4, podría complementar el juicio clínico mediante el análisis sistemático de datos clínicos estandarizados.

Objetivo

Evaluar la capacidad diagnóstica de GPT-4 en los pacientes con EAS en un centro de tercer nivel, comparando sus resultados con el diagnóstico definitivo de consenso emitido por especialistas.

Métodos

Se realizó un estudio retrospectivo sobre una cohorte de 101 pacientes atendidos de forma consecutiva entre el 1 de enero y el 31 de marzo de 2024 en la Unidad de EAS del Hospital Universitario La Paz. La recolección de datos se efectuó aplicando el protocolo de anamnesis estandarizado de la unidad. El modelo «my GPT», basado en GPT-4 y entrenado conforme a criterios diagnósticos internacionales, fue evaluado siguiendo las directrices TRIPOD-AI.

Resultados

La tasa global de aciertos diagnósticos fue del 97,03%. El análisis basado exclusivamente en los datos de la anamnesis alcanzó una precisión del 82,18%, la cual se incrementó en un 14,85% al incorporar los resultados inmunológicos. Se obtuvo una precisión del 100% en el diagnóstico de lupus eritematoso sistémico, enfermedad de Sjögren, miopatías inflamatorias, enfermedad de Behçet y esclerodermia. En contraste, para sarcoidosis y vasculitis, entidades que frecuentemente requieren confirmación histológica, la precisión fue del 91,67 y 80%, respectivamente.

Conclusión

El uso de GPT-4, fundamentado en una recopilación de datos clínicos sistemática y evaluado conforme a las guías TRIPOD-AI, demuestra un alto potencial como herramienta auxiliar en el diagnóstico de las EAS. La integración de este enfoque en la práctica clínica podría contribuir a reducir la variabilidad interobservador y a optimizar la toma de decisiones.

Palabras clave:
Enfermedades autoinmunes sistémicas
LLM
GPT-4
Diagnóstico asistido por IA
Abstract
Introduction

Systemic autoimmune diseases (SADs) pose a diagnostic challenge due to the heterogeneity of their manifestations and the frequent overlap of symptoms. The integration of large language models (LLMs), such as GPT-4, could complement clinical judgment through the systematic analysis of standardized clinical data.

Objective

To evaluate the diagnostic capability of GPT-4 in patients with SADs at a tertiary care center, comparing its results with the final consensus diagnosis issued by specialists.

Methods

A retrospective study was conducted on a cohort of 101 consecutively treated patients between January 1 and March 31, 2024, at the SAD Unit of La Paz University Hospital. Data collection was carried out using the unit's standardized anamnesis protocol. The “my GPT” model, based on GPT-4 and trained according to international diagnostic criteria, was evaluated following TRIPOD-AI guidelines.

Results

The overall diagnostic accuracy rate was 97.03%. Analysis based solely on anamnesis data achieved an accuracy of 82.18%, which increased by 14.85% when immunological results were included. A 100% accuracy was achieved in diagnosing systemic lupus erythematosus, Sjögren's syndrome, inflammatory myopathies, Behçet's disease, and scleroderma. In contrast, for sarcoidosis and vasculitis —conditions that often require histological confirmation— accuracy was 91.67% and 80%, respectively.

Conclusion

The use of GPT-4, grounded in systematic clinical data collection and evaluated in accordance with TRIPOD-AI guidelines, demonstrates strong potential as an auxiliary tool in the diagnosis of SADs. Integrating this approach into clinical practice could help reduce interobserver variability and optimize decision-making.

Keywords:
Systemic autoimmune diseases
LLM
GPT-4
AI-assisted diagnosis
Graphical abstract

Article

These are the options to access the full texts of the publication Revista Clínica Española (English Edition)
Member
Si es usted socio de FESEMI siga los siguientes pasos:

Diríjase desde aquí a la web de la >>>FESEMI<<< e inicie sesión mediante el formulario que se encuentra en la barra superior, pulsando sobre el candado.

Una vez autentificado, en la misma web de FESEMI, en el menú superior, elija la opción deseada.

>>>FESEMI<<<

Subscriber
Subscriber

If you already have your login data, please click here .

If you have forgotten your password you can you can recover it by clicking here and selecting the option “I have forgotten my password”
Subscribe
Subscribe to

Revista Clínica Española (English Edition)

Purchase
Purchase article

Purchasing article the PDF version will be downloaded

Purchase now
Contact
Phone for subscriptions and reporting of errors
From Monday to Friday from 9 a.m. to 6 p.m. (GMT + 1) except for the months of July and August which will be from 9 a.m. to 3 p.m.
Calls from Spain
932 415 960
Calls from outside Spain
+34 932 415 960
Email
Idiomas
Revista Clínica Española (English Edition)
Article options
Tools