Con el objetivo de definir las características clínicas de los pacientes de coronavirus que requieren cuidados intensivos, un grupo de investigadores españoles ha puesto en marcha el estudio ‘Big COVIData’, que analiza las historias clínicas electrónicas de miles de pacientes positivos en COVID-19 a través de Machine Learning y Procesamiento del Lenguaje Natural clínico (cNLP).
Así, este estudio, el primero internacional de este tipo, está basado en el empleo Big Data, Inteligencia Artificial y procesamiento de lenguaje natural, e incluye además un modelo predictivo generado a partir de datos reales extraídos automáticamente del texto libre de la historia clínica anonimizada, que puede ayudar a los profesionales sanitarios a prever qué pacientes van a requerir ingreso en UCI.
Dirigido por los doctores José Luis Izquierdo, del Hospital Universitario de Guadalajara, y Joan B. Soriano y Julio Ancochea, del Hospital La Princesa de Madrid, esate estudio, cuyos resultados preliminares ya se han publicado, utiliza la tecnología ‘EHRead’ de la compañía Savana para extraer conocimiento de los textos de las historias clínicas electrónicas previamente anonimizadas, lo que permite reducir significativamente el tiempo empleado y analizar una cohorte de pacientes que de la manera tradicional resultaría casi imposible, ya que los pacientes estaban analizados sólo 3 semanas después de su visita.
En este primer corte, a través del análisis de los datos anonimizados recogidos en el SESCAM (Servicio de Salud de Castilla-La Mancha) de 10.504 pacientes con diagnóstico clínico o PCR confirmada por COVID-19, se constata que los síntomas más frecuentes de los ingresos hospitalarios son la tos, la fiebre y la disnea, aunque se dan en menos del 50% de pacientes. Entre las comorbilidades más comunes que presentan los pacientes afectados por COVID-19 se encuentran las enfermedades cardiovasculares, especialmente la hipertensión.
De acuerdo con los resultados del modelo predictivo elaborado, de los pacientes hospitalizados por coronavirus el 6% requieren el ingreso en UCI. Los factores más frecuentes que se asocian a dicho ingreso son la edad (principalmente mayores de 58 años), la presencia de fiebre mayor de 39ºC (o menor de 39ºC con problemas respiratorios, específicamente crepitantes) y especialmente la taquipnea (más de 20 respiraciones por minuto), tanto cuando el paciente es atendido en medio hospitalario como en Atención Primaria.
Tal y como destaca el Dr. Izquierdo, “se ha identificado que la combinación de tres variables clínicas fácilmente medibles en el diagnóstico son claves a la hora de identificar qué pacientes tienen peor pronóstico. Este dato es muy útil y los profesionales sanitarios de todo el mundo pueden incorporarlo fácilmente a sus práctica clínica, ya que dichos tres factores pronósticos son indicadores claros para remitir a estos pacientes a los hospitales lo antes posible (antes de que la condición empeore) sin tener que someterlos a pruebas ni requerir materiales inaccesibles”.
Por su parte, el Dr. Soriano indica que “para el estudio del actual brote de COVID-19, los métodos clásicos habrían requerido meses de recopilación de datos mediante prolijos cuestionarios y su validación, junto con múltiples aprobaciones (retrasos) de los respectivos Comités de Ética, además de otros problemas prácticos. El estudio ‘Big COVIData‘ superó todos estos obstáculos en días, y con la máxima calidad”.
Este análisis se está extendiendo paulatinamente a otros hospitales de España, al resto Europa y América del Norte. En una segunda fase del proyecto se tratará de responder a muchas más preguntas, algunas referidas a los tratamientos, aumentando así el conocimiento científico y ayudando a mejorar el manejo clínico de los pacientes y su tratamiento. En este sentido, desde Savana invita a todas las instituciones y autoridades sanitarias, tanto nacionales como internacionales, a formar parte de este estudio observacional descriptivo, ya que cuantos más centros participen, más beneficios arrojará a nivel global.
Savana es la primera empresa en el mundo que ha desarrollado un modelo de Inteligencia Artificial capaz de interpretar de forma significativa el texto libre de las historias clínicas digitales en castellano, francés, alemán e inglés, independientemente del sistema informático en en el que funcionen. Gracias a la frecuente actualización de los datos de las historias clínicas electrónicas recibidas de los hospitales y sistemas de salud regionales que forman parte de la Red de Investigación de Savana, sus modelos de cNLP están entrenados para leer la terminología y los conceptos más relevantes sobre COVID-19.