Logran reducir el sesgo de los algoritmos de la IA, uno de los grandes riesgos en investigación

Los sistemas avanzados de inteligencia artificial (IA) se han mostrado prometedores a la hora de revolucionar el campo de la patología mediante la transformación de la detección, el diagnóstico y el tratamiento de enfermedades; sin embargo, la subrepresentación de determinadas poblaciones de pacientes en los conjuntos de datos de patología utilizados para desarrollar modelos de IA puede limitar la calidad general de su desempeño y ampliar las disparidades en salud.

Un nuevo estudio dirigido por investigadores del Mass General Brigham (Estados Unidos) destaca que los sistemas de patología computacional estándar funcionan de manera diferente según los perfiles demográficos asociados con las imágenes histológicas, pero que los "modelos básicos" más grandes pueden ayudar a mitigar en parte estas disparidades. Los hallazgos, publicados en 'Nature Medicine', enfatizan la necesidad de conjuntos de datos de entrenamiento más diversos y evaluaciones estratificadas demográficamente de los sistemas de IA para garantizar que todos los grupos de pacientes se beneficien equitativamente de su uso.

"No ha habido un análisis exhaustivo del rendimiento de los algoritmos de IA en patología que estén estratificados en diversos datos demográficos de pacientes con datos de pruebas independientes", relata el autor correspondiente Faisal Mahmood, de la División de Patología Computacional del Departamento de Patología de Mass General Brigham.

"Este estudio, basado tanto en conjuntos de datos disponibles públicamente, que se utilizan ampliamente para la investigación de IA en patología, como en cohortes internas de Mass General Brigham, revela marcadas diferencias de desempeño para pacientes de diferentes razas, tipos de seguro y grupos de edad. Con el mismo demostramos que los modelos avanzados de aprendizaje profundo entrenados de manera autosupervisada conocidos como "modelos básicos" pueden reducir estas diferencias en el rendimiento y mejorar la precisión".

Basándose en datos del atlas del genoma del cáncer y del atlas de tumores cerebrales EBRAINS, ampliamente utilizados, que incluyen predominantemente datos de pacientes blancos, los investigadores desarrollaron modelos de patología computacional para la subtipificación del cáncer de mama, la subtipificación del cáncer de pulmón y la predicción de la mutación IDH1 del glioma (un factor importante en la terapia). respuesta). Cuando los investigadores probaron la precisión de estos modelos utilizando portaobjetos de histología de más de 4.300 pacientes con cáncer en Mass General Brigham y el Cancer Genome Atlas, y estratificaron los resultados por raza, encontraron que los modelos funcionaban con mayor precisión en pacientes blancos que en pacientes negros. Los modelos que el equipo probó para subtipificar los cánceres de mama y de pulmón y predecir la mutación IDH1 en el glioma encontraron disparidades respectivas de 3,7, 10,9 y 16 por ciento en la producción de clasificaciones correctas.

Los investigadores buscaron reducir las disparidades observadas con métodos estándar de aprendizaje automático para mitigar los sesgos, como enfatizar ejemplos de grupos subrepresentados durante el entrenamiento del modelo; sin embargo, estos métodos sólo redujeron marginalmente el sesgo. En cambio, las disparidades se redujeron mediante el uso de modelos básicos autosupervisados , que son una forma emergente de IA avanzada entrenada en grandes conjuntos de datos para realizar una amplia gama de tareas clínicas. Estos modelos codifican representaciones más ricas de imágenes histológicas que pueden reducir la probabilidad de sesgo del modelo.

A pesar de las mejoras observadas, las brechas en el rendimiento aún eran evidentes, lo que refleja la necesidad de seguir perfeccionando los modelos básicos en patología. Además, el estudio estuvo limitado por un pequeño número de pacientes de algunos grupos demográficos. Los investigadores están llevando a cabo investigaciones en curso sobre cómo los modelos básicos multimodales, que incorporan múltiples formas de datos, como la genómica o los registros médicos electrónicos, pueden mejorar estos modelos.

La aparición de herramientas de inteligencia artificial en la medicina tiene el potencial de remodelar positivamente la prestación de atención. No obstante, es imperativo equilibrar el potencial innovador de la IA con un compromiso con la calidad y la seguridad. De esta forma, Mass General Brigham está liderando el camino en IA responsable, llevando a cabo investigaciones rigurosas sobre tecnologías nuevas y emergentes para informar la incorporación de la IA en la medicina.

"En general, los hallazgos de este estudio representan un llamado a la acción para desarrollar modelos de IA más equitativos en medicina", expone Mahmood. "Es un llamado a la acción para que los científicos utilicen conjuntos de datos más diversos en la investigación, pero también un llamado para que las agencias regulatorias y políticas incluyan evaluaciones estratificadas demográficamente de estos modelos en sus pautas de evaluación antes de aprobarlos e implementarlos, para garantizar que los sistemas de IA beneficiar a todos los grupos de pacientes de manera equitativa", concluyen los investigadores.