Estudio advierte que modelos de IA médica pueden filtrar datos sensibles de pacientes, con mayor riesgo para minorías

Ciudad de Mexico, 25 de junio de 2026.- Un artículo publicado en la revista Nature asegura que se ha subestimado el riesgo de que se filtren los datos con los que se entrena la inteligencia artificial (IA) médica. El estudio pide aumentar el control sobre las grandes bases de datos médicos, ya que la seguridad de estos sistemas se encuentra comprometida ante ciertos tipos de ataques.

Según la investigación, el historial médico de una persona normativa se difumina entre la ingente cantidad de datos de estas bases, pero las realidades de las minorías destacan y se pueden encontrar fácilmente. Minorías raciales, personas con enfermedades raras, no binarias o económicamente desfavorecidas son fácilmente identificables, por lo que sus datos están expuestos de manera desproporcionada a ataques contra la privacidad.

Los autores utilizaron siete grandes bases de datos clínicos que incluyen imágenes médicas, electrocardiogramas e historiales médicos para llevar a cabo ataques de inferencia de pertenencia (MIA). Estos métodos hacen preguntas y observan las respuestas para averiguar si un dato concreto fue utilizado para entrenar un sistema, aprovechando que la IA es mucho más habladora y concreta cuando se le pregunta por casos que ha visto durante su entrenamiento.

Analizando las diferencias en sus respuestas, es posible inferir si se ha usado la historia de una persona concreta para entrenar a la IA. Moritz Knolle, investigador del Institute for AI in Healthcare & Medicine de Múnich y autor principal del estudio, señaló que “estos ataques pueden ejecutarse con éxito utilizando recursos computacionales mínimos”.

Knolle agregó: “Por lo tanto, consideramos que es factible realizar este tipo de ataques en el mundo real”. El éxito de los MIAs aumenta considerablemente en las grandes bases de datos, lo que representa una paradoja dado que gran parte de los avances de la IA se deben al aumento del tamaño de los conjuntos de datos.

Los autores del estudio concluyeron que “cuanto más grandes son los modelos, mayores son los riesgos”. A medida que las bases son cada vez más grandes y sus respuestas más certeras, su seguridad se vuelve más vulnerable ante estos mecanismos de inferencia.