Ciencia

Casi 3.000 artículos médicos contienen citas falsas fabricadas con inteligencia artificial

Una auditoría de la Universidad de Columbia reveló que 2.810 artículos médicos revisados por pares contienen 4.046 citas falsas que no existen en ninguna base de datos científica, según un estudio publicado en The Lancet el 7 de mayo de 2026. La tasa de fabricación de referencias se multiplicó por 12 desde 2023, alcanzando 57 citas falsas por cada 10.000 artículos a principios de 2026, un aumento que coincide con la adopción masiva de herramientas de escritura basadas en inteligencia artificial.

CIENCIA8 MAY 2026

Un equipo de investigadores de la Escuela de Enfermería de la Universidad de Columbia desarrolló un sistema automatizado de verificación de referencias asistido por inteligencia artificial que escaneó 2,5 millones de artículos publicados entre el 1 de enero de 2023 y el 18 de febrero de 2026 en PubMed Central Open Access, según el estudio publicado en The Lancet. De 97,1 millones de referencias verificadas, identificaron 4.046 citas falsas distribuidas en 2.810 artículos.

La tasa de fabricación permaneció estable en aproximadamente 4 citas por cada 10.000 artículos durante 2023, según los datos del estudio. A partir de mediados de 2024, la tasa aumentó drásticamente hasta alcanzar aproximadamente 51,3 por cada 10.000 artículos a finales de 2025 y 56,9 por cada 10.000 en las primeras siete semanas de 2026. En 2023, aproximadamente uno de cada 2.828 artículos contenía al menos una referencia ficticia, cifra que escaló a uno de cada 458 en 2025 y uno de cada 277 en el período inicial de 2026.

"Este descubrimiento impacta directamente a los pacientes, ya que los profesionales médicos toman decisiones de tratamiento basadas en guías clínicas", dijo Maxim Topaz, profesor asociado en la Escuela de Enfermería y el Instituto de Ciencia de Datos de la Universidad de Columbia, quien lideró el estudio. "Un profesional médico o desarrollador de guías clínicas no tiene forma de saber que la evidencia en la que confía no existe. Por ejemplo, un artículo que revisamos tenía 18 de 30 referencias falsas. Algunas de esas citas ya están siendo citadas por otros artículos y aparecen en revisiones sistemáticas que informan la atención clínica", agregó según el comunicado de la universidad.

Para realizar el análisis, el equipo de investigación recuperó el registro bibliográfico del identificador reclamado de PubMed y Crossref para cada referencia verificada y lo comparó con los metadatos reclamados del artículo citante, utilizando puntuación de similitud de texto, según la metodología descrita en el estudio. Las referencias marcadas pasaron por filtros secuenciales para reducir resultados falsos positivos. Después del filtrado, las referencias se verificaron contra PubMed, Crossref, OpenAlex y Google Scholar. Una referencia no encontrada en ninguna base de datos se caracterizó como fabricada, y una encontrada pero vinculada a un identificador incorrecto se consideró un error de referencia. La precisión del sistema automatizado de verificación de referencias fue del 91 por ciento.

"Las referencias fabricadas (referencias cuyos títulos reclamados no corresponden a ninguna publicación existente) pueden surgir de la actividad de fábricas de artículos, conducta intencional indebida o uso acrítico de herramientas de escritura de inteligencia artificial", escribieron los autores del estudio. "Los modelos de lenguaje de gran escala generan referencias de sonido plausible pero ficticias, un modo de falla bien documentado; estudios previos estiman que entre el 30 y el 69 por ciento de las referencias generadas por modelos de lenguaje de gran escala en contextos biomédicos son fabricadas", añadieron.

Los artículos de revisión presentaron una tasa de fabricación 57 por ciento más alta que otros tipos de artículos, con 16,7 frente a 10,6 por cada 10.000 artículos, según los hallazgos. Del total de 2.564 artículos afectados, el 91 por ciento tenía una o dos referencias fabricadas, mientras que 246 contenían al menos tres.

En un artículo de 2025 sobre técnicas de anastomosis ureteroileal (derivación urinaria) en una revista oncológica de acceso abierto, el 60 por ciento de 30 referencias verificadas eran inventadas, según un ejemplo citado en el estudio. "Cada referencia fabricada estaba adaptada al tema quirúrgico específico del artículo, atribuida a urólogos reales y llevaba años de publicación reclamados de 2023 o 2024", escribieron los autores.

El equipo identificó patrones consistentes con fábricas de artículos, operaciones comerciales que venden manuscritos fraudulentos o de baja calidad. Por ejemplo, los mismos dos autores fueron coautores principales en 11 artículos en una sola revista quirúrgica en 2025, con 15 referencias fabricadas sobre diagnósticos CRISPR (edición genética), nanovacunas guiadas por inteligencia artificial y biomarcadores del microbioma intestinal, según el estudio.

Las referencias falsas identificadas no eran obviamente incorrectas y eran tópicamente específicas, correctamente formateadas, atribuidas a investigadores de la vida real y llevaban fechas de publicación plausibles, señalaron los autores. "Revisiones sistemáticas han encontrado que aproximadamente una de cada cuatro referencias en artículos de revistas médicas contiene errores, confirmando que la verificación de referencias no es estándar en la revisión por pares", escribieron.

El aumento pronunciado de referencias inventadas en 2024 coincidió con el retraso de publicación esperado después del uso generalizado de modelos de lenguaje de gran escala, aunque una mayor actividad de fábricas de artículos y cambios en la indexación de revistas también podrían haber sido factores contribuyentes, dijeron los investigadores. "Los modelos de lenguaje de gran escala se volvieron ampliamente disponibles a finales de 2022 y 2023; con tiempos de envío a publicación de 100 a 200 días, los artículos asistidos por modelos de lenguaje de gran escala aparecerían en PubMed Central desde mediados de 2024 en adelante", escribieron.

Al momento de la auditoría, el 98,4 por ciento de los artículos afectados no habían recibido ninguna acción por parte de los editores, según el estudio.

Basándose en sus hallazgos, los autores recomiendan que los editores verifiquen las referencias con cada envío de artículo. También recomiendan que los servicios de indexación agreguen metadatos a los registros para que los usuarios puedan evaluar la precisión de las referencias. Por último, el equipo de investigación insta a las principales bases de datos de integridad de la investigación a establecer una categoría dedicada para referencias falsas que permita el seguimiento sistemático y la rendición de cuentas. Hacen un llamado a los editores para que examinen retroactivamente las publicaciones existentes y emitan correcciones o retractaciones donde las referencias falsas comprometan las conclusiones de un artículo.

"Cuando las referencias apuntan a estudios inexistentes, la evidencia que afirman respaldar es ficticia", concluyeron. "La verificación automatizada rutinaria puede cerrar esta brecha antes de que las referencias fabricadas lleguen al registro publicado".

En un comentario adjunto, Howard Bauchner, de la Escuela de Medicina Chobanian y Avedisian de la Universidad de Boston, y Frederick Rivara, de la Universidad de Washington, dijeron que el estudio arroja luz sobre un tema muy perturbador y subraya la necesidad de mantener y mejorar la integridad de la investigación. "Dado que la confianza pública en la ciencia parece estar disminuyendo en países de todo el mundo, se necesitan esfuerzos renovados para mejorar la integridad de la investigación. Los autores deben asumir la responsabilidad y ser responsables del contenido completo de un manuscrito, incluidas las referencias", escribieron.

Los otros autores del estudio son Nir Roguin, del Centro Médico Tel Aviv Sourasky y la Facultad de Ciencias de la Salud de la Universidad Ben-Gurion del Negev; Pallavi Gupta y Zhihong Zhang, de la Escuela de Enfermería de la Universidad de Columbia; y Laura-Maria Peltonen, del Departamento de Gestión de Salud y Social de la Universidad de Finlandia Oriental, Servicios de Bienestar del Condado de Savo del Norte, Servicios de Bienestar del Condado del Suroeste de Finlandia y Departamento de Ciencias de Enfermería de la Universidad de Turku.

La carta de investigación revisada por pares, titulada "Fabricated citations: an audit across 2·5 million biomedical papers", fue publicada en The Lancet el 7 de mayo de 2026. Las cartas de investigación publicadas en la sección de Correspondencia incluyen hallazgos de investigación y son revisadas externamente por pares. A diferencia de los artículos que contienen datos originales, las cartas de investigación son más cortas y la investigación que contienen suele ser preliminar, exploratoria o informar sobre hallazgos tempranos, según la descripción de la publicación.

SIGUE LEYENDO

MÁS DE CIENCIA →