Tecnología

Yoshua Bengio, premio Turing, alerta: "Hay evidencia de IAs que actúan contra nuestras instrucciones"

El pionero del aprendizaje profundo y presidente del International AI Safety Report advierte que las capacidades de la inteligencia artificial avanzan a un ritmo superior al de las prácticas de gestión del riesgo, mientras se documentan casos de laboratorio donde los sistemas muestran comportamientos preocupantes, incluida la tendencia a preservarse a sí mismos y a ser engañosos.

TECNOLOGÍA3 FEB 2026

Yoshua Bengio, científico canadiense de 64 años y uno de los pioneros en el desarrollo del aprendizaje profundo (deep learning), ha encendido las alarmas sobre los riesgos emergentes de la inteligencia artificial (IA). En una entrevista concedida a El País, Bengio, quien recibió el prestigioso premio Turing en 2018 junto a Yann LeCun y Geoffrey Hinton, señala que existen "evidencias empíricas e incidentes de laboratorio en los que la IA actúa en contra de nuestras instrucciones".

Como presidente del International AI Safety Report, cuya segunda edición se publica este martes, Bengio destaca dos señales particularmente preocupantes: "El avance continuo de las capacidades de la IA, más específicamente en el razonamiento, lo que incluye la capacidad de elaborar estrategias para alcanzar objetivos" y, simultáneamente, "evidencias empíricas e incidentes de laboratorio en los que las IAs actúan en contra de nuestras instrucciones y, en algunos casos, con una aparente tendencia a preservarse a sí mismas y a estar dispuestas a ser engañosas para evitar nuestra supervisión".

El científico, profesor en la Universidad de Montreal, subraya que aunque el riesgo de pérdida de control sobre estos sistemas es emergente y su probabilidad difícil de estimar, "si ocurriera, podría ser catastrófico". Esta posibilidad, según Bengio, exige mayor seguimiento e investigación para entender por qué está ocurriendo y cómo puede mitigarse.

Otro de los riesgos que destaca el experto es la manipulación de la opinión pública. "La calidad del contenido generado por la IA es cada vez más difícil de distinguir del contenido real", advierte Bengio, añadiendo que estudios recogidos en el informe muestran que "los modelos de frontera —los más potentes— son al menos tan buenos como los humanos en persuasión". Esto plantea un "riesgo real de una influencia a gran escala sobre la opinión pública, porque estos bots pueden multiplicarse y llegar a millones".

Bengio también expresa preocupación por el impacto de la IA en las capacidades cognitivas humanas. Aunque reconoce que la IA puede ser útil como asistente, advierte que "puede volverse problemático si las decisiones las toma realmente la IA y la persona se convierte en un actor pasivo en el proceso de toma de decisiones". Esto podría llevar a un deterioro de capacidades, especialmente en niños, y conecta con el problema de la pérdida de control.

El científico menciona además el problema de la "complacencia o adulación", donde "la IA no te dice la verdad, sino lo que quiere oír el usuario", lo que ya está causando problemas de salud mental al reforzar delirios en lugar de cuestionarlos, similar a lo que ocurre en las burbujas de las redes sociales.

Respecto a las medidas de seguridad implementadas por las grandes empresas desarrolladoras, Bengio reconoce avances significativos en el último año, con más compañías aplicando gestión explícita del riesgo y colaborando en foros como el Frontier Model Forum. También destaca los avances legislativos en Europa, Estados Unidos y China. Sin embargo, advierte que "las capacidades de la IA avanzan a un ritmo que parece superior al de las prácticas de gestión del riesgo".

Sobre la regulación europea, Bengio opina que los requisitos del Reglamento de IA de la UE "no suponen una carga excesiva" para las grandes empresas, ya que muchas ya estaban implementando prácticas similares. En su opinión, el retraso de Europa en este campo no se debe a la regulación sino a "la falta de inversión a gran escala, una mayor aversión al riesgo y factores estructurales de la economía europea".

Ante la pregunta sobre la posibilidad de establecer un marco internacional similar al tratado de no proliferación nuclear, Bengio reconoce la dificultad debido a la percepción de competencia entre países y empresas. Sin embargo, espera que la evidencia científica ayude a los gobiernos a comprender que está en su propio interés buscar una coordinación internacional para mitigar estos riesgos.

Finalmente, el científico reflexiona sobre cómo la "cognición motivada" puede cegarnos ante la realidad, impulsados consciente o inconscientemente por la codicia y la soberbia, incluso cuando creemos estar haciendo lo correcto. "No es necesariamente porque la persona tenga malas intenciones. De hecho, puede pensar sinceramente que está haciendo lo correcto. Pero no es necesariamente racional, ni siquiera está anclado en los valores que la persona profesa. Eso nos incluye a todos, incluido yo. Es algo humano", concluye Bengio según El País.

SIGUE LEYENDO
MÁS DE TECNOLOGÍA
Yoshua Bengio, premio Turing, alerta: "Hay evidencia de IAs que actúan contra nuestras instrucciones" · ColGlobal