Investigadores de la Universidad de Chicago han desarrollado un sistema que combina inteligencia artificial multimodal con estimulación muscular eléctrica para guiar físicamente a las personas en tareas desconocidas, desde abrir envases con mecanismos de seguridad hasta operar cámaras nunca antes utilizadas. El trabajo, galardonado con el premio al Mejor Artículo en la conferencia ACM CHI 2026, representa un salto desde sistemas especializados hacia asistencia física de propósito general que se adapta al contexto en tiempo real.
Los estudiantes de doctorado Yun Ho y Romain Nith, bajo la supervisión del profesor asociado Pedro Lopes en el Departamento de Ciencias de la Computación de la Universidad de Chicago, han creado un sistema que marca un cambio fundamental en cómo las máquinas pueden asistir físicamente a los humanos, según informó la universidad.
El sistema utiliza estimulación muscular eléctrica (EMS, por sus siglas en inglés) combinada con modelos de inteligencia artificial multimodal, incluyendo visión computacional similar a CLIP y razonamiento de nivel GPT-4, para generar guías de movimiento adaptadas al momento específico, según la investigación presentada en la conferencia ACM CHI 2026.
De sistemas especializados a asistencia adaptativa
La estimulación muscular eléctrica no es nueva. Durante años, investigadores han utilizado electrodos conectados a cuerpos humanos que entregan corrientes controladas para enseñar secuencias de piano, demostrar lenguaje de señas o apoyar rehabilitación tras accidentes cerebrovasculares, según el equipo de investigación.
Sin embargo, estos sistemas han sido "altamente especializados, fijos y no contextuales", según describen los autores en su trabajo. Las instrucciones musculares solo funcionaban para situaciones que un diseñador había anticipado previamente. Si el sistema estaba programado para ayudar a agitar una lata de pintura en aerosol, funcionaba perfectamente. Pero si alguien sostenía un aerosol de aceite de cocina, el dispositivo no podía comprender que no necesitaba agitarse ni por qué, según explica la investigación.
El nuevo sistema, que los autores denominan "inteligencia artificial encarnada", representa un cambio de paradigma. Al aprovechar el poder de la inteligencia artificial multimodal moderna, fusiona lo que el usuario ve, dónde está ubicado e incluso la postura de su cuerpo para generar orientación de movimiento adaptada al momento, según la Universidad de Chicago. La estimulación muscular eléctrica ya no sigue una receta programada; improvisa junto al usuario.
"Tengo curiosidad sobre cómo las personas entienden y construyen relaciones con dispositivos que se comunican con ellas a través de movimientos corporales, en lugar de audio o visual", dijo Ho, según la universidad. "En la 'inteligencia artificial encarnada', pude explorar esta pregunta en el ámbito de la asistencia física. Fue especialmente revelador hacer que los participantes 'pensaran en voz alta' mientras usaban nuestro sistema y aprender cómo interpretan los movimientos inducidos por la máquina".
Conocimiento procedimental: cómo hacer, no solo qué hacer
El elemento central del sistema es el conocimiento procedimental: el sentido encarnado y difícil de describir de cómo hacer algo. Esto incluye agarrar la tapa de un frasco exactamente de la manera correcta para abrirlo girando, o combinar movimientos de muñeca y hombro para desbloquear una ventana europea, según los investigadores.
Durante décadas, los investigadores se enfocaron en proporcionar información factual a las personas. Este enfoque transmite el "saber hacer" directamente a los músculos, según el trabajo presentado.
El estudio de usuarios realizado por el equipo demostró que los participantes lograron abrir frascos de pastillas con mecanismos de bloqueo, tomar fotografías con una cámara desechable o usar una herramienta para aguacates, guiados por señales musculares generadas dinámicamente, según la investigación. En casos donde la inteligencia artificial cometió errores intencionalmente para propósitos de prueba, las personas los notaron, se adaptaron y encontraron soluciones volviendo a solicitar ayuda al sistema o corrigiendo sus errores, según los resultados del estudio.
Este enfoque iterativo, donde la intuición del cuerpo y las propuestas de la inteligencia artificial se encuentran, es significativo. Como describió un participante: "las intuiciones del cuerpo ayudan a notar errores de inmediato", ofreciendo una ventaja sobre leer instrucciones paso a paso o ver un video, según recoge el artículo.
Aplicaciones potenciales y futuro del sistema
"Esto podría cambiar las reglas del juego, no solo para tareas altamente físicas, como aprender habilidades físicas requeridas para trabajar con manufactura y materiales, o aprender instrumentos musicales, sino también en situaciones donde los usuarios podrían estar situacionalmente impedidos, por ejemplo, realizando múltiples tareas y ejecutando varios gestos a la vez, o no pueden ver en la oscuridad, etcétera", dijo Lopes, según la Universidad de Chicago.
El sistema representa la primera vez que usuarios reciben guía física a través de tareas complejas y desconocidas, incluso cuando no pueden explicar qué necesitan, según los investigadores. La capacidad de la inteligencia artificial para comprender contexto visual, interpretar la postura corporal y generar instrucciones musculares apropiadas en tiempo real elimina la necesidad de programación previa para cada tarea específica.
La investigación fue reconocida con el premio al Mejor Artículo en la conferencia ACM CHI 2026, uno de los eventos más prestigiosos en el campo de la interacción humano-computadora, según informó la Universidad de Chicago. Este reconocimiento subraya el potencial transformador de combinar inteligencia artificial generativa con interfaces físicas directas al cuerpo humano.
El trabajo abre posibilidades para asistencia en manufactura, educación de habilidades motoras, rehabilitación médica y situaciones donde las capacidades sensoriales están limitadas temporalmente. A diferencia de sistemas anteriores que requerían conocimiento experto para programar cada movimiento específico, este enfoque permite que la inteligencia artificial genere asistencia física apropiada basándose en su comprensión del contexto, las herramientas involucradas y los objetivos del usuario.