Una nueva generación de sistemas de inteligencia artificial conocidos como 'modelos de mundo' está captando la atención de pioneros tecnológicos y gigantes corporativos, prometiendo superar las limitaciones fundamentales de los modelos de lenguaje actuales al dotar a las máquinas de una comprensión interna de la realidad física y social, según reportan investigadores y analistas financieros. Empresas como Google, Nvidia y la recién fundada AMI Labs del científico Yann LeCun están invirtiendo miles de millones de dólares en desarrollar estos sistemas que podrían transformar desde la robótica hasta la conducción autónoma.
Los sistemas de inteligencia artificial que dominan la actualidad, como los grandes modelos de lenguaje que generan texto, imágenes y video, enfrentan una limitación estructural que la industria tecnológica ha evitado confrontar abiertamente: carecen de una comprensión interna del mundo físico que describen, según un nuevo informe del Instituto Global de Goldman Sachs.
Estos modelos, según explican los autores del informe George Lee y Dan Keyserling, "generan esta comprensión a través de interpretación de segundo orden: entienden cómo funciona nuestro mundo basándose en los datos y textos a los que han sido expuestos. No poseen comprensión de primeros principios sobre física, movimiento, luz, acción y reacción, u otras propiedades fundamentales de nuestro universo".
La distinción es crítica: la inteligencia artificial actual aprendió sobre el mundo leyendo lo que los humanos escribieron sobre él, absorbiendo la descripción de la realidad sin encontrar jamás la realidad misma. Puede explicar con fluidez que un vaso se romperá si se deja caer, pero no tiene sentido interno del peso, la trayectoria o la consecuencia.
Esta limitación apenas se registra en los casos de uso que dominan la inteligencia artificial empresarial actual, como resumir documentos o generar código. Se convierte en un muro infranqueable en el momento en que se le pide a la inteligencia artificial navegar un entorno físico no estructurado, coordinar una respuesta organizacional compleja en tiempo real, o razonar sobre cómo una decisión estratégica se propagará a través de un mercado activo.
**La respuesta de los pioneros tecnológicos**
Los investigadores que convergen en los modelos de mundo no son un movimiento marginal. Son, en varios casos, las mismas personas cuyo trabajo anterior produjo la era de inteligencia artificial que ahora domina los titulares, según documenta el informe de Goldman Sachs.
Yann LeCun, quien pasó años como científico jefe de inteligencia artificial de Meta antes de partir para lanzar su nueva empresa AMI Labs en París, ha hecho de los modelos de mundo la base explícita de su visión para la inteligencia artificial general. Su arquitectura predictiva de incrustación conjunta está diseñada para construir máquinas que desarrollen modelos internos del mundo a través de la observación, de la manera en que lo hacen los humanos, en lugar de mediante predicción de texto. LeCun ha sido pública y persistentemente crítico de la idea de que escalar los modelos de lenguaje por sí solo alcanzará la inteligencia general. Los modelos de mundo son su tesis alternativa.
AMI Labs ha recaudado más de 1.000 millones de dólares, una infusión inicial récord de dinero para una empresa europea, según reporta la revista Nature.
Fei-Fei Li, la investigadora de Stanford cuyo conjunto de datos ImageNet ayudó a encender la revolución del aprendizaje profundo que produjo los sistemas de inteligencia artificial dominantes de hoy, fundó World Labs alrededor de una idea relacionada: inteligencia espacial. La premisa es que la inteligencia genuina requiere no solo reconocer objetos en imágenes, sino comprender cómo esos objetos existen en el espacio, interactúan entre sí y cambian con el tiempo.
Gigantes tecnológicos como Google y Nvidia también están desarrollando modelos de mundo, al igual que varias otras empresas emergentes.
**Definición y capacidades**
En el sentido más amplio, cualquier red neuronal entrenada con datos sobre el mundo real tiene algún tipo de modelo de un mundo incrustado en ella. Pero en los últimos dos años, muchos investigadores han comenzado a usar el término para describir inteligencia artificial que puede producir un mundo consistente, explorable y a menudo interactivo que recuerda a un videojuego en primera persona, según explica Nature.
Un modelo de mundo tiene que "saber" lo suficiente sobre física para que si el usuario empuja un objeto fuera de una mesa, el objeto caerá. Los modelos de mundo también proporcionan una experiencia más interactiva para un usuario que generar imágenes o material de video a partir de indicaciones de texto.
Por ejemplo, el modelo de mundo Genie 3 de Google DeepMind, que la compañía lanzó en agosto de 2025, usa descripciones de texto simples para generar entornos fotorrealistas que pueden explorarse en tiempo real, según reporta Nature.
Lo que se sabe es que los modelos de mundo interactivos se entrenan, en parte, usando miles de horas de videos del mundo real, así como con simulaciones precisas de entornos físicos que están programados para observar las leyes de la física.
**Dos fronteras de aplicación**
El informe de Goldman Sachs identifica dos pistas distintas pero relacionadas en el desarrollo de modelos de mundo.
Los modelos de mundo físico enseñan a la inteligencia artificial la lógica gobernante del mundo material: gravedad, fricción, termodinámica, dinámica de fluidos. En lugar de aprender puramente del ensayo y error del mundo real, estos sistemas absorben las reglas de la física a través de simulación, practicando en entornos digitales donde el fracaso es barato y rápido. Un robot puede caer miles de veces dentro de un simulador antes de tocar un piso. Cuando finalmente actúa en el espacio físico, lo hace habiendo ya internalizado las consecuencias.
"La versión más emocionante de un modelo de mundo es una en la que puedes tomar acciones", dice Jeff Clune, científico informático de la Universidad de Columbia Británica en Vancouver, Canadá, quien contribuyó al desarrollo de Genie durante un contrato con Google DeepMind. Tal entorno podría ser un escenario seguro en el cual entrenar sistemas de inteligencia artificial que controlan robots, y podría ser mucho más rápido que dejar que los robots aprendan interactuando con objetos físicos, según Anastasis Germanidis, cofundador de Runway, una empresa emergente en Nueva York que lanzó un modelo de mundo llamado GWM-1 en diciembre de 2025.
Los modelos de mundo virtuales o sociales persiguen una ambición paralela en sistemas humanos. Estos son entornos digitales poblados por agentes de inteligencia artificial con objetivos, memorias e incentivos, cada uno diseñado para aproximar un perfil de comportamiento del mundo real. A medida que esos agentes interactúan, emergen patrones. Los mercados se comportan. Las organizaciones responden. Las crisis se propagan en cascada.
"Las empresas ya gastan un esfuerzo enorme adivinando cómo responderán otros, cómo se moverán los competidores, cómo interpretarán los mercados las señales, cómo reaccionarán las juntas directivas bajo presión", escriben Lee y Keyserling. "Las simulaciones multiagente ofrecen algo más cercano a un modelo vivo de sistemas humanos".
Los autores de Goldman trazan una distinción que importa enormemente para cómo los líderes empresariales deberían pensar sobre estas herramientas: los modelos de mundo no son pronósticos. "Estos sistemas no predicen el futuro en ningún sentido estrecho; están destinados a revelar futuros plausibles y exponer dinámicas ocultas", escriben. "Pronosticar asume un resultado correcto único. Los modelos de mundo revelan rangos, caminos y bucles de retroalimentación".
**Implicaciones para la infraestructura tecnológica**
Toda la construcción de infraestructura de inteligencia artificial, señala el informe de Goldman Sachs, se ha dimensionado alrededor de una sola suposición: que el futuro de la inteligencia artificial son modelos de lenguaje más grandes ejecutándose en más capacidad de cómputo. Las proyecciones actuales para chips, centros de datos y capacidad energética están construidas casi completamente sobre esa base.
"Las demandas y oportunidades que rodean a los modelos de mundo aún no se reflejan en los pronósticos de consenso de oferta y demanda para infraestructura de inteligencia artificial", escriben Lee y Keyserling. Si los modelos de mundo se desarrollan como una capa complementaria, construida junto a los modelos de lenguaje en lugar de reemplazarlos, los requisitos de cómputo podrían exceder sustancialmente lo que anticipan los pronósticos actuales de Wall Street.
Los entornos de simulación requieren canales de datos construidos con propósito específico, generadores de datos sintéticos y motores basados en física que van mucho más allá de los corpus de texto. "La historia de la infraestructura", escriben los autores, "es una de superposición parcial, no de reutilización perfecta".
El encuadre competitivo es igualmente contundente. "La ventaja competitiva podría depender tanto de quién entrena el modelo más grande como de quién construye las simulaciones más fieles de la realidad, física, social y económica".
**Aplicaciones en investigación biomédica**
Mientras tanto, en el campo de la investigación biomédica, científicos como Christina Theodoris del Instituto Gladstone están desarrollando modelos de inteligencia artificial que predicen cómo las células y sus genes se comportarán bajo diferentes circunstancias, con enfermedad, desarrollo o envejecimiento.
Theodoris diseñó Geneformer, el primer modelo fundacional en el mundo para predecir cómo cambiar la actividad genética afectaría células individuales. Este modelo de inteligencia artificial ya ha revelado nuevos objetivos farmacológicos para enfermedades cardíacas, según reporta el Instituto Gladstone.
Más recientemente, lanzó otro modelo llamado MaxToki que puede predecir qué sucede a las células en todo el cuerpo con el envejecimiento y cómo ralentizar ese proceso. Geneformer fue entrenado inicialmente con 30 millones de ejemplos de cómo los genes se activan y desactivan en células individuales. Ahora ha sido entrenado con más de 100 millones de ejemplos, según Theodoris.
"Al aprovechar estos modelos informáticos para identificar más rápidamente los objetivos más prometedores, no solo podemos acelerar la velocidad de la investigación, sino también mover terapias a ensayos clínicos que tendrán una mayor probabilidad de éxito", dice Theodoris.
En estudios de seguimiento en el laboratorio, el equipo de Theodoris probó cuatro genes identificados por Geneformer para tratar cardiomiopatía, una enfermedad del tejido cardíaco. Dos de ellos condujeron a una mejora significativa en cuán fuertemente se contraen las células, y un tercero mostró señales de que estaba ayudando a las células a latir robustamente de nuevo, revelando una nueva estrategia terapéutica para tratar la cardiomiopatía.
MaxToki, el modelo más reciente, incorpora la dimensión del tiempo. Fue entrenado con datos de aproximadamente 175 millones de células individuales, y luego con 100 millones de trayectorias de células cambiando con el tiempo, usando células de miles de personas sanas que van desde recién nacidos hasta más de 90 años de edad.
El modelo aprendió a predecir cómo cambian las células con el envejecimiento. Dado una célula envejecida, MaxToki puede razonar qué genes cambiaron con el tiempo para llevar a su estado final. Y dada una célula enferma, puede detectar señales de envejecimiento acelerado.
El modelo identificó señales de envejecimiento acelerado en células pulmonares de individuos expuestos a tabaquismo intenso y pacientes afectados por fibrosis pulmonar. De manera similar, en muestras de pacientes con enfermedad de Alzheimer, el modelo detectó aceleración del envejecimiento en células cerebrales.
Cuando los científicos activaron cada gen predicho para acelerar el envejecimiento en células cardíacas humanas cultivadas en el laboratorio, las células mostraron características del envejecimiento, incluyendo latidos irregulares y disfunción de genes involucrados en inflamación y uso de energía. Los investigadores validaron estas predicciones en un organismo vivo: cuando activaron los mismos genes en ratones jóvenes, encontraron una disminución en la función cardíaca dentro de 6 semanas.
**Perspectivas futuras**
Lo que hace diferentes a Geneformer y MaxToki de herramientas anteriores de inteligencia artificial en biología es su amplia aplicabilidad. Modelos anteriores de aprendizaje automático en biología se construyeron para tareas únicas. Los modelos fundacionales superan ese problema porque fueron entrenados con datos biológicos tan vastos y variados desde el inicio que desarrollaron una comprensión amplia y generalizable de cómo funcionan las células.
"La flexibilidad de no tener que generar un nuevo modelo para cada pregunta realmente abre muchas posibilidades", dice Theodoris. "Ahora podemos recurrir a estos modelos para una amplia variedad de preguntas y simular qué sucede a las células con el tiempo cuando cambiamos la actividad genética".
Los modelos de inteligencia artificial desarrollados en Gladstone ahora se comparten libremente con equipos de investigación alrededor del mundo que están haciendo sus propias preguntas sobre cómo controlar genes para tratar enfermedades.
"Si la inteligencia artificial da fluidez a los grandes modelos de lenguaje, los modelos de mundo le dan conciencia situacional", escriben Lee y Keyserling en su conclusión. "Durante gran parte de su historia reciente, hemos tratado la inteligencia artificial como un sistema que produce respuestas. Los modelos de mundo sugieren algo más ambicioso".
La inteligencia artificial que ha remodelado la última década aprendió a hablar sobre el mundo con sofisticación notable. La inteligencia artificial que los pioneros están construyendo ahora está tratando de aprender algo más difícil y fundamental: cómo se siente realmente estar dentro de él.
"Plataformas como Geneformer y MaxToki están diseñadas para superar enfermedades, y hacerlo más rápido de lo que jamás pudimos antes", dice Deepak Srivastava, presidente de Gladstone. "En Gladstone, integramos estos modelos de inteligencia artificial con nuestra profunda experiencia en enfermedades, y confío en que nuestro enfoque resultará en curas".