Startup australiana desarrolla modelo de inteligencia artificial que rompe con el pensamiento grupal de los chatbots
Tecnología

Startup australiana desarrolla modelo de inteligencia artificial que rompe con el pensamiento grupal de los chatbots

La empresa australiana Springboards ha creado Flint, un modelo de lenguaje diseñado para generar respuestas más variadas y creativas que los chatbots convencionales como ChatGPT, Claude o Gemini, que tienden a producir respuestas predecibles y repetitivas ante preguntas abiertas, según reveló la compañía al presentar su nueva herramienta dirigida inicialmente a profesionales creativos en publicidad y marketing.

TECNOLOGÍA1 JUL 2026

La limitación de los modelos de lenguaje actuales quedó expuesta en un simple experimento: al pedirle a ChatGPT, Claude o Gemini que generen un número aleatorio entre 1 y 10, la respuesta es casi siempre 7, según demostró Pip Bingemann, cofundador y director ejecutivo de Springboards. Al solicitar otro número, los modelos responden típicamente con 3 o 4, y luego con 8 o 9. Esta previsibilidad no es casualidad, sino un patrón sistemático que afecta a la mayoría de los grandes modelos de lenguaje disponibles en el mercado.

"La mayoría de los modelos de lenguaje están luchando contra las alucinaciones. Nosotros las damos la bienvenida", dijo Bingemann al presentar Flint, el modelo desarrollado por su empresa para abordar este problema de homogeneidad en las respuestas de la inteligencia artificial.

El problema del pensamiento grupal en la IA

La falta de variedad en las respuestas de los modelos de lenguaje está comenzando a recibir mayor atención académica. En noviembre, un equipo de investigadores publicó un artículo titulado "Colmena Artificial: La Homogeneidad Abierta de los Modelos de Lenguaje (y Más Allá)", que expuso un grado notable de repetición no solo en las respuestas de modelos individuales, sino también entre diferentes modelos. El estudio ganó el premio al mejor artículo en NeurIPS, una importante conferencia de inteligencia artificial, según informó MIT Technology Review.

Los investigadores solicitaron a 25 modelos de lenguaje diferentes, incluyendo modelos de las principales empresas estadounidenses y modelos de código abierto de China y otros lugares, que escribieran una metáfora sobre el tiempo. De las 1.250 respuestas generadas (50 por cada modelo), la mayoría fueron variaciones de "El tiempo es un río" o "El tiempo es un tejedor", según reveló el estudio.

No está claro exactamente por qué ocurre esto, pero los investigadores especulan que se debe a que la mayoría de los modelos actuales se entrenan de manera similar, con datos similares y para realizar tareas similares, según explicó el equipo de investigación.

Kieran Browne, cofundador y director de tecnología de Springboards, señaló que la repetición está presente en todas partes una vez que se busca. "La forma en que están diseñadas la mayoría de las interfaces de chat hace que parezca que estás teniendo una conversación personal. Creo que la mayoría de la gente no se da cuenta realmente de hasta qué punto están recibiendo lo mismo que todos los demás", dijo Browne.

Otro ejemplo ilustra el problema: al preguntar "¿Cómo debería llamar a mi banda?", la mayoría de los modelos sugieren nombres que incluyen palabras como "vidrio", "neón", "terciopelo" o "estática", según indicó Browne. Cuando MIT Technology Review probó esta pregunta con ChatGPT, el modelo generó una lista de 56 nombres de bandas encabezada por "Glass Harbor" (Puerto de Vidrio), e incluyó "Static Empire" (Imperio Estático), "Neon Hearts" (Corazones de Neón) y "Velvet Echo" (Eco de Terciopelo). Gemini ofreció 15 sugerencias, incluyendo "Static Horizon" (Horizonte Estático).

Cómo funciona Flint

Springboards construyó Flint sobre Qwen 3, un modelo de código abierto del gigante tecnológico chino Alibaba. "Somos un equipo pequeño. Entrenar un modelo fundacional no está sobre la mesa para nosotros. Es simplemente demasiado caro", explicó Browne.

La mayoría de los modelos de lenguaje tienen configuraciones que permiten ajustar el nivel de aleatoriedad en sus respuestas. La más común se llama "temperatura". "Obviamente, eso fue una de las primeras cosas que exploramos, porque eso es lo que la gente te dice: si quieres más creatividad, subes la temperatura", dijo Browne.

Sin embargo, cambiar esas configuraciones también puede hacer que los modelos se vuelvan incoherentes. Aumentar la temperatura de uno de los modelos de OpenAI a su configuración máxima hizo que produjera respuestas que cambiaban del inglés al código a mitad de una oración, según relató Browne.

Springboards se dio cuenta de que los parámetros eran instrumentos demasiado toscos para lo que querían lograr. No tiene sentido aumentar la aleatoriedad en todos los aspectos; solo se quiere potenciarla en puntos específicos de la respuesta, explicó Browne.

Por ejemplo, cuando se pregunta a un chatbot "¿A dónde debería ir en Europa?", el modelo solo necesita ajustar la aleatoriedad justo antes de nombrar un destino, no para cada palabra en su respuesta, según detalló el directivo.

Para hacer que Flint hiciera esto, Springboards entrenó su versión de Qwen 3 para identificar los puntos en su respuesta donde era posible más variedad y llenar esos espacios con palabras o frases que fueran un poco más aleatorias, según explicó la empresa.

Aplicaciones en el mundo real

Springboards ha desarrollado una herramienta respaldada por una selección de modelos de lenguaje, incluyendo ChatGPT y Claude, que los profesionales creativos en publicidad o marketing pueden usar para generar ideas. La herramienta permite arrastrar texto producido por diferentes modelos, seleccionando las partes que gustan y combinándolas en algo nuevo. Springboards está presentando Flint como un modelo alternativo que los usuarios de su herramienta pueden seleccionar cuando buscan más variedad.

Zoe Scaman, fundadora de la startup de estrategia empresarial Bodacious y directora de estrategia en 77X, una plataforma de marketing directo al fan creada por Luka Dončić de Los Angeles Lakers, ha estado probando la herramienta. "Lo encuentro realmente útil para lanzarme en direcciones completamente diferentes. Lo uso si quiero catapultarme por todos lados", dijo Scaman.

En una prueba, Scaman enfrentó a Flint contra Claude, Gemini y ChatGPT dando a cada modelo un caso de estudio clásico de MBA: ¿Cómo reinventarías una empresa financiera para la juventud actual? Los tres modelos convencionales siguieron el mismo camino, según relató: "Ya sabes, necesitamos enseñar educación financiera de una manera divertida y moderna, bueno, eso no es nada nuevo".

Pero Flint propuso algo diferente, sugiriendo que todo el concepto de acumulación de riqueza debería recibir un cambio de marca. "Eso fue realmente interesante", dijo Scaman.

Sin embargo, Scaman señaló que Flint todavía es un prototipo y no funciona todo el tiempo. "A veces falla cuando empiezas a presionarlo demasiado. Pero creo que la premisa detrás de él es realmente poderosa", indicó.

Maximilian Weigl, cofundador y director de estrategia en Uncommon, una empresa de marketing, describió el enfoque de Flint como una invitación a pensar más ampliamente. "Flint está programado para lanzar algo inusual. Es más una invitación a pensar más ampliamente. Eso es súper interesante", dijo Weigl.

El equipo de Weigl usa Flint junto con ChatGPT, Claude y Gemini. "Realmente no puedes crear algo que rompa límites con herramientas que te arrastran de vuelta al promedio", afirmó.

Limitaciones y advertencias

No obstante, Weigl señaló que nueve de cada diez veces el promedio está bien. No siempre es necesario alcanzar extremos con algo como Flint, indicó: "La mayoría de la gente está bien con lo suficientemente bueno. Quieren ver cosas familiares del mercado masivo".

Weigl también advirtió contra el uso excesivo de cualquier modelo de lenguaje. "Tengo un gran problema cuando la gente depende de la salida de cualquier IA, incluido Flint. Si viera a personas en mi equipo copiando y pegando algo de la IA, diría: '¡Ese no es tu trabajo! Piensa, habla con otras personas, usa tu propia voz'", declaró.

OpenAI respondió a las críticas señalando que entrenar modelos para dar respuestas confiables y coherentes puede llevarlos a converger en torno a respuestas familiares de alta probabilidad, y que presionar más fuerte por la novedad puede conducir a respuestas más débiles o menos confiables. La compañía también señaló que el artículo "Colmena Artificial" estudió modelos de 2024 que desde entonces han sido actualizados, según indicó la empresa.

Por ahora, Flint está dirigido a anunciantes y especialistas en marketing porque esos son los clientes de Springboards. Pero Bingemann y Browne insisten en que la falta de variedad es un problema para cualquiera que use chatbots.

La idea es dar a las personas la opción y dejar que ellas decidan si el resultado es bueno o no, dijo Bingemann. "La variedad es genial cuando estás tratando de generar ideas. Vayamos por esta ruta en lugar de dejar que las máquinas lo hagan todo y terminar en un mundo gris y aburrido", concluyó el ejecutivo.

SIGUE LEYENDO
MÁS DE TECNOLOGÍA