

Anthropic, la empresa desarrolladora de inteligencia artificial, reconoció que los usuarios de Claude Code, su herramienta de asistencia para programación, están agotando sus cuotas de tokens de manera significativamente más rápida de lo previsto, interrumpiendo flujos de trabajo y generando quejas masivas. La compañía calificó la resolución del problema como su "máxima prioridad", según anunció en Reddit el 31 de marzo de 2026.
Los desarrolladores que utilizan Claude Code, la herramienta de asistencia de programación impulsada por inteligencia artificial de Anthropic, enfrentan un consumo acelerado e inesperado de tokens que agota sus cuotas mucho antes de lo anticipado, según confirmó la propia empresa.
Anthroplic declaró en Reddit que "la gente está alcanzando los límites de uso en Claude Code mucho más rápido de lo esperado. Estamos investigando activamente... es la máxima prioridad para el equipo", según reportó BBC y The Register.
Los tokens son unidades que los clientes compran para utilizar servicios de inteligencia artificial, pero la cantidad necesaria para cada tarea frecuentemente carece de transparencia, según BBC. Los usuarios pagan suscripciones que van desde 20 dólares mensuales por Claude Pro hasta 100 o 200 dólares por niveles superiores, además de precios empresariales para organizaciones más grandes, según la misma fuente.
## Quejas generalizadas de usuarios
Los foros de Anthropic en Reddit y Discord están inundados de quejas. Un usuario con suscripción Claude Pro de 200 dólares anuales afirmó en Discord que "alcanza el máximo cada lunes y se reinicia el sábado, y ha sido así durante un par de semanas... de 30 días consigo usar Claude 12", según The Register.
Otro desarrollador con el plan Max 5, que cuesta 100 dólares mensuales, declaró: "Usé Max 5 en una hora de trabajo, antes podía trabajar ocho horas", según la misma fuente. Un usuario adicional reportó: "Una simple respuesta de una oración a una conversación me llevó del 59 por ciento de uso al 100 por ciento. ¿Cómo?", según BBC.
Un comentario en Reddit advirtió: "Una sesión en un bucle puede drenar tu presupuesto diario en minutos", según BBC.
## Factores múltiples detrás del problema
Varios elementos parecen contribuir al consumo acelerado de tokens. La semana pasada, Anthropic introdujo limitación durante horas pico en sus servicios Claude, lo que significa que los tokens se consumen más rápidamente cuando la demanda del servicio es mayor, según BBC. El ingeniero Thariq Shihipar de Anthropic afirmó que esto afectaría aproximadamente al siete por ciento de los usuarios, según The Register.
El 28 de marzo finalizó una promoción de Claude que duplicaba los límites de uso fuera de una ventana pico de seis horas, según The Register.
Además, Claude Code podría tener errores que incrementan el uso de tokens. Un usuario afirmó que tras realizar ingeniería inversa del binario de Claude Code, "encontró dos errores independientes que causan que el caché de prompts se rompa, inflando silenciosamente los costos entre 10 y 20 veces", según The Register. Algunos usuarios confirmaron que degradar a una versión anterior ayudó. "Degradar a la versión 2.1.34 hizo una diferencia muy notable", dijo uno, según la misma fuente.
Un usuario que analizó el código fuente reportó en Hacker News que el sistema realiza reemplazos ocultos de cadenas si la conversación de Claude Code menciona facturación o tokens, lo que invalida el caché en ese punto. "Si esa cadena aparece en cualquier parte del historial de conversación, creo que el texto inicial se reemplaza, tu caché completo se reconstruye desde cero", explicó.
## Problemas con el sistema de caché
La documentación sobre el almacenamiento en caché de prompts indica que el caché "reduce significativamente el tiempo de procesamiento y los costos para tareas repetitivas o prompts con elementos consistentes", según The Register. Sin embargo, el caché tiene solo cinco minutos de vida útil, lo que significa que detenerse para un breve descanso o no usar Claude Code durante unos minutos resulta en costos más altos al reanudar, según la misma fuente.
Los desarrolladores pueden actualizar la vida útil del caché a una hora, pero "los tokens de escritura de caché de una hora son dos veces el precio de los tokens de entrada base", establece la documentación, según The Register. Un token de lectura de caché cuesta 0.1 veces el precio base, por lo que esta es un área clave para optimización, según la misma fuente.
Un análisis técnico publicado en Hacker News identificó que el código fuente contiene una función llamada "willow" que intenta ayudar con este problema. Se activa cuando se cumplen dos condiciones: 75 minutos de inactividad y al menos 100,000 tokens en la conversación. En ese punto muestra un diálogo de bloqueo o una sugerencia para usar el comando /clear. El umbral de 75 minutos no es arbitrario: el tiempo de vida del caché es de aproximadamente una hora, por lo que 75 minutos de inactividad significa que el caché definitivamente ha expirado. Continuar significa reprocesar todo el contexto a 1.25 veces el costo.
## Falta de transparencia en los límites
Anthroplic no establece los límites de uso exactos para sus planes. Por ejemplo, el plan Pro promete solo "al menos cinco veces el uso por sesión en comparación con nuestro servicio gratuito". El plan Standard Team promete "1.25 veces más uso por sesión que el plan Pro", según The Register. Esto dificulta que los desarrolladores sepan cuáles son sus límites de uso, excepto examinando su panel que muestra cuánta cuota han consumido, según la misma fuente.
## Impacto en flujos de trabajo automatizados
Los problemas de servicio pueden interrumpir el trabajo de los desarrolladores de software que utilizan Claude Code y aplicaciones similares como parte de su flujo de trabajo diario para ayudar con tareas específicas, según BBC.
Un usuario advirtió en The Register: "Para quienes ejecutan Claude Code en flujos de trabajo automatizados: los errores de límite de tasa deben capturarse explícitamente, parecen fallas genéricas y activarán reintentos silenciosamente. Una sesión en un bucle puede drenar tu presupuesto diario en minutos".
## Respuesta de soporte al cliente criticada
La falta de transparencia y rendición de cuentas ha generado críticas. Un usuario reportó en Hacker News que envió un correo electrónico al soporte hace unos días con detalles, preocupaciones y una solicitud concreta, y recibió respuesta de un agente de inteligencia artificial llamado 'Fin' que le dijo: "Aunque nuestro equipo de soporte no puede restablecer manualmente ni solucionar los límites de uso, puede conocer las mejores prácticas aquí. Si alcanzó un límite de mensajes, deberá esperar hasta el momento de restablecimiento, o puede considerar comprar un plan mejorado (si corresponde)".
El usuario respondió diciendo que esa no era una respuesta apropiada y comentó: "Tienes absolutamente razón respecto a la falta de transparencia y rendición de cuentas. Por un lado, Anthropic genera buena voluntad al parecer tener una postura más ética que OpenAI, y un mejor producto. Por otro lado, la matan rápidamente mediante un trato extremadamente pobre a sus clientes".
Otro usuario agregó en el mismo foro: "Estar en el negocio significa tener que responder a las consultas de los clientes en algún momento. Dada la cantidad de miles de millones que se están bombeando en los bolsillos de Anthropic y dados los millones que su alta dirección sin duda se paga a sí misma, estoy seguro de que podrían ahorrar un poco de efectivo para levantarse de sus traseros y resolver el servicio al cliente".
## Incidentes de seguridad recientes
Anthroplic recientemente liberó accidentalmente parte de su código fuente interno para Claude Code debido a "error humano", según BBC. Un archivo interno con 500,000 líneas de código fue publicado en GitHub, una plataforma popular para desarrolladores, según la misma fuente.
Un portavoz de Anthropic dijo que la liberación fue causada por "error humano, no una brecha de seguridad", y que "no se expusieron ni involucraron datos sensibles de clientes o credenciales", según BBC. El código fuente de Claude Code ya era parcialmente conocido, ya que había sido sometido previamente a ingeniería inversa por desarrolladores independientes. Una versión anterior del código fuente también se había filtrado en febrero de 2025, según la misma fuente.
## Contexto de la industria
Problemas similares no son inusuales en la industria. A principios de marzo de 2026, usuarios de Google Antigravity protestaban por problemas similares, según The Register.
Lo que se está viendo es una negociación implícita entre usuarios y proveedores sobre qué es un modelo de precios y uso aceptable para el desarrollo con inteligencia artificial, según The Register. Los usuarios quieren controlar costos y los proveedores necesitan obtener ganancias. También existe una desconexión entre el marketing de los proveedores que insta a los desarrolladores a insertar inteligencia artificial en cada proceso, incluidos en algunos casos flujos de trabajo automatizados, y un sistema de cuotas que puede hacer que las herramientas de inteligencia artificial dejen de responder, según la misma fuente.
## Batalla legal en curso
Anthroplic actualmente está en una batalla legal con el gobierno de Estados Unidos sobre cómo sus herramientas pueden ser utilizadas por el Departamento de Defensa, según BBC.
## Implicaciones y perspectivas futuras
La dependencia de modelos de inteligencia artificial en la nube es, en efecto, dependencia del subsidio de capital de riesgo, según un comentario en Hacker News. Desde el punto de vista del usuario, esta dependencia es una deuda que se pagará con intereses a un proveedor de modelos o mediante el trabajo duro de independizarse de tales modelos después de haberse vuelto dependiente, según la misma fuente.
La falta de límites claros y duros hace imposible planificar, según comentarios en Hacker News. En cambio, es un objetivo móvil que imposibilita confiar en la herramienta para trabajo real. En algún momento deja de sentirse como un error y comienza a sentirse como un experimento de precios sobre los usuarios, según la misma fuente.
A medida que las herramientas maduren, se espera ver mejor soporte para mezclar modelos, locales y en la nube, eligiendo el correcto para la tarea, según Hacker News. Ejecutar las cosas baratas localmente y usar los modelos en la nube costosos solo cuando realmente se necesiten podría ayudar mucho a gestionar costos, según la misma fuente.
También existe el riesgo de dependencia del que no se habla lo suficiente, según Hacker News. Estos proveedores pueden cambiar los precios cuando quieran. Una herramienta alrededor de la cual se ha construido todo un flujo de trabajo puede volverse inaccesible de la noche a la mañana solo porque la economía cambió. Es el problema del bloqueo de proveedor otra vez pero con menos previsibilidad, según la misma fuente.