Todos maximizando tokens, una carrera armamentística que nadie se atreve a detener.

Escribir por: Meng Xing

El 24 de marzo de 2026 por la mañana, sentado en la audiencia del Demo Day de la cohorte YC W26, cuando la quinta empresa subió a presentar, decidí dejar de tomar notas.

No es que no sea importante, sino que me di cuenta de que lo que anoté podría estar desactualizado el mes que viene.

En esta generación, más de cien empresas, en realidad hacen tareas muy similares: aproximadamente el 80% son agentes verticales, como ayudar a abogados a organizar documentos, distribuir tareas a atención al cliente, filtrar currículums para recursos humanos.

Si hubiera visto estos proyectos en octubre del año pasado, probablemente pensaría “bastante innovador”. Pero el problema es que, en estos cinco meses, el mundo ha cambiado.

Claude Code pasó de ser una herramienta más orientada a desarrolladores, a convertirse en una interfaz que casi cualquiera puede usar directamente. Después de la versión 4.6 de Opus, toda la atmósfera de codificación bajó su barrera a niveles mínimos.

Esos agentes verticales, antes de formar barreras de negocio, hoy un ingeniero común, incluso yo mismo, en un fin de semana pueden hacer algo similar. Ya han perdido su valor de inversión.

El ciclo de una cohorte de YC dura tres meses. Este grupo entró en diciembre, y sumando la preselección, es como si hubieran sido elegidos hace cinco meses, “buenas empresas”. Pero en estos cinco meses, con la velocidad de iteración de la IA actual, ya han ocurrido varias rondas de cambio de paradigma.

En 2012, cuando emprendí por primera vez y obtuve la invitación a la entrevista en persona de YC, YC dominaba casi por completo en el sector de aceleradoras, y las empresas seleccionadas representaban “la próxima tendencia”. Pero la competencia ha cambiado. En los últimos años, YC ha dado la vuelta a esa percepción, y ahora se ha convertido en un indicador rezagado (lagging indicator).

El sistema de cohortes de YC, desde la solicitud, selección, ingreso, perfeccionamiento y presentación, funcionó muy bien en la era de internet móvil. Pero ese ritmo está diseñado para un mundo más lento.

En este año y medio en la industria del capital de riesgo, aproximadamente cada trimestre viajo a Silicon Valley. La última vez fue en octubre del año pasado. Antes, cada visita parecía rápida, pero esa “rapidez” se percibía mes a mes.

Esta vez, hay que seguir “semanas”.

Una noche, durante la cena, un amigo que trabaja en post-training (post-entrenamiento) soltó una frase:

“Me doy cuenta de que Silicon Valley ya no puede seguir el ritmo de sí misma.”

Todo el mundo en la oficina: un token-maxxing sin parar: una carrera armamentística que nadie se atreve a detener.

Hace medio año, si alguien me hubiera dicho que los decenas de miles de ingenieros de Meta usan productos de la competencia para programar, pensaría que era una broma.

Pero es cierto. Todo Meta, todos usan Claude Code. No es una startup, no es un equipo experimental, sino una empresa valorada en billones de dólares.

Ya no importa la seguridad del código, el presupuesto de tokens explotó, la competencia en los rankings se intensificó, todo Silicon Valley está invirtiendo sin preocuparse en IA. Pero, ¿qué pasa después de gastar tanto?

Primero, la seguridad del código. Hace medio año, esto era impensable, porque el código es el activo más importante de una empresa. ¿Cómo dejar que la API de otra compañía toque ese código? Meta pensó en ello y creó algo llamado myclaw para resolverlo. Un amigo de Meta me dijo que desarrollaron un producto de codificación, pero “no es usable, nadie lo usa”. Tras no ser usado, la compañía tuvo que relajar las restricciones: mientras no involucre datos de clientes, pueden usar Claude Code a voluntad.

Luego, las reuniones internas sobre cómo convertirse en una organización nativa de IA, capacitaciones, evaluaciones. La seguridad del código y el uso seguro, esas líneas rojas que antes eran inquebrantables, ahora se relegan al final, primero hay que aumentar la eficiencia.

Por motivos de seguridad, Google prohíbe a la mayoría de sus empleados usar Claude Code o Codex, pero DeepMind es una excepción. Los equipos responsables del modelo Gemini y aplicaciones internas usan Claude Code.

Google también ha hecho esfuerzos: lanzaron una herramienta interna de codificación llamada Antigravity, y en febrero de este año afirmaron que aproximadamente el 50% del nuevo código de la compañía ya es generado por IA.

Pero incluso así, los de DeepMind siguen usando Claude Code. Una razón importante es que Anthropic les ha hecho una implementación privada, ya que su inferencia y entrenamiento se realizan en TPU en Google Cloud, y hay confianza entre ellos. Pero Meta y otros gigantes tecnológicos no tienen esa relación; realmente han dejado la seguridad del código de lado. Todos apuestan a acelerar el ritmo.

La seguridad del código es solo la primera bandera que cae, la segunda es el presupuesto de tokens.

En varias startups nativas de IA en Palo Alto, un ingeniero tiene un presupuesto anual de tokens de unos 200,000 dólares. No es un número raro; lo sorprendente es que el costo de IA por un ingeniero top ya se acerca a su salario. Parece que las empresas usan IA para reducir costos de personal, pero en realidad, el costo total no ha bajado, solo han cambiado el gasto de mano de obra por tokens.

Meta es la más extrema en esto. Crearon un ranking interno de consumo de tokens: quien más use, más sube en la lista, y los últimos podrían ser despedidos. Por eso, los empleados de Meta incluso tienen un título no oficial llamado “token legend”.

Pero, al mismo tiempo, Meta ha despedido a más de diez mil personas en dos rondas este año. Mientras todos usan Claude Code para aumentar el consumo de tokens, despiden en masa.

Estas dos cosas no son contradictorias, sino dos caras de la misma moneda.

Visité una empresa en Serie C, el responsable técnico me mostró Slack: todos corriendo agentes, varios Cursor en paralelo, y otro ventana de Claude Code en uso. La ansiedad más común entre programadores ahora es: antes de dormir, si no saben qué harán sus agentes, se sienten muy nerviosos.

¿Pero realmente ha aumentado la productividad en esa escala? Desde finales del año pasado, muchos CTOs de motores de inferencia y bases de datos están emocionados diciendo “ingeniero 100 veces mejor” o “diez veces más eficiente”. Antes, 60 personas podían hacer en un año lo que ahora, con 2 personas y Claude Code, en una semana.

Yo también me emocioné al principio, pero luego me calmé y me pregunté: si la eficiencia aumenta 100 veces, ¿los ingresos de la empresa también aumentan 100 veces? ¿O la expansión del producto también? No puede ser que una mejora de “100 veces” simplemente elimine empleados.

No obtuve una respuesta clara. La realidad es que, en términos de ingresos, esa eficiencia solo se refleja en un aumento del 50% o incluso en una vez.

¿En qué difiere? Nadie puede explicarlo con claridad aún.

“Usar tantos tokens debería transformar la empresa en otra cosa. Pero no sé en qué.”

Un fundador con experiencia en ventas B2B me dijo que su equipo de 16 personas, con solo dos vendedores, logró en 12 meses 30 millones de dólares en ARR, todo gracias a codificación con IA. A veces se ven casos así, pero en la mayoría, las startups solo crean más cosas que no tienen ajuste mercado-producto (PMF).

En Silicon Valley, ahora se prueba con 100 enfoques diferentes en vez de 10, para ver cuál funciona. Pero, ¿quién puede captar la próxima tendencia? Todavía es difícil decirlo.

Un ejemplo que me impactó fue de Anthropic. Pregunté a un amigo de Anthropic: ¿cuál es la situación más problemática usando agentes? Él dijo que es en oncall (respuesta en tiempo real).

El escenario típico de oncall es: si la API de Claude responde lentamente, o un nodo de inferencia falla, o un prompt genera resultados anómalos, el ingeniero de oncall debe localizar rápidamente el problema, determinar si es un bug, un problema de recursos o una anomalía del modelo, y decidir cómo arreglarlo.

Anthropic, que es la empresa más fuerte en codificación de agentes, tiene esa tarea muy cerca de su núcleo, pero su propio agente de oncall sigue siendo poco útil.

Así está la realidad en abril de 2026: la máquina de vapor ya fue inventada, pero a veces no corre más rápido que un carro. Lo importante es que todos saben que la máquina de vapor eventualmente será más rápida, y están invirtiendo sin parar: ya no se cuida la seguridad del código, el presupuesto de tokens se ha explotado, la competencia en rankings se intensifica. Pero, ¿cuándo la máquina de vapor superará realmente al carro? Nadie lo sabe, pero nadie se atreve a detenerse y esperar ese día.

Porque el costo de detenerse puede ser mayor que gastar tokens equivocados.

Además, el consumo de tokens probablemente no crece de forma lineal. Esto me recuerda mi experiencia en conducción autónoma: en 2021, en Shanghai, logramos por primera vez una conducción autónoma continua de 5 horas sin intervención humana. Antes, la flota de pruebas era de 10, 15, 20 autos, y lentamente aumentaba; pero después de ese punto, rápidamente llegó a 100, 1000 autos. Hoy, los agentes de codificación están en una etapa similar.

En un vuelo de regreso a Beijing, revisando mis notas de estas semanas, me di cuenta de que todo se resume en una sola palabra: “no puedo seguir”.

YC no puede seguir, las reglas de seguridad de código de Meta no pueden seguir, la gestión de xAI no puede seguir, los investigadores no pueden seguir, la capacidad de cómputo no puede seguir, los marcos de valoración no pueden seguir, la resistencia social tampoco puede seguir… hasta el punto de que Silicon Valley ya no puede seguirse a sí mismo.

Pero lo que quiero decir al final es que un amigo de Anthropic mencionó que Dario Amodei dijo en interno: con la ayuda de IA, el cáncer en cierto sentido ya fue vencido, no desapareció, sino que puede convertirse en una enfermedad crónica que no mata, solo que el costo de tratamiento todavía es muy alto y lleva tiempo popularizarla.

No estoy seguro de que Dario haya sido demasiado optimista, pero en Silicon Valley, la dirección más visible de emprendimiento ahora es AI4S, IA para Biotech. Muchas personas que salen de grandes modelos no saben mucho de medicina, pero quieren usar IA para cambiar esa industria.

Estas últimas semanas, he visto mucho “no puedo seguir”, y eso genera ansiedad. Pero si IA en unos pocos años logra convertir el cáncer en una enfermedad crónica, y acelerar la ciencia de materiales veinte años, esa “no puedo seguir” puede ser la mayor aceleración en la historia del desarrollo humano.

Mi hijo tiene dos años, y el próximo año quizás tenga un segundo hijo. No puedo imaginar qué tipo de mundo enfrentará esa generación.

Pero deseo que en ese mundo haya más personas curadas por IA, y no más bombas molotov y disparos en las casas de los profesionales de IA.

En “Cities and Ambition” (2008), Paul Graham escribió: “Aunque en Silicon Valley la gente respeta mucho la inteligencia, la señal que transmite es: debes tener más influencia, y esto no es exactamente lo mismo que en Nueva York. En Nueva York, la influencia también importa, pero allí se admira mucho la ‘billón de dólares’, incluso si solo heredaste esa riqueza. En Silicon Valley, salvo algunos agentes inmobiliarios, nadie se preocupa por eso. Lo que realmente importa en Silicon Valley es cuánto impacto tienes en el mundo. La gente no admira a Larry y Sergey por su riqueza, sino porque controlan Google, que casi influye en todos.”

Ahora, la IA lleva esa atmósfera a un nuevo nivel.

El autor de Late Night, Meng Xing: socio de Five Sources Capital, ex COO de conducción autónoma en Didi. Este es su primer artículo sobre inversión en IA, y continuará compartiendo sus observaciones en Late Night.

Fuente de la imagen principal: Visual China

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado