Lorsque le Token devient la main-d'œuvre, l'homme devient une interface

Auteur : Lin Wanwan

1876, l'Exposition universelle de Philadelphie. L'empereur du Brésil, Pedro II, prend le téléphone inventé par Bell, et entend une voix de l'autre côté, s'exclame : « Mon Dieu, il parle ! »

Cent cinquante ans plus tard, le 18 mars 2026, au centre de conférence de San José. Huang Renxun, vêtu d'une veste en cuir noire, se tient sur la scène de la conférence GTC, et prononce une phrase qui surprend.

« Dans dix ans, NVIDIA comptera probablement 75 000 employés. Ils seront extrêmement occupés, car ils travailleront avec 7,5 millions d'agents IA. »

La foule rit.

75 000 personnes, 7,5 millions d'agents, 1:100.

Huang Renxun lui-même sourit, ajoutant : « Ils travailleront 24h/24. Espérons que nos employés n'auront pas à rivaliser avec eux. »

Le applaudissement s'estompe, ce chiffre est noyé dans la journée par des annonces de puces plus spectaculaires et des accords de partenariat. Mais si on le sort de côté pour y réfléchir un instant, c'est peut-être l'une des phrases les plus importantes de toute la conférence.

Ce n'est pas seulement Huang Renxun. Trois mois plus tôt, une autre personne décrivait un avenir similaire de façon plus concrète.

Janvier 2026, CES de Las Vegas. Bob Sternfels, PDG de McKinsey, annonce des chiffres.

« Nous avons actuellement 40 000 employés humains, environ 25 000 agents IA. » Moins de deux ans auparavant, ce chiffre n’était que quelques milliers. Ces 25 000 agents ont généré 2,5 millions de graphiques en six mois.

2,5 millions de graphiques. Autrefois, ce travail était effectué par de jeunes analystes débutants. À 23-24 ans, avec le prestige d’une grande école, ils alignaient les coordonnées à 3 heures du matin.

C’était le point de départ de chaque nouveau consultant chez McKinsey, échangeant un travail mécanique contre un ticket pour devenir associé.

Aujourd’hui, cette première étape est prise en charge par des agents. Sternfels dit : « L’IA a permis à certains postes de croître de 25 %, et à d’autres de diminuer de 25 %. L’entreprise est divisée en deux parties : celle en expansion et celle en contraction. »

L’histoire de NVIDIA et celle de McKinsey racontent la même chose.

Dans un monde 1:100, ce sont des tokens qui pilotent les agents, et l’humain n’est qu’une interface connectée à ces agents.

La télécommande externe n’est pas dans votre main

Pendant la semaine GTC, Huang Renxun était invité dans le podcast All-In, où il a dit une phrase encore plus percutante.

« Supposons que vous ayez un ingénieur avec un salaire annuel de 500 000 dollars. S'il n’utilise pas au moins 250 000 dollars de tokens, je serai très inquiet. »

L’animateur a demandé si NVIDIA dépensait 2 milliards de dollars en tokens pour ses équipes d’ingénieurs, Huang Renxun a répondu : « Nous faisons des efforts. »

Un ingénieur qui ne consomme pas de tokens, même avec 500 000 dollars, ne vaut pas cette somme.

La solution de NVIDIA est simple : intégrer des tokens dans le package salarial. Huang Renxun a déclaré lors de son discours principal à GTC qu’à l’avenir, chaque ingénieur de NVIDIA disposerait d’un budget annuel en tokens, équivalent à environ la moitié de son salaire de base.

Un ingénieur avec un salaire de plusieurs dizaines de milliers de dollars recevrait en plus une allocation de puissance de calcul pour le raisonnement, équivalente à la moitié de son salaire de base, ce qui représenterait un tiers de son package total en tokens.

Une personne utilisant la totalité de son budget en tokens aurait à sa disposition toute la journée une dizaine d’agents IA pour coder, tester, rechercher des documents, faire des simulations. Une autre, avec seulement une API gratuite, doit encore taper sur son clavier. Deux CV identiques peuvent produire 5 à 10 fois plus selon leur utilisation.

Ce n’est plus une théorie en Silicon Valley.

En mars dernier, Business Insider a rapporté un changement : lors des entretiens d’embauche, les ingénieurs commencent à demander « Quel est le budget en tokens pour ce poste ? » Tomasz Tunguz, associé chez Theory Ventures, qualifie ce budget de « quatrième pilier » de la rémunération, après salaire de base, bonus et actions.

Greg Brockman, président d’OpenAI, a été encore plus direct : « La quantité de puissance de raisonnement que vous pouvez invoquer déterminera de plus en plus votre productivité globale. »

Huang Renxun a lui-même déclaré lors de son discours à GTC : « Combien de tokens accompagne mon poste ? C’est déjà un outil de recrutement en Silicon Valley. »

Dans les années 1950, les salaires des ouvriers automobiles à Détroit étaient parmi les plus élevés aux États-Unis. Ce qui leur a permis de vivre une vie de classe moyenne, c’est la chaîne de montage inventée par Henry Ford. Les ouvriers étaient alignés, immobiles, la machine faisait le travail, leur productivité était multipliée par des dizaines. Le niveau de vie d’un ouvrier de Détroit dépassait largement celui des artisans de la même époque. Leur savoir-faire n’était pas forcément supérieur, mais ils travaillaient sur une chaîne plus large.

Le budget en tokens de 2026, c’est la chaîne de montage de 1950.

Mais il y a une différence.

Les ouvriers de Détroit pouvaient aller chez General Motors ou Chrysler, la chaîne de montage était partout. Les syndicats pouvaient négocier pour des lignes plus rapides ou plus sûres.

Le budget en tokens, lui, est différent. L’entreprise vous donne un jour l’impression d’être un super-héros, et le lendemain, vous redevenez un simple employé. Les actions peuvent être vendues, les compétences suivies lors d’un changement d’emploi. Le budget en tokens n’est qu’un accessoire, une fonction contrôlée par l’entreprise.

Silicon Valley a déjà un nouveau mot pour décrire cette situation : « GPU hunger » (faim de GPU).

Les meilleurs chercheurs en IA changent d’emploi, et la différence de salaire est désormais secondaire. La priorité, c’est la puissance de calcul. Sans expérimenter, sans déployer d’agents, leurs capacités sont limitées par leur quota. « Combien de tokens vous donnez ? » peut parfois passer avant la valeur des actions. Les actions sont une promesse de gains futurs, le budget en tokens, c’est la productivité immédiate.

Ceux qui n’utilisent pas l’IA sont tout simplement éliminés.

Goldman Sachs estime que l’IA pourrait automatiser 25 % des heures de travail aux États-Unis. Mercer indique que 65 % des cadres s’attendent à ce que 20 à 30 % des employés soient reconfigurés par l’IA. Deux chiffres qui se recoupent : ceux qui ont des tokens produisent énormément, ceux qui n’en ont pas sont optimisés hors du marché.

La frontière, c’est le quota de tokens, et la capacité humaine, de moins en moins liée.

Le débit en tokens, c’est la valorisation

La valeur individuelle dépend du quota de tokens. Et celle des entreprises ?

Début mars 2026, une société de Shanghai nommée MiniMax a publié son premier rapport annuel depuis sa création. Chiffre d’affaires annuel : 79 millions de dollars, perte nette ajustée : 250 millions. Selon les indicateurs financiers traditionnels, c’est une petite entreprise qui brûle de l’argent, avec un chiffre d’affaires inférieur à un trimestre d’Accenture.

Mais le marché ne la voit pas ainsi.

Le PDG de MiniMax, Yan Junjie, a déclaré lors de la conférence téléphonique : « La valeur de l’entreprise est déterminée par la densité d’intelligence multipliée par le débit en tokens. »

Le débit en tokens, ce n’est pas la croissance du chiffre d’affaires, ni le nombre d’utilisateurs, ni la marge brute.

Les données qui soutiennent cette affirmation sont solides. En février 2026, la consommation moyenne de tokens par jour du modèle M2 de MiniMax a été multipliée par 6 par rapport à décembre précédent. La consommation en tokens dans les scénarios de programmation a été multipliée par 10. Sur la plateforme d’agrégation de modèles IA OpenRouter, MiniMax a consommé 4,55 trillions de tokens en deux semaines, dépassant tous les modèles américains, et se plaçant en tête du classement mondial de consommation de tokens pour la première fois.

Le « South China Morning Post » a rapporté que cette réussite marquait la fin de la domination du marché américain par les développeurs, grâce à l’open source chinois. La clé ? La consommation de tokens. Plus un acteur brûle de tokens, plus il est gagnant.

Ce raisonnement vaut aussi pour OpenAI. Sa plateforme API traite 6 milliards de tokens par minute, en augmentation de 20 fois en deux ans. Les clients d’entreprise dépensant plus de 100 000 dollars par an ont vu leur consommation presque sept fois plus importante en un an. L’analyste de Barclays, Ross Sandler, a analysé ces chiffres et conclu : « La consommation de tokens d’OpenAI dépasse deux fois celle de Google Gemini. »

La consommation de tokens est devenue la monnaie dure pour classer les entreprises d’IA.

Ce qui est encore plus intéressant, c’est la façon dont cela se manifeste en interne. Le « New York Times » a récemment rapporté un phénomène appelé « tokenmaxxing » : des ingénieurs de Meta et d’OpenAI rivalisent pour voir qui consomme le plus de tokens.

Le quota de tokens devient une norme, comme le déjeuner gratuit ou l’assurance dentaire d’il y a dix ans. Un ingénieur dans le bureau d’ Ericsson à Stockholm a confié au « New York Times » que ses dépenses sur Claude dépassaient peut-être son salaire, mais que c’était l’entreprise qui payait.

Un article de TechCrunch la semaine dernière a fait un calcul : un ingénieur peut utiliser 10 000 tokens en écrivant un article l’après-midi, mais un ingénieur qui gère un cluster d’agents peut brûler plusieurs millions de tokens en une journée, sans taper un seul mot.

Il y a deux ans, le prix d’un million de tokens était de 33 dollars. Aujourd’hui, 9 cents. Une baisse de 99,7 %. Plus le prix est bas, plus la consommation est forte. Plus la consommation est forte, plus on devient dépendant.

Yan Junjie a prévu lors de la conférence : « La demande de tokens pourrait croître d’un ou deux ordres de grandeur à l’avenir. »

C’est ainsi qu’en 2026, une nouvelle façon de valoriser une entreprise apparaît. On ne regarde pas combien elle gagne, mais combien de tokens elle brûle. MiniMax perd 250 millions, mais sa courbe de croissance en débit de tokens est si raide que le marché est prêt à parier. On peut la comparer à YouTube en 2006, sans revenus, mais avec une consommation de bande passante en croissance exponentielle, Google ayant dépensé 1,65 milliard pour l’acquérir.

À l’époque, YouTube brûlait de la bande passante. Aujourd’hui, MiniMax brûle des tokens. La unité de mesure a changé, mais la logique reste la même.

Capacité d’abord, dette ensuite

La même semaine GTC, un autre événement.

Le 18 mars, Stripe a lancé le « Machine Payments Protocol ». En clair : les agents IA peuvent désormais dépenser eux-mêmes leur argent.

Un agent a besoin d’un jeu de données, il paie pour le télécharger. Il a besoin de puissance de calcul pour faire du raisonnement, il achète à la seconde. Il doit appeler l’API d’un autre agent, et payer. Tout cela sans intervention humaine. Visa a adapté ce protocole avec le paiement par carte de crédit, Coinbase a créé un portefeuille dédié aux agents, Mastercard développe « Agent Pay ».

Leur consommation de tokens a désormais une nouvelle source. Avant, il n’y avait que « l’humain qui pilote l’agent ». Maintenant, l’agent consomme aussi des tokens, et utilise l’argent gagné pour en acheter davantage. John Collison, cofondateur de Stripe, a utilisé un mot : « torrent » (fleuve).

Huang Renxun a donné des chiffres correspondants : NVIDIA veut faire passer le taux de génération de tokens de 22 millions à 700 millions, soit 350 fois plus.

C’est comme construire tout un réseau autoroutier, en pariant sur une croissance exponentielle du trafic.

Un pari d’infrastructure de 6000 milliards de dollars, sous réserve que la consommation mondiale de tokens soit suffisante pour rentabiliser. Ce n’est qu’une hypothèse, et une très coûteuse.

Au dernier trimestre 2025, les entreprises technologiques ont émis un record de 108,7 milliards de dollars d’obligations. Au début 2026, encore 100 milliards en quelques semaines.

Morgan Stanley et JPMorgan prévoient que dans les prochaines années, la dette totale des entreprises IA pourrait atteindre 1,5 trillion de dollars. Goldman Sachs estime que les dépenses en capital IA représentent déjà environ 3 % du PIB américain.

Les premiers à sentir le risque ont commencé à acheter des assurances. Le volume des swaps de défaillance de crédit augmente. En payant quelques points de base de prime, ils parient que ces entreprises ne pourront pas rembourser. Daniel Sorid, responsable de la stratégie de crédit chez Citi, a déclaré lors d’une réunion d’investisseurs : « En tant qu’investisseur en crédit, face à cette transformation de grande ampleur, il faut investir énormément de capital, ce qui est source d’inquiétude. »

Larry Page, cofondateur de Google, a dit quelque chose de plus extrême en interne : « Je préférerais faire faillite plutôt que de perdre cette course. »

Il décrit précisément un dilemme du prisonnier : chaque géant parie que ses concurrents continueront à investir, donc il ne peut pas s’arrêter. Ceux qui s’arrêtent sortent du jeu.

Le côté optimiste, c’est que les chiffres sont là. La vitesse de génération de tokens a été multipliée par 350. Stripe a permis aux agents de dépenser eux-mêmes leur argent. McKinsey a passé de quelques milliers à 25 000 agents en deux ans. Si l’économie des agents décolle, la courbe de croissance de la consommation de tokens pourrait devenir exponentielle.

Mais une date inquiète beaucoup : la fin des renouvellements, à la fin 2026.

2024-2025, les entreprises dépensent leur « budget d’innovation ». Le CEO doit dire lors des résultats : « Nous adoptons l’IA », sans trop se soucier du prix ou de l’efficacité, en dépensant pour l’image. À la fin 2026, les premiers projets pilotes arrivent à échéance. Le budget d’innovation est épuisé, le CTO cède sa place, le CFO s’assoit à la place. Le seul chiffre qui compte pour lui, c’est le ROI.

Si beaucoup de projets sont abandonnés, la consommation de tokens en fin de cycle pourrait soudainement chuter. La capacité créée par le dernier investissement de 6000 milliards de dollars, une fois que les centres de données sont construits, alimentés, et les puces installées, pourrait devenir inutilisée.

Une telle chose est déjà arrivée dans l’histoire.

En 2000, les télécoms ont dépensé un trillion de dollars pour déployer des câbles sous-marins. La bulle a éclaté, 90 % des câbles sont restés au fond de l’océan, inutilisés pendant près de dix ans. Ce n’est qu’avec l’arrivée de Netflix en streaming et de l’iPhone qui a lancé l’Internet mobile que ces câbles ont été allumés un par un. Les câbles n’ont pas été inutiles. Les entreprises qui les ont posés, Lucent, Nortel, WorldCom, ont fait faillite. L’infrastructure est là, mais les bâtisseurs ont disparu.

En 2012, la Chine a lancé le secteur photovoltaïque. Wuxi Suntech et Jiangxi Sanyi ont cassé le prix des modules solaires, en dessous du coût mondial. La capacité a été surdimensionnée, le secteur a été ravagé pendant trois ans. Puis la demande est revenue, et aujourd’hui, le solaire est la source d’énergie à la croissance la plus rapide sur Terre. Suntech a fait faillite. Sanyi aussi. Les pionniers ont été laissés dans l’obscurité, au seuil de l’aube.

Après l’invention du téléphone par Bell, Western Union a refusé d’acheter le brevet pour 100 000 dollars. Dix ans plus tard, Western Union était prêt à payer 25 millions, Bell ne voulait pas vendre. Trente ans plus tard, le réseau téléphonique couvrait toute l’Amérique. Mais la plupart des petites entreprises qui avaient construit le réseau n’ont pas survécu à la généralisation du téléphone. Le gagnant, c’est AT&T, qui a tout racheté et monopolisé.

L’histoire des infrastructures est toujours la même. La direction est presque toujours juste, mais le timing tue.

Revenons au Token. La structure évoquée plus haut, où le Token devient la main-d’œuvre, l’humain l’interface, et le quota de tokens la règle, repose sur une consommation continue, massive et accélérée. La productivité d’un ingénieur multipliée par 10 dépend du flux de tokens. Si on le coupe, tout s’effondre. La valorisation d’OpenAI, estimée à 840 milliards, repose sur la promesse de puissance de calcul. Si le protocole s’arrête, elle diminue. La capacité d’infrastructure de 6000 milliards dépend de la croissance de la consommation terminale. Si cette croissance ralentit, c’est le vide.

Chaque couche dépend de la suivante. Si la croissance de la consommation est deux ou trois ans plus lente que celle de la construction, toute la chaîne verra ses prix fluctuer.

Sur quelle voie ferrée repose votre avenir ?

En 2023, si vous avez du cash, c’est votre père. En 2026, si vous avez des tokens, c’est votre père.

Cela ressemble à un simple changement de mot, mais les changements sous-jacents sont plus profonds que ce que beaucoup réalisent.

Les GPU sont des actifs, une fois achetés, ils sont à vous, enfermés dans un data center, inaccessibles à d’autres.

Les tokens, eux, sont du flux. Votre productivité multipliée par 10, votre valorisation élevée, votre pouvoir de négociation, tout cela repose sur une offre continue, non appartenant à vous. Si on coupe le robinet, tout disparaît.

Quand les tokens deviennent une main-d’œuvre réelle, l’humain devient une interface connectée à ces tokens. Une bonne interface peut maximiser leur valeur, mais la capacité de cette interface dépend d’abord de la quantité de tokens qu’elle peut recevoir.

Dans les années 1870, les agriculteurs américains ont compris qu’il ne suffisait pas de produire du bon blé, il fallait aussi le vendre près des rails. Dans les années 1950, les artisans ne pouvaient rivaliser avec les ouvriers de la chaîne. En 2026, les ingénieurs découvrent que peu importe la beauté du code, sans budget en tokens, tout tourne en rond.

Quand les tokens deviennent une main-d’œuvre réelle, l’humain devient une interface. La qualité de cette interface reste importante, mais sa valeur dépend d’abord de qui l’alimente en tokens.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire