Selon 1M AI News, Yang Zhiling, fondateur de la face cachée de la lune, a animé une table ronde sur le thème d’OpenClaw et de l’IA open source lors du Forum de Zhongguancun en 2026.
Les invités comprenaient Zhang Peng, PDG de Zhupu Huazhang, Xia Lixue, co-fondateur et PDG de la société d’infrastructure de puissance de calcul IA Wuwen Xinqiong, Luo Fuli, responsable du grand modèle MiMo de Xiaomi, et Huang Chao, professeur adjoint à l’Université de Hong Kong, couvrant trois niveaux : modèle, infrastructure de puissance de calcul et applications Agent.
Xia Lixue a donné une donnée intuitive : depuis la fin janvier, l’utilisation de tokens de Wuwen Xinqiong double toutes les deux semaines, atteignant un total multiplié par dix, « La dernière fois que j’ai vu une telle vitesse, c’était pendant l’ère 3G avec le trafic mobile ». Zhang Peng a expliqué la logique de l’augmentation récente du prix du modèle Zhipu GLM5 Turbo du point de vue des fabricants de modèles : l’Agent n’est plus une question-réponse ; la quantité de tokens consommée pour accomplir une tâche peut être dix fois voire cent fois supérieure à celle nécessaire pour répondre à des questions simples, impliquant une planification de tâches à long terme, un débogage continu et un traitement d’informations multimodales, « Compétir uniquement sur les prix bas à long terme ne favorise pas le développement de l’ensemble du secteur ».
Luo Fuli estime que le principal goulot d’étranglement de l’ère des Agents est le coût et la vitesse du raisonnement sur de longs contextes ; seuls des contextes d’un million voire dix millions de tokens permettront de réaliser des tâches de véritable valeur productive avec des coûts suffisamment bas et des vitesses suffisamment rapides. Elle a révélé que l’« auto-évolution » du modèle est passée du concept à la pratique, car pour des tâches de recherche scientifique clairement définies, le modèle peut maintenant fonctionner de manière autonome pendant deux à trois jours, ce qui a accéléré l’efficacité de la recherche de l’équipe d’environ dix fois. Elle a également posé une question : la demande en raisonnement a augmenté d’environ dix fois au cours de la dernière période, la croissance globale des tokens cette année atteindra-t-elle cent fois ?
Huang Chao a décomposé trois goulots d’étranglement techniques au niveau des applications Agent : l’insuffisance de la capacité de planification des tâches à long terme, la pression de l’expansion de la mémoire due à la collaboration de plusieurs Agents, et les risques liés aux outils de faible qualité et aux injections malveillantes dans l’écosystème des compétences. Il a souligné que la gestion de la mémoire dans les cadres existants est encore limitée aux systèmes de fichiers et au format Markdown, et qu’il est nécessaire d’évoluer vers une conception en couches à l’avenir.
À la fin de la table ronde, les quatre invités ont chacun résumé en un mot les tendances des 12 prochains mois :