Dialogue avec le fondateur d'OpenClaw : l'IA est un levier et non un substitut, 80% des applications seront remplacées

Auteur : 宝玉

Ceci est une autre interview de 40 minutes avec Peter Steinberger, auteur de ClawdBot/OpenClaw, animée par Peter Yang.

Peter est le fondateur de PSPDFKit, avec près de 20 ans d’expérience en développement iOS. En 2021, après que l’entreprise a reçu un investissement stratégique de 100 millions d’euros de Insight Partners, il a choisi de « prendre sa retraite ». Aujourd’hui, son Clawdbot (qui a été renommé OpenClaw) connaît un succès fulgurant. Clawbot est un assistant IA capable de discuter avec vous via WhatsApp, Telegram, iMessage, connecté à diverses applications sur votre ordinateur.

Peter décrit Clawbot ainsi :

« C’est comme un ami qui vit dans votre ordinateur, un peu étrange, mais incroyablement intelligent.

Dans cette interview, il partage plusieurs points de vue intéressants : pourquoi un système complexe d’orchestration d’agents est un « générateur de slop », pourquoi « laisser l’IA fonctionner 24h/24 » est un indicateur de vanité, et pourquoi les langages de programmation ne sont plus si importants.

Prototype d’une heure, 300 000 lignes de code

Peter Yang lui demande ce qu’est exactement Clawbot, et pourquoi le logo représente une langouste.

Peter Steinberger ne répond pas directement à la question de la langouste, mais raconte une histoire. « Après ma retraite, je me suis lancé à fond dans le « vibe coding » — c’est-à-dire faire coder l’IA pour vous. Le problème, c’est que l’agent peut s’arrêter après une demi-heure ou deux minutes, puis revenir vous voir avec des questions. Si vous partez manger, en revenant, il peut être bloqué, c’est frustrant.

Il voulait quelque chose pour vérifier l’état de son ordinateur à tout moment sur son téléphone. Mais il ne s’est pas lancé, car il trouvait cela évident que de grandes entreprises allaient le faire.

« Quand personne ne l’a fait en novembre dernier, je me suis dit : tant pis, je vais le faire moi-même.

La première version était très simple : connecter WhatsApp à Claude Code. Envoyez un message, il appelle l’IA, puis renvoie le résultat. En une heure, c’était prêt.

Et là, il a « pris vie ». Aujourd’hui, Clawbot compte environ 300 000 lignes de code, supportant presque toutes les plateformes de messagerie principales.

« Je pense que c’est la voie de l’avenir. Chacun aura un IA super puissant qui vous accompagnera toute votre vie.

Il dit : « Une fois que vous donnez à l’IA l’accès à votre ordinateur, elle peut faire presque tout ce que vous pouvez faire. »

Le matin au Maroc

Peter Yang explique qu’aujourd’hui, il n’a plus besoin de rester devant son ordinateur, il suffit de lui donner des instructions.

Peter Steinberger acquiesce, mais il veut parler d’autre chose.

Une fois, il était au Maroc pour l’anniversaire d’un ami, et il s’est rendu compte qu’il utilisait constamment Clawbot. Demander son chemin, chercher un restaurant, ce sont des petites choses. Ce qui l’a vraiment surpris, c’est ce matin-là : quelqu’un a tweeté qu’une de ses bibliothèques open source avait un bug.

« J’ai pris une photo du tweet et l’ai envoyée sur WhatsApp.

L’IA a compris le contenu du tweet, compris qu’il s’agissait d’un rapport de bug. Elle a cloné le dépôt Git correspondant, corrigé le problème, soumis le code, puis répondu sur Twitter que c’était réglé.

« Je me suis dit : ça marche aussi ?

Une autre fois, c’était encore plus impressionnant. Il marchait dans la rue, fatigué de taper, et a envoyé un message vocal. Le problème, c’est qu’il n’avait pas prévu de faire parler Clawbot avec la voix.

« J’ai vu qu’il affichait ‘en train d’écrire’, je me suis dit : c’est fini. Et pourtant, il m’a répondu normalement.

Il a ensuite demandé à l’IA comment elle avait fait. L’IA a répondu : « J’ai reçu un fichier sans extension, j’ai regardé l’en-tête, j’ai vu que c’était du Ogg Opus. Tu as ffmpeg sur ton ordinateur, je l’ai utilisé pour le convertir en WAV. Ensuite, j’ai trouvé whisper.cpp, mais tu ne l’as pas installé, mais j’ai trouvé ta clé API OpenAI, et j’ai utilisé curl pour envoyer l’audio et faire la transcription. »

Peter Yang, après avoir entendu cela, a dit : « Ces trucs sont vraiment ingénieux, même un peu effrayants. »

« C’est bien plus puissant que ChatGPT en ligne, c’est comme une version débridée de ChatGPT. Beaucoup ne réalisent pas que des outils comme Claude Code ne sont pas seulement pour la programmation, ils peuvent répondre à toutes sortes de questions. »

La armée d’outils en ligne de commande (CLI)

Peter Yang lui demande comment ces outils d’automatisation sont construits, s’il les écrit lui-même ou si l’IA s’en charge.

Peter Steinberger sourit.

Ces derniers mois, il a beaucoup étoffé sa « armée de CLI ». La spécialité des agents, c’est d’appeler des outils en ligne de commande, car c’est ce que leur formation contient principalement.

Il a créé un CLI pour accéder à tous les services Google, y compris Places API. Il a aussi un CLI pour rechercher des memes et des GIFs, pour que l’IA puisse répondre avec des mèmes. Il a même développé un outil pour visualiser le son, pour que l’IA « expérimente » la musique.

« J’ai aussi piraté l’API d’un service de livraison local, maintenant l’IA peut me dire combien de temps il reste avant la livraison. J’ai aussi inversé l’API d’Eight Sleep, pour contrôler la température de mon lit.

【Note : Eight Sleep est un matelas intelligent qui peut ajuster la température du lit, mais l’API officielle n’est pas ouverte.】

Peter Yang demande : « Tout ça, c’est toi qui as fait faire à l’IA ? »

« Le plus intéressant, c’est que j’ai travaillé pendant 20 ans chez PSPDFKit, en développement Apple, en Swift et Objective-C, très spécialisé. Mais après, j’ai décidé de changer de voie, parce que j’en avais assez que Apple contrôle tout, et que faire des apps Mac était trop niche.

Le problème, c’est qu’il faut changer de stack technique, ce qui est très difficile. Tu maîtrises tous les concepts, mais tu ne connais pas la syntaxe. Qu’est-ce qu’un prop ? Comment diviser un tableau ? Chaque petite question nécessite une recherche, et tu te sens comme un idiot.

« Mais avec l’IA, tout ça disparaît. Ta pensée système, ta capacité d’architecture, ton goût, ton jugement sur les dépendances, ce sont ces choses qui ont de la valeur, et maintenant tu peux les transférer facilement dans n’importe quel domaine.

Il s’est arrêté un instant :

« Tout à coup, je me suis dit : je peux tout construire. La langue n’a plus d’importance, c’est ma pensée d’ingénieur qui compte. »

Contrôler le monde réel

Peter Steinberger commence à présenter sa configuration. La liste des permissions qu’il donne à l’IA est impressionnante :

Emails, calendrier, tous les fichiers, lampes Philips Hue, enceintes Sonos. Il peut lui demander de le réveiller le matin, en augmentant doucement le volume. L’IA peut aussi accéder à ses caméras de sécurité.

« Une fois, je lui ai demandé de surveiller s’il y avait des étrangers. Le lendemain matin, il m’a dit : ‘Peter, il y a quelqu’un.’ En regardant la vidéo, j’ai vu qu’il avait passé la nuit à faire des captures d’écran de mon canapé, car la qualité de la caméra n’était pas bonne, et le canapé ressemblait à une personne assise.

Dans son appartement à Vienne, l’IA peut aussi contrôler le système domotique KNX.

« Elle peut vraiment me bloquer à la porte. »

Peter Yang demande : « Comment tout ça est connecté ? »

« C’est simple : je lui dis directement. Ces choses ont des API, il va chercher sur Google, il trouve des clés dans ton système.

Les utilisateurs sont encore plus fous :

  • Certains lui demandent d’acheter sur Tesco en ligne
  • D’autres de commander sur Amazon
  • Certains lui demandent de répondre automatiquement à tous les messages
  • D’autres l’intègrent dans leur groupe familial comme « membre de la famille »

« Je lui ai demandé de faire le check-in sur le site de British Airways. C’est comme un test de Turing : faire naviguer un navigateur sur un site d’aéroport, avec une interface très peu conviviale.

La première fois, ça a pris près de 20 minutes, car tout était encore très rudimentaire. L’IA devait trouver le passeport dans Dropbox, extraire les infos, remplir le formulaire, faire la vérification humaine.

« Maintenant, ça ne prend que quelques minutes. Elle peut cliquer sur le bouton ‘Je suis humain’ parce qu’elle contrôle un vrai navigateur, avec un comportement indiscernable de celui d’un humain. »

80 % des applications disparaîtront

Peter Yang demande : « Quelles sont les méthodes sécurisées pour un utilisateur lambda qui vient de télécharger l’outil ? »

Peter Steinberger répond que chaque parcours est différent. Certains commencent à utiliser l’outil pour faire des apps iOS, d’autres pour gérer Cloudflare. Un utilisateur a installé l’outil la première semaine, puis l’a donné à sa famille, puis à son entreprise.

« J’ai installé ça pour un ami non technique, et il a commencé à m’envoyer des pull requests. Il n’en avait jamais fait de sa vie. »

Mais ce qu’il veut vraiment dire, c’est une vision plus large :

« Si vous y réfléchissez, cet outil pourrait remplacer 80 % des applications sur votre téléphone.

Pourquoi continuer à utiliser MyFitnessPal pour suivre votre alimentation ?

« J’ai un assistant infiniment ingénieux qui sait déjà que j’ai pris une mauvaise décision chez KFC. Je lui envoie une photo, il la stocke dans une base de données, calcule les calories, et me rappelle d’aller à la salle.

Pourquoi utiliser encore une app pour régler la température de Eight Sleep ? L’IA a l’API, elle peut le faire directement. Pourquoi utiliser une app de tâches à faire ? L’IA se souvient pour vous. Pourquoi faire le check-in de vol avec une app ? L’IA le fait pour vous. Pourquoi utiliser une app d’achat ? L’IA peut recommander, commander, suivre.

« Il y aura toute une couche d’applications qui disparaîtront peu à peu, car si elles ont une API, ce ne sont que des services que votre IA peut appeler. »

Il prévoit que 2026 sera l’année où beaucoup commenceront à explorer leur assistant personnel IA, et que les grandes entreprises entreront dans la danse.

« Clawbot n’est pas forcément le dernier gagnant, mais cette voie est la bonne. »

Parlez-lui simplement

Le sujet dérive vers la méthodologie de programmation IA. Peter Yang lui demande de parler de son article très populaire « Just Talk to It ».

Peter Steinberger explique que son idée centrale est : ne pas tomber dans le « piège de l’agent ».

« Je vois trop de gens sur Twitter découvrir que l’agent est puissant, puis vouloir le rendre encore plus puissant, et tomber dans le piège. Ils construisent toutes sortes d’outils complexes pour accélérer leur flux de travail, mais en réalité, ils ne font que construire des outils, sans créer quelque chose de vraiment précieux.

Il est aussi tombé dedans. Au début, il a passé deux mois à construire un tunnel VPN pour accéder à un terminal sur son téléphone. C’était tellement bien fait qu’un jour, en mangeant au restaurant avec un ami, il était tout le temps en vibe coding sur son téléphone, au lieu de participer à la conversation.

« J’ai dû m’arrêter, surtout pour ma santé mentale. »

Slop Town

Il est récemment devenu fou furieux à cause d’un système d’orchestration appelé Gastown.

« Un orchestrateur super complexe, qui fait tourner une dizaine ou une vingtaine d’agents, qui communiquent, se répartissent le travail. Il y a un observateur (watcher), un superviseur (overseer), un maire (mayor), des pcats (peut-être des rôles comme ‘civils’ ou ‘chats domestiques’), je ne sais même pas ce qu’il y a d’autre.

Peter Yang : « Attends, il y a un maire aussi ? »

« Oui, dans le projet Gastown, il y a un maire. Je l’appelle ‘Slop Town’ (ville de la boue).

Et il y a le mode RALPH (un mode de boucle à tâche unique ‘jetable’, où on donne une petite tâche à l’IA, puis on efface tout, on recommence, en boucle…)…

« C’est la machine à brûler des tokens ultime. Tu la fais tourner toute la nuit, et le matin, tu récupères un tas de slop. »

Le problème central, c’est que ces agents n’ont pas encore de goût. Ils sont très intelligents dans certains domaines, mais si tu ne les guides pas, si tu ne leur dis pas ce que tu veux, ils produisent du trash.

« Je ne sais pas comment les autres travaillent, mais quand je démarre un projet, je n’ai qu’une idée vague. Au fur et à mesure, en construisant, en jouant, en ressentant, ma vision devient claire. J’essaie des choses, certaines échouent, puis mes idées évoluent vers la forme finale. Mon prochain prompt dépend de ce que je vois, ressens, pense à l’instant. »

Si tu essaies de tout écrire dans un cahier des charges initial, tu rates cette boucle homme-machine.

« Je ne vois pas comment faire du bon boulot sans ressentir, sans goût. »

Quelqu’un sur Twitter montre une application de notes générée entièrement par RALPH. Peter répond : « Oui, ça ressemble à du RALPH, personne de sensé ne concevrait ça comme ça. »

Peter Yang résume : beaucoup de gens font tourner l’IA 24h/24 non pas pour faire des apps, mais pour prouver qu’ils peuvent faire tourner l’IA 24h/24.

« C’est comme une compétition de taille sans référence. J’ai aussi fait tourner la boucle 26 heures, j’étais très fier. Mais c’est une vanité sans intérêt. Pouvoir construire tout ça ne veut pas dire que tu devrais tout construire, ni que ce sera forcément bon. »

Le mode plan, un bricolage (Hack)

Peter Yang lui demande comment il gère le contexte. Si la conversation devient longue, l’IA se perd, faut-il la compresser ou la résumer ?

Peter Steinberger répond que c’est « le problème du mode ancien ».

« Claude Code a encore ce problème, mais Codex est bien meilleur. Sur le papier, il y a peut-être 30 % de contexte en plus, mais en pratique, ça donne l’impression de 2-3 fois plus. Je pense que c’est lié à la mécanique interne de réflexion. La plupart de mes fonctionnalités se développent dans une seule fenêtre de contexte, où discussion et construction se font en même temps.

Je n’utilise pas de worktrees, car c’est une « complexité inutile ». Je clone plusieurs dépôts : clawbot-1, clawbot-2, etc. Celui qui est libre, je l’utilise, je teste, je fusionne dans main, je synchronise.

« C’est un peu comme une usine, si tous sont occupés. Mais si tu n’en utilises qu’un seul, tu dois attendre longtemps, et tu ne peux pas entrer dans le flow.

Peter Yang compare ça à un jeu de stratégie en temps réel : tu as une équipe qui attaque, il faut la gérer et la surveiller.

Concernant le mode plan, Peter Steinberger a une opinion controversée :

« Le mode plan, c’est une solution bricolée qu’Anthropic a dû ajouter parce que le modèle est trop impulsif. Au début, il se met à coder dès qu’on lui parle. Si tu utilises le dernier modèle, comme GPT 5.2, tu dialogues avec lui. ‘Je veux faire cette fonction, il faut faire comme ça, j’aime ce style de design, propose-moi plusieurs options, on en discute.’ Ensuite, il propose, vous discutez, vous vous mettez d’accord, et vous commencez à coder.

Il ne tape pas, il parle.

« La plupart du temps, je lui parle. »

Développement piloté par Discord

Peter Yang lui demande comment il procède pour développer de nouvelles fonctionnalités. Commence-t-il par explorer le problème ou faire un plan ?

Peter Steinberger explique qu’il a fait une chose « peut-être la plus folle » : il a connecté son Clawbot à un serveur Discord public, pour que tout le monde puisse discuter avec son IA privée, avec ses souvenirs personnels, en public.

« C’est difficile à décrire. C’est un mélange entre Jarvis (l’IA de Iron Man) et le film ‘Her’. Chaque personne à qui je montre, est super enthousiaste, mais poster des images avec du texte sur Twitter ne marche pas. Donc j’ai pensé : autant laisser tout le monde expérimenter.

Les utilisateurs posent des questions, signalent des bugs, demandent des fonctionnalités dans Discord. Mon processus de développement actuel : prendre une capture d’écran de la conversation Discord, la coller dans le terminal, dire à l’IA : ‘Disons que…’.

« Je suis trop paresseux pour taper. Si quelqu’un demande ‘Vous supportez ceci ou cela ?’, je laisse l’IA lire le code et écrire une FAQ. »

Il a aussi écrit un crawler qui scanne au moins une fois par jour le canal d’aide Discord, pour que l’IA en fasse un résumé des plus gros problèmes, puis ils corrigent.

Pas de MCP, pas d’orchestration complexe

Peter Yang demande : « Tu utilises ces trucs sophistiqués ? Multi-agent, skills complexes, MCP (Model Context Protocol) ? »

« La plupart de mes skills sont des compétences de vie : suivre son alimentation, faire les courses, ce genre de choses. En programmation, c’est très peu utilisé, car ce n’est pas nécessaire. Je n’utilise pas MCP, ni rien de tout ça. »

Il ne croit pas aux systèmes d’orchestration complexes.

« Je suis dans une boucle, je peux faire des produits qui ont une meilleure sensation. Peut-être qu’il y a des méthodes plus rapides, mais je suis déjà proche du plafond, ce qui me limite, c’est surtout ma vitesse de réflexion, et parfois le temps d’attente pour Codex. »

Son ancien cofondateur de PSPDFKit, un ex-avocat, lui envoie aussi des PR (pull requests).

« L’IA permet à des gens sans background technique de créer des choses, c’est incroyable. Je sais que certains sont contre, disant que ce code n’est pas parfait. Mais je considère les PR comme des prompts, qui transmettent une intention. La plupart des gens n’ont pas la même compréhension du système, ils ne peuvent pas guider le modèle vers le meilleur résultat. Donc je préfère prendre l’intention, faire moi-même, ou réécrire à partir de leurs PR. »

Il marque souvent leurs contributions comme co-auteur, mais il fusionne rarement directement leur code.

Trouve ta propre voie

Peter Yang résume : l’essentiel, c’est de ne pas utiliser un générateur de slop, de garder l’humain dans la boucle, car le cerveau et le goût humains sont irremplaçables.

Peter Steinberger ajoute :

« Ou alors, il faut trouver sa propre voie. Beaucoup me demandent ‘Comment tu fais ?’, la réponse est : il faut explorer par soi-même. Apprendre ces choses prend du temps, faire ses erreurs. C’est pareil pour tout apprentissage, sauf que dans ce domaine, tout évolue très vite.

Clawdbot est disponible sur clawd.bot et GitHub. Clad avec W, C-L-A-W-D-B-O-T, comme une pince de langouste.

【Note : ClawdBot a été renommé OpenClaw.】

Peter Yang dit qu’il doit aussi essayer. Il ne veut pas rester devant l’ordi à discuter avec l’IA, mais donner des instructions à tout moment, même dehors, en s’occupant de ses enfants.

« Je pense que tu vas aimer. » dit Peter Steinberger.

Les idées principales de Peter Steinberger peuvent être résumées en deux phrases :

  1. L’IA est devenue suffisamment puissante pour remplacer 80 % des applications sur ton téléphone
  2. Mais sans le goût et le jugement humain dans la boucle, le résultat sera du trash

Ces deux phrases semblent contradictoires, mais elles pointent vers la même conclusion : l’IA est un levier, pas un substitut. Elle amplifie ce que tu as déjà : la pensée systémique, la capacité d’architecture, l’intuition pour de bons produits. Si tu ne possèdes pas ces qualités, faire tourner 24h/24 une multitude d’agents ne produira que du slop en masse.

Sa pratique elle-même en est la meilleure preuve : un vieux programmeur iOS avec 20 ans d’expérience a construit en quelques mois un projet de 300 000 lignes en TypeScript, non pas en apprenant une nouvelle syntaxe, mais grâce à ces concepts indépendants du langage.

« La langue de programmation n’est plus importante, c’est ma pensée d’ingénieur qui compte. »

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler

Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)