Đối thoại với người sáng lập OpenClaw: AI là đòn bẩy chứ không phải thay thế, 80% ứng dụng sẽ bị thay thế

Tác giả: Bảo Ngọc

Đây là một cuộc phỏng vấn 40 phút khác của tác giả ClawdBot/OpenClaw Peter Steinberger, do Peter Yang chủ trì.

Peter là người sáng lập PSPDFKit, có gần 20 năm kinh nghiệm phát triển iOS. Sau khi công ty được Insight Partners đầu tư chiến lược 100 triệu euro vào năm 2021, anh chọn “nghỉ hưu”. Hiện tại, Clawdbot (đã đổi tên thành OpenClaw) do anh phát triển đang bùng nổ. Clawbot là trợ lý AI có thể trò chuyện với bạn qua WhatsApp, Telegram, iMessage, kết nối với các ứng dụng trên máy tính của bạn.

Peter mô tả về Clawbot như sau:

“Nó giống như một người bạn sống trong máy tính của bạn, hơi kỳ quặc nhưng cực kỳ thông minh.

Trong cuộc phỏng vấn này, anh chia sẻ nhiều quan điểm thú vị: tại sao hệ thống điều phối các tác nhân (Agent) phức tạp là “máy tạo slop”, tại sao “để AI chạy 24 giờ” là chỉ số thể hiện sự phù phiếm, và tại sao ngôn ngữ lập trình đã không còn quan trọng nữa.

Một giờ nguyên mẫu, 30 nghìn dòng mã

Peter Yang hỏi anh Clawbot là gì, tại sao logo lại là con tôm hùm.

Peter Steinberger không trả lời trực tiếp câu hỏi về con tôm hùm mà kể một câu chuyện. “Sau khi nghỉ hưu, tôi dành toàn bộ tâm huyết vào việc lập trình theo cảm xúc (vibe coding) — tức là để AI giúp bạn viết mã. Vấn đề là, các tác nhân có thể chạy nửa tiếng hoặc hai phút rồi dừng lại hỏi bạn. Bạn đi ăn cơm về, phát hiện nó đã bị kẹt từ lâu, rất phiền.

Anh muốn có một thứ có thể kiểm tra trạng thái máy tính bất cứ lúc nào trên điện thoại. Nhưng anh không tự làm vì nghĩ chuyện đó quá rõ ràng, các công ty lớn chắc chắn sẽ làm.

“Đến tháng 11 năm ngoái, không ai làm, tôi nghĩ thôi, tự làm vậy.

Phiên bản ban đầu cực kỳ đơn giản: kết nối WhatsApp với Claude Code. Gửi tin nhắn, nó gọi AI, trả kết quả lại. Chỉ trong một giờ là xong.

Rồi nó “sống dậy”. Hiện tại, Clawbot có khoảng 30 nghìn dòng mã, hỗ trợ hầu hết các nền tảng nhắn tin chính.

“Tôi nghĩ đây chính là hướng đi tương lai. Mỗi người sẽ có một AI siêu mạnh, theo bạn suốt đời.

Anh nói, “Một khi bạn cấp quyền truy cập cho AI vào máy tính của bạn, nó gần như có thể làm bất cứ điều gì bạn có thể làm.”

Sáng sớm ở Morocco

Peter Yang nói, giờ bạn không cần phải ngồi trước máy tính để theo dõi nữa, chỉ cần ra lệnh cho nó.

Peter Steinberger gật đầu, nhưng anh muốn nói về một chuyện khác.

Có lần anh đi sinh nhật bạn ở Morocco, phát hiện mình liên tục dùng Clawbot. Hỏi đường, tìm quán ăn ngon, những chuyện nhỏ đó. Điều khiến anh ngạc nhiên là sáng hôm đó: có người đăng tweet nói rằng một thư viện mã nguồn mở của anh có bug.

“Tôi chụp ảnh tweet đó, gửi qua WhatsApp.

AI hiểu nội dung tweet, nhận biết đây là báo cáo lỗi. Nó checkout kho mã Git tương ứng, sửa lỗi, đẩy mã lên, rồi trả lời người đó trên Twitter rằng đã sửa xong.

“Tôi nghĩ, chuyện này cũng làm được sao?

Lại còn một chuyện kỳ lạ hơn nữa. Anh đi trên phố, lười gõ, gửi một tin nhắn thoại. Vấn đề là, anh chưa từng lập trình để Clawbot hỗ trợ gửi tin thoại.

“Thấy nó hiện ‘đang nhập’, tôi nghĩ là xong rồi. Nhưng kết quả là nó vẫn trả lời bình thường.

Sau đó anh hỏi AI làm thế nào. AI nói: Tôi nhận được một tệp không có phần mở rộng, tôi xem phần đầu tệp thì biết là định dạng Ogg Opus. Trong máy anh có ffmpeg, tôi dùng nó chuyển sang WAV. Rồi tôi tìm whisper.cpp, nhưng không cài đặt, may mắn là tôi tìm ra API key của bạn, dùng curl gửi âm thanh để chuyển thành văn bản.

Peter Yang nghe xong nói: “Những thứ này thật sự có cách làm, dù hơi đáng sợ.”

“Vượt xa ChatGPT trên web, giống như là giải phóng ChatGPT vậy. Nhiều người không nhận ra, Claude Code không chỉ giỏi lập trình, mà còn xử lý mọi vấn đề rất tốt.

Đội quân công cụ dòng lệnh (CLI)

Peter Yang hỏi, những công cụ tự động hóa đó được xây dựng như thế nào, tự viết hay để AI viết?

Peter Steinberger cười.

Trong vài tháng qua, anh đã mở rộng “đội quân CLI” của mình. Tác nhân AI giỏi nhất ở chỗ nào? Gọi các công cụ dòng lệnh, vì dữ liệu huấn luyện của nó toàn là thế.

Anh đã xây dựng một CLI truy cập toàn bộ dịch vụ của Google, bao gồm Places API. Có một cái chuyên để tra emoji và GIF, để khi AI phản hồi tin nhắn có thể gửi meme. Thậm chí còn làm một công cụ trực quan hóa âm thanh, muốn AI “trải nghiệm” âm nhạc.

“Tôi còn xâm nhập API của dịch vụ giao đồ ăn địa phương, giờ AI có thể nói cho tôi biết còn bao lâu nữa đồ ăn sẽ đến. Thêm nữa, tôi đã reverse API của Eight Sleep — một loại nệm thông minh có thể điều chỉnh nhiệt độ, nhưng chưa chính thức mở API.

【Chú thích: Eight Sleep là một loại nệm thông minh có thể điều chỉnh nhiệt độ, API chính thức chưa được mở.】

Peter Yang hỏi tiếp: “Tất cả những thứ này là do bạn nhờ AI giúp xây dựng?”

“Điều thú vị nhất là, tôi từng làm việc 20 năm trong PSPDFKit, phát triển hệ sinh thái Apple, Swift, Objective-C, rất thành thạo. Nhưng sau đó tôi quyết định đổi hướng, vì tôi chán chuyện Apple kiểm soát mọi thứ, và làm Mac app thì đối tượng quá hẹp.

Vấn đề là, từ một hệ thống kỹ thuật thành thạo chuyển sang lĩnh vực khác, quá trình rất đau đớn. Bạn hiểu tất cả khái niệm, nhưng không biết cú pháp. Prop là gì? Mảng thì sao? Mỗi câu hỏi nhỏ đều phải tra cứu, cảm giác như mình là kẻ ngốc.

“Nhưng có AI, tất cả những điều đó biến mất. Tư duy hệ thống, khả năng kiến trúc, gu thẩm mỹ, đánh giá phụ thuộc — đó mới là thứ thực sự có giá trị, và giờ đây có thể dễ dàng chuyển sang lĩnh vực khác.

Anh dừng lại một chút:

“Đột nhiên tôi cảm thấy mình có thể xây dựng mọi thứ. Ngôn ngữ không còn quan trọng nữa, quan trọng là tư duy kỹ thuật của tôi.”

Kiểm soát thế giới thực

Peter Steinberger bắt đầu trình diễn thiết lập của mình. Danh sách quyền truy cập cho AI khiến người xem phải tròn mắt:

Email, lịch, tất cả các tệp, đèn Philips Hue, loa Sonos. Anh có thể để AI gọi thức dậy vào sáng, từ từ tăng âm lượng. AI còn có thể truy cập camera an ninh của anh.

“Có lần tôi để nó theo dõi xem có người lạ không. Sáng hôm sau nó báo: ‘Peter, có người đó.’ Tôi xem video, nó đã chụp màn hình liên tục chiếc ghế sofa của tôi suốt đêm, vì camera chất lượng kém, trông như có người ngồi.

Trong căn hộ ở Vienna, AI còn điều khiển hệ thống nhà thông minh KNX.

“Nó thực sự có thể khóa tôi ngoài cửa.”

Peter Yang hỏi: “Làm thế nào để kết nối các thiết bị đó?”

“Chỉ cần nói trực tiếp với nó. Những thứ này rất dễ, nó sẽ tự tìm API, Google, và tìm khóa trong hệ thống của bạn.

Người dùng còn làm những chuyện điên rồ hơn:

  • Có người nhờ nó mua sắm trên Tesco
  • Có người đặt hàng trên Amazon
  • Có người để nó tự động trả lời tất cả tin nhắn
  • Có người đưa nó vào nhóm gia đình như một “thành viên”

“Tôi nhờ nó giúp check-in trên trang British Airways. Thật như một bài kiểm tra Turing, thao tác trình duyệt trên trang của hãng hàng không, giao diện cực kỳ phản cảm.

Lần đầu mất gần 20 phút, vì hệ thống còn rất thô sơ. AI cần tìm hộ chiếu trong Dropbox của tôi, trích xuất thông tin, điền vào mẫu, vượt qua xác thực bằng con người.

“Giờ chỉ mất vài phút. Nó có thể nhấn nút xác nhận ‘Tôi là người’ vì nó đang kiểm soát một trình duyệt thực sự, hành vi không khác gì người thật.”

80% ứng dụng sẽ biến mất

Peter Yang hỏi: “Với người dùng mới tải về, có cách nào an toàn để bắt đầu không?”

Peter Steinberger nói, mỗi người sẽ có lộ trình riêng. Có người cài rồi bắt đầu dùng để viết app iOS, có người quản lý Cloudflare, có người cài cho bản thân trong tuần đầu, rồi cài cho gia đình tuần thứ hai, đến tuần thứ ba bắt đầu làm phiên bản doanh nghiệp cho công ty.

“Có một người bạn không kỹ thuật cài xong, bắt đầu gửi pull request cho tôi. Trong đời chưa từng gửi pull request nào.

Nhưng anh muốn nói về bức tranh lớn hơn:

“Bạn nghĩ xem, thứ này có thể thay thế 80% ứng dụng trên điện thoại của bạn.

Tại sao còn phải dùng MyFitnessPal để ghi lại chế độ ăn?

“Tôi có một trợ lý vô cùng resourceful, đã biết tôi đã quyết định sai ở KFC. Gửi ảnh, nó sẽ lưu vào database, tính lượng calo, nhắc tôi đi tập gym.

Tại sao còn phải dùng app để điều chỉnh nhiệt độ Eight Sleep? AI có API, trực tiếp giúp bạn điều chỉnh. Tại sao còn phải dùng app để quản lý danh sách việc cần làm? AI giúp bạn ghi nhớ. Tại sao còn phải dùng app check-in chuyến bay? AI giúp bạn làm. Tại sao còn phải dùng app mua sắm? AI có thể đề xuất, đặt hàng, theo dõi.

“Chắc chắn sẽ có một lớp ứng dụng dần biến mất, vì nếu chúng có API, chỉ là dịch vụ mà AI của bạn sẽ gọi.

Anh dự đoán năm 2026 sẽ là năm nhiều người bắt đầu khám phá trợ lý AI cá nhân, các tập đoàn lớn cũng sẽ tham gia.

“Clawbot không nhất thiết là người chiến thắng cuối cùng, nhưng hướng đi này là đúng.”

Chỉ cần nói chuyện với nó

Chuyển sang chủ đề phương pháp lập trình AI. Peter Yang nói anh đã viết một bài rất nổi tên “Just Talk to It”, muốn nghe anh mở rộng.

Peter Steinberger chia sẻ quan điểm cốt lõi: đừng rơi vào “bẫy tác nhân” (agentic trap).

“Trên Twitter, tôi thấy quá nhiều người phát hiện ra tác nhân rất giỏi rồi muốn nó giỏi hơn nữa, rồi rơi vào vòng xoáy. Họ xây dựng các công cụ phức tạp để tăng tốc quy trình làm việc, nhưng cuối cùng chỉ là xây dựng công cụ, chứ không tạo ra thứ thực sự có giá trị.

Anh cũng từng mắc phải. Ban đầu, anh mất hai tháng xây VPN tunnel để truy cập terminal trên điện thoại. Làm quá tốt, có lần đang ăn ở nhà hàng với bạn, anh toàn vibe coding trên điện thoại chứ không tham gia trò chuyện.

“Phải dừng lại, chủ yếu để giữ gìn sức khỏe tâm thần.”

Slop Town

Gần đây, anh bị một hệ thống gọi là Gastown làm phát điên.

“Là một hệ thống điều phối cực kỳ phức tạp, chạy cùng lúc mười, hai mươi tác nhân AI, chúng giao tiếp, phân công công việc. Có watcher (người giám sát), overseer (người giám sát cấp cao), có cả mayor (thị trưởng), rồi các pcat (có thể là ‘dân thường’ hoặc ‘mèo cưng’ để làm vai trò phụ), tôi còn không biết còn gì nữa.

Peter Yang: Khoan, còn có thị trưởng nữa sao?

“Đúng vậy, trong dự án Gastown có một thị trưởng. Tôi gọi dự án này là ‘Thị trấn rác’ (Slop Town).

Còn có chế độ RALPH (một chế độ vòng lặp nhiệm vụ đơn “dùng rồi bỏ”), nghĩa là giao cho AI một nhiệm vụ nhỏ, làm xong rồi bỏ hết tất cả ký ức ngữ cảnh, mọi thứ về 0, rồi lặp lại…

“Chuyện này đúng là máy đốt token tối thượng. Bạn để nó chạy suốt đêm, sáng ra nhận về là đống rác rưởi (slop).

Vấn đề cốt lõi là: các tác nhân này còn chưa có gu thẩm mỹ. Chúng rất thông minh trong một số lĩnh vực, nhưng nếu bạn không hướng dẫn, không nói rõ mong muốn, kết quả ra là rác.

“Tôi không biết người khác làm thế nào, còn tôi, khi bắt đầu một dự án, chỉ có một ý tưởng mơ hồ. Trong quá trình xây dựng, chơi đùa, cảm nhận, tôi dần hình thành tầm nhìn rõ ràng hơn. Tôi thử nhiều thứ, có thứ không thành, rồi ý tưởng của tôi sẽ tiến hóa thành hình dạng cuối cùng. Lời nhắc (prompt) tiếp theo của tôi phụ thuộc vào trạng thái hiện tại tôi đang thấy, cảm nhận, suy nghĩ.

Nếu bạn cố gắng viết tất cả vào phần đặc tả ban đầu, bạn sẽ bỏ lỡ vòng lặp người-máy này.

“Không có cảm xúc, không có gu thẩm mỹ tham gia, làm sao có thể tạo ra thứ tốt?”

Có người trên Twitter khoe một ứng dụng ghi chú “toàn do RALPH sinh ra”. Peter trả lời: “Đúng vậy, trông y hệt như do RALPH sinh ra, không ai thiết kế kiểu đó đâu.”

Peter Yang tổng kết: nhiều người chạy AI 24 giờ không phải để làm app, mà để chứng minh mình có thể để AI chạy 24 giờ.

“Giống như thi đo kích cỡ không có tham chiếu. Tôi cũng để vòng lặp chạy 26 giờ, rất tự hào. Nhưng đó là sự phù phiếm, vô nghĩa. Xây dựng mọi thứ không có nghĩa là bạn nên xây mọi thứ, cũng không đảm bảo nó sẽ tốt.”

Chế độ kế hoạch (Plan Mode) là một mớ hỗn độn (Hack)

Peter Yang hỏi, anh quản lý ngữ cảnh thế nào? Nói chuyện dài quá AI có bị rối không, cần nén hoặc tóm tắt không?

Peter Steinberger nói, đây là “vấn đề của chế độ cũ”.

“Claude Code vẫn gặp vấn đề này, nhưng Codex tốt hơn nhiều. Trong lý thuyết, có thể chỉ cần thêm 30% ngữ cảnh, nhưng cảm giác như gấp 2-3 lần. Tôi nghĩ là liên quan đến cơ chế suy nghĩ nội bộ. Hiện tại, phần lớn chức năng của tôi đều có thể hoàn thành trong một cửa sổ ngữ cảnh, vừa thảo luận vừa xây dựng cùng lúc.

Tôi không dùng worktrees, vì đó là “độ phức tạp không cần thiết”. Tôi đơn giản checkout nhiều kho: clawbot-1, clawbot-2, clawbot-3, clawbot-4, clawbot-5. Kho nào rảnh thì dùng, làm xong test, đẩy lên main, đồng bộ.

“Giống như một nhà máy, nếu tất cả đều bận rộn. Nhưng nếu chỉ mở một kho, chờ đợi quá lâu, không vào được trạng thái dòng chảy.

Peter Yang nói, điều này giống như trò chơi chiến thuật thời gian thực, bạn có một đội quân tiến công, phải quản lý và giám sát họ.

Về chế độ plan, Peter Steinberger có một quan điểm gây tranh cãi:

“Plan mode là một giải pháp tạm thời do Anthropic thêm vào, vì mô hình quá bốc đồng, cứ vừa bắt đầu là chạy đi viết code. Nếu dùng mô hình mới nhất, như GPT 5.2, bạn chỉ cần trò chuyện với nó. ‘Tôi muốn xây chức năng này, làm thế này, tôi thích phong cách thiết kế này, cho tôi vài phương án, chúng ta bàn bạc trước.’ Sau đó nó sẽ đề xuất, hai bên thảo luận, đạt đồng thuận rồi mới bắt đầu.

Anh không gõ phím, mà nói chuyện.

“Phần lớn tôi đều nói chuyện với nó.”

Phát triển qua Discord

Peter Yang hỏi, quy trình phát triển chức năng mới của anh là gì? Khám phá vấn đề trước? Lập kế hoạch trước?

Peter Steinberger nói, anh đã làm một việc “có thể là điên nhất tôi từng làm”: anh kết nối Clawbot của mình với một máy chủ Discord công khai, để mọi người có thể trò chuyện với AI riêng của anh, mang theo ký ức cá nhân, trong không gian công cộng.

“Dự án này rất khó diễn đạt bằng lời. Giống như sự pha trộn giữa Jarvis (trợ lý AI trong Iron Man) và phim ‘Cô ấy’ (Her). Mọi người tôi trình diễn đều rất phấn khích, nhưng đăng hình kèm mô tả trên Twitter thì không nổi bật. Nên tôi nghĩ, cứ để mọi người tự trải nghiệm.

Người dùng hỏi, báo lỗi, đề xuất yêu cầu trong Discord. Hiện tại, quy trình của tôi là: chụp màn hình cuộc trò chuyện Discord, kéo vào terminal, nói “Chúng ta bàn chuyện này”.

“Tôi lười gõ phím. Có người hỏi ‘Các bạn có hỗ trợ cái này không’, tôi để AI đọc mã rồi viết FAQ.

Anh còn viết một trình quét, mỗi ngày ít nhất một lần quét kênh help của Discord, để AI tổng hợp các vấn đề lớn nhất, rồi sửa.

Không có MCP, không có điều phối phức tạp

Peter Yang hỏi: “Anh có dùng các thứ hoa mỹ đó không? Tác nhân nhiều, kỹ năng phức tạp, MCP (Model Context Protocol) chẳng hạn?”

“Phần lớn kỹ năng của tôi là kỹ năng sống: ghi chép chế độ ăn, mua sắm, kiểu đó. Về lập trình thì rất ít, vì không cần. Tôi không dùng MCP, không dùng mấy thứ đó.

Anh không tin vào hệ thống điều phối phức tạp.

“Trong vòng lặp của tôi, tôi có thể tạo ra sản phẩm cảm giác tốt hơn. Có thể có cách nhanh hơn, nhưng tôi đã gần đến giới hạn, không còn do AI nữa, chủ yếu là tốc độ suy nghĩ của bản thân, thỉnh thoảng còn bị giới hạn bởi thời gian chờ Codex.

Người đồng sáng lập PSPDFKit trước đây, từng là luật sư, giờ cũng gửi PR cho anh.

“AI giúp những người không có nền tảng kỹ thuật cũng có thể xây dựng mọi thứ, điều này thật kỳ diệu. Tôi biết có người phản đối, nói rằng mã không hoàn hảo. Nhưng tôi xem pull request như một prompt request (lời nhắc), chúng truyền đạt ý định. Hầu hết mọi người không có hệ thống hiểu như tôi, không thể dẫn dắt mô hình đến kết quả tối ưu, nên tôi thích lấy ý định rồi tự làm hoặc dựa trên PR của họ để viết lại.

Anh sẽ gắn nhãn họ là đồng tác giả, nhưng ít khi hợp nhất mã của người khác trực tiếp.

Tìm con đường của riêng bạn

Peter Yang tổng kết: Vậy điểm cốt lõi là đừng dùng máy tạo slop, giữ người trong vòng lặp, vì não bộ và gu thẩm mỹ của con người là không thể thay thế.

Peter Steinberger bổ sung một câu:

“Hoặc nói cách khác, hãy tìm con đường của riêng bạn. Nhiều người hỏi tôi ‘Bạn làm thế nào?’, câu trả lời là: bạn phải tự khám phá. Học những thứ này cần thời gian, cần phạm sai lầm của chính mình. Cũng giống như học bất kỳ thứ gì, chỉ là lĩnh vực này thay đổi quá nhanh.

Clawdbot có thể tìm thấy trên clawd.bot và GitHub. Tên đầy đủ là Clad, có W, C-L-A-W-D-B-O-T, giống như càng tôm hùm.

【Chú thích: ClawdBot đã đổi tên thành OpenClaw】

Peter Yang nói anh cũng phải thử xem sao. Không muốn ngồi trước máy tính để nói chuyện với AI, muốn ra ngoài chơi cùng con, lúc nào cũng có thể ra lệnh cho nó.

“Anh nghĩ em sẽ thích đấy.” Peter Steinberger nói.

Tổng quan về quan điểm của Peter Steinberger có thể tóm gọn trong hai câu:

  1. AI đã mạnh đến mức có thể thay thế 80% ứng dụng trên điện thoại của bạn
  2. Nhưng nếu không có gu thẩm mỹ và đánh giá của con người trong vòng lặp, kết quả sẽ là rác rưởi

Hai câu này có vẻ mâu thuẫn, nhưng thực ra chỉ hướng đến một kết luận: AI là đòn bẩy, không phải là sự thay thế. Nó mở rộng những gì bạn đã có: tư duy hệ thống, khả năng kiến trúc, trực giác về sản phẩm tốt. Nếu bạn không có những thứ đó, dù chạy 24 giờ cũng chỉ là sản xuất hàng loạt slop.

Thực tế của anh chính là minh chứng rõ nhất: một lập trình viên iOS kỳ cựu 20 năm, trong vài tháng đã xây dựng một dự án 30 nghìn dòng mã bằng TypeScript, không phải vì học ngôn ngữ mới, mà vì những thứ không liên quan đến ngôn ngữ.

“Ngôn ngữ lập trình không còn quan trọng nữa, quan trọng là tư duy kỹ thuật của tôi.”

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận