前段时间 OpenClaw 非常火,很多人在讨论。我自己搭了一套系统,跑了一个多月,觉得里面有非常多有意思的 insights,但也有很多误解。今天分享我的理解,分三个部分。
一、Clockless 使用 OpenClaw 的经验
我们公司叫 Clockless AI,做 Agent 系统的定制。过去定制是不太容易 scale 的生意,但有了 AI 之后发生了变化。今年 YC 提出 "AI Native Agency" 的概念 —— 还是做过去外包/定制的业务,但内部真正干活的不再是人,而是 AI。内部毛利率和可复制性几乎能达到软件公司的效果。
我的工作流:跟客户聊 30 分钟,全程录音,把录音发到系统里。系统中有多个 agent,从需求分析到产品设计、开发、测试、迭代、上线,全程 AI 直接做。一个比较通用的软件从录音到上线就几天时间。
经验一:人的 bandwidth 有限,用 Agent 来管理 Agent
很多人说未来干活的都是 agent,人的能力是管理 agent 团队。我自己试了一下 —— 管不过来。每个 agent 干活效率太高,token 吞吐量远超人脑承受范围。同时 manage 几个 agent,跟谁说了什么、布置什么工作,完全记不住。
只要人还在 loop 里面,AI 越强大,人就会越累。真正想让系统转起来,一定要人在 loop 之外,让 AI 来管理 AI。
所以我只跟 Elon(CEO agent)一个 agent 沟通。Elon 从对话中提取我的 intent,组织成标准格式(目标、限制、验收 metrics、背景信息),然后派生工作给各个 worker agent。
经验二:Agent 之间不靠对话,而靠文件系统通信
人与人之间通过对话沟通,但 agent 与 agent 之间直接通过文件系统沟通更高效。所有 intent 和 task 写入文件放到对应路径,worker agent 定期扫描查看有没有需要做的工作。我还搭了一个 dashboard 监控所有 intent 和 task 的进展 —— 人只读,不能操作。
经验三:Agent 依赖已有工具如 Claude Code 来工作
Worker agent 工作时还是调用 Claude Code 来写代码。区别在于:不是你开八个 Claude Code 窗口自己指挥,而是 Linus(coding agent)来开八个窗口做工作。人管理窗口会累,人睡觉工作流就断了。有了编排层,就能 7×24 小时运转。
二、OpenClaw 的真正价值
很多做技术工程的朋友对 OpenClaw 不感冒 —— 技术上确实没太大突破,内部用的 agent framework 都是现成的。但这不代表它不重要。
OpenClaw 点破了一层窗户纸
AI-only 的系统、能够自我进化的 AI 系统,门槛没有想象的那么高。过去觉得有各种问题,但 OpenClaw 出现后大家发现那些问题都可以解决。
OpenClaw 做的事很简单:其他都不管了(security、token usage、UX),把整台电脑彻底交给一个 agent,看看系统能不能运转。结果 —— 还真能 work,而且很多工作做得不错。
关键 insight:在系统达到 100% AI-only 之前,不管人的输入占比是 10% 还是 90%,整个系统还是要为人适配。但达到 100% 之后,之前为人设计的所有环节都可以去掉,系统会不断加速进化。
我们连 code review 都取消了,甚至连 pull request 都关掉了。Peter 一天提交 600 次 commit,平均几分钟一次 —— 绝对不可能是人写的代码。未来可能连 GitHub 都不需要了,因为 GitHub 本质上还是为人设计的。
三、对未来发展的判断
Agent = Model × Harness,Harness 还在非常早期
模型对于现在 agent 的要求差不多做到六七十分了(特别是 Opus 4.5),但现在的 harness 可能只有二十分。记忆管理、security、权限控制、状态管理,大量东西缺失。
未来三到六个月会大量出现 harness framework 的讨论。即便在模型不进步的情况下,harness 的进步也会让 agent 能力大大提升。
为人设计的软件将高度定制化
过去 SaaS 的逻辑:一个产品解决一个问题,卖给一万个人。但真实情况是客户每天碰到的不是一个问题,可能有十几个。
当 build 软件的成本趋近于零,就干脆按照你的需求、你的 workflow 定制一个软件,解决你所有的问题 —— 但这个软件只卖给你一个人。软件可能会成为第一个既能规模化又能个性化的产品。