共计 2614 个字符,预计需要花费 7 分钟才能阅读完成。
OpenClaw 第一次进化:我唯一做的事,就是跟它们说话
不是调 prompt,不是换模型,不是重构架构。就是说话,给反馈,看着它们把内容记下来。
申明: 本文出自 海外大神 Shubham Saboo,可以关注一波!
Twitter: https://x.com/Saboo_Shubham_
从混乱到有序:40 天的转变
40 天前,我的内容智能体写推文还堆表情包和 hashtag,研究智能体把有价值的信息淹没在噪音里。我花在纠错上的时间,比自己直接做还多。
今天:
- Kelly 用我的语气起草内容
- Dwight 每天早上送来 7 条故事,每一条都值得读
- 8 个智能体 24 小时运转
- 我打开 Telegram,看看草稿,喝杯咖啡
第 1 天和第 40 天用的是同一个模型。 区别在于一堆每周都在变丰富的 Markdown 文件。
先搞清楚一件事
智能体不会因为你用得更久而变聪明。但它周围的文件会变得更丰富、更精准、更贴合你的需求。这些积累的上下文才是护城河。
很多人花大量时间调 prompt、换模型、研究各种编排框架。但真正的差异不在模型,在于文件体系。
没有消息队列,没有数据库,没有复杂的编排框架。 整个系统就是磁盘上的 Markdown 文件。文件系统本身就是集成层。
三层架构,一目了然
整个操作系统由三层构成:
| 层级 | 核心问题 | 文件 |
|---|---|---|
| 身份层 | 这是谁?为谁服务? | SOUL.md、IDENTITY.md、USER.md |
| 操作层 | 怎么干活?怎么自愈? | AGENTS.md、HEARTBEAT.md |
| 知识层 | 学到了什么? | MEMORY.md、每日日志、共享上下文 |
第一层:身份层
SOUL.md —— 智能体是谁?
这是智能体的 ” 人格文件 ”。定义身份、职责、行为方式。
IDENTITY.md —— 快速参考卡
SOUL.md 是完整人格,IDENTITY.md 是名片。文件很小,但当你同时跑 8 个智能体时,这个设计会大幅提升体验。
USER.md —— 智能体服务的对象
每个智能体都需要知道它在帮谁。个人细节比你想象的更重要:
- 时区意味着智能体不会在凌晨 3 点给你安排事情
- 饮食偏好意味着当 Pam 为团队晚餐起草通讯时,不会推荐牛排馆
写一次,所有智能体都来读。
第二层:操作层
AGENTS.md —— 行为规则
SOUL.md 定义智能体是谁,AGENTS.md 定义它如何运作:会话启动流程、文件读取顺序、记忆管理、安全规则。
核心原则: 智能体在会话之间没有记忆,每次都从零开始。如果一个纠正没有落入文件,下次会话它就不存在了。
HEARTBEAT.md —— 自愈机制
智能体团队是基础设施,基础设施会出故障。
示例监控项:
- 浏览器是否存活 — Dwight 的情报扫描依赖它
- 定时任务是否执行 — 如果漏跑,Kelly 和 Rachel 就会基于过时情报工作
经验: 第一天不需要这个,在你第一次遇到故障之后再建。你会清楚地知道该监控什么,因为你已经亲身感受过什么会崩。
第三层:知识层
这是真正有效的记忆系统——基于文件的三级体系。
第一级:MEMORY.md(精华长期记忆)
不是原始日志,不是所有发生过的事,而是真正重要的内容。
注意 ” 血泪教训 ” 和 ” 错误示范 ” 这两节。一次纠正,存储一次,防止同样的错误在未来每次会话中重演。 仅这一节,就比任何 prompt 工程指南都值钱。
第二级:每日日志(原始记录)
每日日志是原材料,MEMORY.md 是精炼产品,两者缺一不可。
维护规则: 每日日志积累得很快,不修剪的话智能体的上下文会膨胀。每次只加载今天和昨天的日志。
第三级:shared-context/(跨智能体知识层)
这是最新加入的部分,也是改变一切的部分。
- THESIS.md — 我当前的思维框架:我关注什么,我已经写了什么,还有哪些空白。Dwight 读它来确定研究优先级,Kelly 读它来匹配我的思路。
- FEEDBACK-LOG.md — 跨智能体纠正层。当我告诉 Kelly” 不要用破折号 ”,这条反馈同样适用于 Rachel、Ryan 和 Pam。
这单一改变节省的时间,比我做过的任何 prompt 优化都多。
智能体如何协作
没有 API 调用,没有消息队列,只有文件。
Dwight 把研究写入 intel/DAILY-INTEL.md,Kelly 读,Rachel 读,Pam 读。 协作就是文件系统。
单写者原则: 永远不要让两个智能体同时写同一个文件。把每个共享文件设计成一个写者、多个读者。这能防止你本来需要调试的所有协调冲突。
调度让这一切成为可能:Dwight 在早 8 点和下午 4 点运行,Kelly 和 Rachel 在下午 5 点运行。Dwight 先跑,因为所有人都依赖他的输出。顺序搞错了,下游智能体读到的就是过时或空白的文件。
为什么这套方法有效
文件不是静态的,它们在进化。
- Kelly 的 SOUL.md 第一天只是个粗略草稿。到第 40 天,它已经有了具体的语气示例、她自己写的被否决模式列表,以及一个 ” 永远不要再建议 ” 的专区。
- Dwight 的原则第一天写的是 ” 找到热门趋势 ”。第 10 天变成了 ” 如果 Alex 今天无法对此采取行动,跳过 ”。第 20 天,他又加入了核实步骤。
- 共享上下文层直到第 20 天才存在。那时我在对多个智能体重复同样的纠正。后来我建了 THESIS.md 和 FEEDBACK-LOG.md,突然间,一次纠正就能传播到所有地方。
第 1 天和第 40 天的模型是一样的。它不会因为你用得更久而变得更聪明。
但围绕它的文件变得更丰富、更精准、更贴合你的具体需求。这些积累的上下文才是护城河。没有人能通过使用同一个模型来复制它。
你要靠每天出现、与智能体对话来赢得它。
如何开始(不要试图在一个周末搭完)
| 时间 | 行动 |
|---|---|
| 今天 | 安装 OpenClaw,写一个 SOUL.md、IDENTITY.md、USER.md。挑最重复的日常任务,设置定时任务让它跑起来 |
| 3 天后 | 开始给出具体反馈,确保反馈落入记忆文件,而不只是停留在聊天记录里 |
| 1 周后 | 创建 AGENTS.md,定义会话启动流程,添加记忆管理规则 |
| 2 周后 | 开始写 MEMORY.md,回顾每日日志,把反复出现的纠正蒸馏成永久条目 |
| 3 周后 | 添加第二个智能体,建立基于文件的协作。随着模式涌现,添加角色专属指南。大约同时建立共享上下文层 |
| 4 周后 | 在你第一次遇到故障之后,添加 HEARTBEAT.md |
写在最后
你唯一需要做的,就是与你的智能体对话。文件会完成其余的一切。
不是调 prompt,不是换模型,不是重构架构。
就是说话。给反馈。看着它们把内容记下来。
然后有一天你打开 Telegram,看看草稿,喝杯咖啡。
你的智能体已经学会了怎么帮你工作。
最后更新:2026-03-06