软件变成日抛品了

代码生灭如流星，认知永恒如地层——日抛型软件的本质代码生灭如流星，认知永恒如地层——日抛型软件的本质

有人在拿真金白银验证我的判断

前三篇写完不到一周，我听了一期播客——《晚点聊》对 MuleRun 创始人陈宇森的访谈。

听完的感觉很奇妙：有人在用创业实践印证我前三篇里的那些判断。他踩过的坑、做过的选择、得出的结论，和我的思考高度吻合。

这不是说我有多先见之明——而是说这些问题已经真实到有人在拿真金白银去撞了。

更有意思的是，他提出了一个我之前没有明确说过的概念，让整个系列有了一个新的锚点。

"Claude Code 是最强通用 Agent"

陈宇森说了一句话："其实现在最强的 General Agent 是 Claude Code。"

我每天都在 Claude Code 里工作，这个判断对我来说不新鲜——我早就把它当成远超编程工具的东西在用了。

我的整个工作流——从 Hooks 系统（在特定事件发生时自动运行的脚本，比如每次编辑代码后自动跑类型检查）自动捕获学习模式，到 Skills（可复用的指令包，按需注入 Agent 的工作记忆中）按需加载上下文，到 Agent 团队（多个 AI 实例分工协作，并行处理不同子任务）并行处理任务——本质上就是在把 Claude Code 当一个通用操作系统在用。我用它写博客、做研究、管理项目、甚至用它来教它自己变得更好。

但有意思的是，陈宇森从创业者的视角得出了同样的结论，而且把它推到了商业逻辑的终点：

既然 Claude Code 已经是最强的通用 Agent，那上面所有套壳的 Coding 产品都没有长期护城河。真正的机会在于围绕它构建生态——Skills、Runtime 环境、交易市场。

这和我在第一篇里写的"Agent 作为器官"是同一条逻辑链。我从伴侣产品的角度看到的是：记忆 Agent、情绪 Agent、判断 Agent 各司其职，像器官一样协同工作。陈宇森从生产力产品的角度看到的是：一个强大的 Base Agent 加上丰富的 Skills 和 Runtime（Agent 执行任务的运行时环境，包括文件系统、网络访问、沙箱等），就能完成几乎任何电脑上的任务。

视角不同，架构同构。

面向情感的伴侣 Agent 和面向生产力的工作 Agent，底层需要解决的工程问题一样——上下文管理（控制 Agent 在任一时刻能"看到"什么信息）、工具调用（让 Agent 操作外部系统）、记忆持久化（跨会话保存对用户的理解）。

日抛型软件：这个概念让我兴奋

这是整期播客里最炸裂的一个概念。

陈宇森说："软件未来其实是日抛型的。代码只是为了执行特定目的而完成。它会被精确地创建、执行、完成、销毁。"

你仔细想想，这不只是在说开发效率变快了——它从根本上重新定义了什么东西有价值。

如果代码是日抛的，那什么是持久的？

Agent 的认知。

软件创建又销毁，但 Agent 的记忆、人格模型、对你的理解是持续累积的。代码是执行层，Agent 是认知层。

代码可以日抛，但认知不能。

这让我第一篇里说的"记忆编排是技术护城河"有了更坚实的基础。不是我在强行赋予记忆系统重要性——是整个软件范式的演化在指向同一个结论：

当代码变成一次性耗材，对用户的理解就是唯一不可替代的资产。

你的 Agent 花了三个月的对话才理解你做决策时的犹豫模式、你真正在乎什么、你嘴上说的和心里想的有什么不同。这种认知资产不可复制、不可压缩、不可速成。

一段代码可以在几秒内生成。但对一个人的理解需要时间积累。

未来的护城河不是代码，是认知。

Agent Marketplace：理论遇上了现实

听陈宇森讲 MuleRun 的实战经历，像是在看我第三篇的对照实验。

我在第三篇里分析了 Agent Marketplace 的四个核心难题——重分发、身份验证、信誉系统、对抗性攻击。MuleRun 在实践中踩到的坑，和我的理论高度吻合：

供给稀缺。 我写的是 Agent 技能的重分发风险。现实中的问题更基础——根本没有足够多的人能创建有价值的 Agent。门槛太高，供给上不来。陈宇森说这是他们最核心的瓶颈，整个 Agent Builder 就是为了解这个问题。

货架模式失败。 他要从"货架电商"转向"对话式入口"——用户不该在琳琅满目的 Agent 货架上迷路，而是直接说出需求，让平台去匹配。这和我在第三篇设想的入口级 Agent 几乎一模一样：一个超级 Agent 理解你的问题，在百万供给中找到精准的解决方案。

未来的 Marketplace 不是你去逛的商场，是你说话的对象。

质量控制是苦活。 MuleRun 在做 Agent 的 Benchmark 和 Evaluation 系统，确保完成率。这就是我写的"行为驱动的信誉系统"——不靠五星评价，靠独立的结果验证。

但有一个点他比我想得更深：Skills 的安全审计。

陈宇森提到 Agent 的 Skills 可能被注入恶意代码——一个反弹 Shell（一种让攻击者远程控制你电脑的技术）就能控制用户电脑。他在长亭科技的安全背景（长亭是中国顶尖的网络安全公司）让他对这个问题的敏感度远超常人。

我在第三篇里把沙箱（隔离的运行环境，防止代码访问你的真实系统）列为基础设施的第二层，但他让我意识到，Skills 级别的安全审计可能比沙箱更前置——你得先确保 Skill 本身没问题，再谈执行环境的隔离。

这是一个我需要补上的盲点。

Context Engineering：终于有人公开讲清楚了

陈宇森讲 Skills 的分层加载机制时，我的感受不是"学到了新东西"，而是"终于有人在公开场合把这件事讲清楚了"。

我每天都在做这件事。我的 Claude Code 配置里有几十个自定义 Skills——从代码审查到数据库优化到 Go 语言规范——每一个都是精心设计的上下文包。Agent 不会一开始就加载所有 Skills，而是先扫描元信息（每个 Skill 的简短描述和适用场景），遇到具体问题时再深入读取完整指令。

这就是 Context Engineering（上下文工程）：在有限的上下文窗口——Agent 在单次对话中能"看到"的信息总量——里，精打细算每一个 Token。

这和我在第一篇里写的记忆编排是同一个问题的两种表述。

记忆编排解决的是：Agent 不能记住你说过的所有话，所以需要提取"你这个人的本质"——不是事实摘要，而是人格信号和行为模式。

Skills 分层加载解决的是：Agent 不能同时掌握所有知识，所以需要判断"此刻我需要哪些能力"。

底层洞察完全一致：上下文窗口是 Agent 最稀缺的资源。所有的 Agent 架构问题，归根结底都是在回答一个问题——这个窗口里该放什么。

陈宇森还提到木遥的《苦涩的教训的边界》——核心论点是很多事情不该让大模型直接做，该让代码做。大模型的角色是判断用什么工具解决什么问题，不是自己硬算。比如比较 9.11 和 9.20 哪个大，代码一行就能精确回答，不该占用大模型的推理能力。

我自己的 Hooks 系统就是这个哲学的实践：TypeScript 类型检查交给 tsc，学习模式捕获交给脚本，上下文预算管理交给自动化——大模型只负责思考和判断。

这个原则对伴侣 Agent 同样关键。记住你说过的每句话是数据库的活。从中提取"你为什么反复提到那个同事"、"你最近的语气变化意味着什么"——这些判断才是大模型该做的事。

3D 打印隐喻

陈宇森的同事用了一个让我极为共鸣的比喻：Agent 之于软件，就像 3D 打印之于工业制造。

过去软件开发成本高，你必须服务上千人的共同需求才能证明投入合理。但 AI 把开发成本降到接近零，你可以为 10 个人甚至 1 个人的需求定制一个 Agent。

这和我在第二篇里写的"让每个人享有总裁级待遇"完全同构：

我说的是：每个人都应该有一个真正理解你的私人教练和顾问——不只是 CEO 才有的特权。每月一点订阅费加一枚戒指，取代数十万美元的私人支持团队。
陈宇森说的是：每个人都应该有为自己量身定制的软件工具——不只是有开发团队的公司才有的能力。一段自然语言描述，就能生成解决你个人需求的 Agent。

本质上我们说的是同一件事：AI 让个性化从奢侈品变成基础设施。

伴侣经济和 Agent 经济不是两个独立的市场——它们是同一场革命的两个面。一个面向情感需求，一个面向生产力需求。底层推动力一样：AI 让"为一个人服务"变得经济上可行。

盘盘猫就是这个判断的实践——一个人用 29 天构建的产品，服务的是一个长尾得不能再长尾的需求。

用心

播客后半段，陈宇森讲了自己的创业起伏。22 岁创办长亭科技，一路上坡。后来同时做游戏公司和安全公司，经历了中度焦虑、严重失眠、彻底的自我怀疑。

他总结创业最重要的两个字：用心。

不是"努力"，不是"聪明"——是"用心"。

用心意味着你不是在机械地执行，而是在每一个细节上思考怎么做到不一样。他说第一次创业太用心了，第二次有了骄傲和傲慢，不够用心，所以失败了。

这个词让我回到了这个系列的核心问题：我们能造一个"用心"的 AI 吗？

我在第一篇里批评现有 AI 伴侣的核心问题，换成陈宇森的语言就是"不用心"——每个回复都在优化"让你开心"，没有真的在理解你需要什么。它们在完成任务，不是在用心。

一个用心的 AI 伴侣不只是回答你的问题，而是理解问题背后的模式。不只是执行你的指令，而是有时候告诉你——你不该这么做。

这就是我坚持 Agent 需要"判断 Agent"的原因：一个只会说好话的 AI 不是用心，是讨好。

陈宇森的创业故事本身就是一个案例。他在低谷时，朋友没有说那些千篇一律的安慰话，而是说"我们去网吧打两天游戏吧"。

这种理解——不是给你想听的，而是给你需要的——恰恰是我想让 AI 伴侣学会的东西。

窗口在关闭

陈宇森说了一句很实在的话："创业的机会核心是在非共识变成共识之前你把它干出来。"

他说"Claude Code 是最强通用 Agent"几个月前还是非共识，现在快变成共识了。Anthropic 出了 Cowork，字节做了 AnyGen，Google 在布局。窗口在关闭。

我在前三篇里写的伴侣经济、Agent Marketplace、数字分身、可穿戴感知层——现在还有多少是非共识？趋势在加速。MuleRun 在做 Marketplace。Anthropic 自己下场做了 Cowork。字节、Google 全在跟进。

当"用 Agent 造 Agent"变成共识，当"日抛型软件"变成常态，当每个人都能定制自己的工作 Agent——伴侣 Agent 只是这个新世界里最自然的下一步。

因为当你已经有了一个帮你工作的 Agent，你一定会想要一个理解你的 Agent。

问题不是"这件事会不会发生"——而是"谁先把它做出来"。

下一篇聊一个更实际的问题：Agent 的能力到了，但 99.99% 的人连门在哪都不知道。最后一公里，才是真正的战场。