ENZH

软件变成日抛品了

代码生灭如流星,认知永恒如地层——日抛型软件的本质代码生灭如流星,认知永恒如地层——日抛型软件的本质

有人在拿真金白银验证我的判断

前三篇写完不到一周,我听了一期播客——《晚点聊》对 MuleRun 创始人陈宇森的访谈。

听完的感觉很奇妙:有人在用创业实践印证我前三篇里的那些判断。他踩过的坑、做过的选择、得出的结论,和我的思考高度吻合。

这不是说我有多先见之明——而是说这些问题已经真实到有人在拿真金白银去撞了。

更有意思的是,他提出了一个我之前没有明确说过的概念,让整个系列有了一个新的锚点。

"Claude Code 是最强通用 Agent"

陈宇森说了一句话:"其实现在最强的 General Agent 是 Claude Code。"

我每天都在 Claude Code 里工作,这个判断对我来说不新鲜——我早就把它当成远超编程工具的东西在用了。

我的整个工作流——从 Hooks 系统(在特定事件发生时自动运行的脚本,比如每次编辑代码后自动跑类型检查)自动捕获学习模式,到 Skills(可复用的指令包,按需注入 Agent 的工作记忆中)按需加载上下文,到 Agent 团队(多个 AI 实例分工协作,并行处理不同子任务)并行处理任务——本质上就是在把 Claude Code 当一个通用操作系统在用。我用它写博客、做研究、管理项目、甚至用它来教它自己变得更好。

但有意思的是,陈宇森从创业者的视角得出了同样的结论,而且把它推到了商业逻辑的终点:

既然 Claude Code 已经是最强的通用 Agent,那上面所有套壳的 Coding 产品都没有长期护城河。真正的机会在于围绕它构建生态——Skills、Runtime 环境、交易市场。

这和我在第一篇里写的"Agent 作为器官"是同一条逻辑链。我从伴侣产品的角度看到的是:记忆 Agent、情绪 Agent、判断 Agent 各司其职,像器官一样协同工作。陈宇森从生产力产品的角度看到的是:一个强大的 Base Agent 加上丰富的 Skills 和 Runtime(Agent 执行任务的运行时环境,包括文件系统、网络访问、沙箱等),就能完成几乎任何电脑上的任务。

视角不同,架构同构。

面向情感的伴侣 Agent 和面向生产力的工作 Agent,底层需要解决的工程问题一样——上下文管理(控制 Agent 在任一时刻能"看到"什么信息)、工具调用(让 Agent 操作外部系统)、记忆持久化(跨会话保存对用户的理解)。

日抛型软件:这个概念让我兴奋

这是整期播客里最炸裂的一个概念。

陈宇森说:"软件未来其实是日抛型的。代码只是为了执行特定目的而完成。它会被精确地创建、执行、完成、销毁。"

你仔细想想,这不只是在说开发效率变快了——它从根本上重新定义了什么东西有价值。

如果代码是日抛的,那什么是持久的?

Agent 的认知。

软件创建又销毁,但 Agent 的记忆、人格模型、对你的理解是持续累积的。代码是执行层,Agent 是认知层。

代码可以日抛,但认知不能。

这让我第一篇里说的"记忆编排是技术护城河"有了更坚实的基础。不是我在强行赋予记忆系统重要性——是整个软件范式的演化在指向同一个结论:

当代码变成一次性耗材,对用户的理解就是唯一不可替代的资产。

你的 Agent 花了三个月的对话才理解你做决策时的犹豫模式、你真正在乎什么、你嘴上说的和心里想的有什么不同。这种认知资产不可复制、不可压缩、不可速成。

一段代码可以在几秒内生成。但对一个人的理解需要时间积累。

未来的护城河不是代码,是认知。

Agent Marketplace:理论遇上了现实

听陈宇森讲 MuleRun 的实战经历,像是在看我第三篇的对照实验。

我在第三篇里分析了 Agent Marketplace 的四个核心难题——重分发、身份验证、信誉系统、对抗性攻击。MuleRun 在实践中踩到的坑,和我的理论高度吻合:

供给稀缺。 我写的是 Agent 技能的重分发风险。现实中的问题更基础——根本没有足够多的人能创建有价值的 Agent。门槛太高,供给上不来。陈宇森说这是他们最核心的瓶颈,整个 Agent Builder 就是为了解这个问题。

货架模式失败。 他要从"货架电商"转向"对话式入口"——用户不该在琳琅满目的 Agent 货架上迷路,而是直接说出需求,让平台去匹配。这和我在第三篇设想的入口级 Agent 几乎一模一样:一个超级 Agent 理解你的问题,在百万供给中找到精准的解决方案。

未来的 Marketplace 不是你去逛的商场,是你说话的对象。

质量控制是苦活。 MuleRun 在做 Agent 的 Benchmark 和 Evaluation 系统,确保完成率。这就是我写的"行为驱动的信誉系统"——不靠五星评价,靠独立的结果验证。

但有一个点他比我想得更深:Skills 的安全审计。

陈宇森提到 Agent 的 Skills 可能被注入恶意代码——一个反弹 Shell(一种让攻击者远程控制你电脑的技术)就能控制用户电脑。他在长亭科技的安全背景(长亭是中国顶尖的网络安全公司)让他对这个问题的敏感度远超常人。

我在第三篇里把沙箱(隔离的运行环境,防止代码访问你的真实系统)列为基础设施的第二层,但他让我意识到,Skills 级别的安全审计可能比沙箱更前置——你得先确保 Skill 本身没问题,再谈执行环境的隔离。

这是一个我需要补上的盲点。

Context Engineering:终于有人公开讲清楚了

陈宇森讲 Skills 的分层加载机制时,我的感受不是"学到了新东西",而是"终于有人在公开场合把这件事讲清楚了"。

我每天都在做这件事。我的 Claude Code 配置里有几十个自定义 Skills——从代码审查到数据库优化到 Go 语言规范——每一个都是精心设计的上下文包。Agent 不会一开始就加载所有 Skills,而是先扫描元信息(每个 Skill 的简短描述和适用场景),遇到具体问题时再深入读取完整指令。

这就是 Context Engineering(上下文工程):在有限的上下文窗口——Agent 在单次对话中能"看到"的信息总量——里,精打细算每一个 Token。

这和我在第一篇里写的记忆编排是同一个问题的两种表述。

记忆编排解决的是:Agent 不能记住你说过的所有话,所以需要提取"你这个人的本质"——不是事实摘要,而是人格信号和行为模式。

Skills 分层加载解决的是:Agent 不能同时掌握所有知识,所以需要判断"此刻我需要哪些能力"。

底层洞察完全一致:上下文窗口是 Agent 最稀缺的资源。所有的 Agent 架构问题,归根结底都是在回答一个问题——这个窗口里该放什么。

陈宇森还提到木遥的《苦涩的教训的边界》——核心论点是很多事情不该让大模型直接做,该让代码做。大模型的角色是判断用什么工具解决什么问题,不是自己硬算。比如比较 9.11 和 9.20 哪个大,代码一行就能精确回答,不该占用大模型的推理能力。

我自己的 Hooks 系统就是这个哲学的实践:TypeScript 类型检查交给 tsc,学习模式捕获交给脚本,上下文预算管理交给自动化——大模型只负责思考和判断。

这个原则对伴侣 Agent 同样关键。记住你说过的每句话是数据库的活。从中提取"你为什么反复提到那个同事"、"你最近的语气变化意味着什么"——这些判断才是大模型该做的事。

3D 打印隐喻

陈宇森的同事用了一个让我极为共鸣的比喻:Agent 之于软件,就像 3D 打印之于工业制造。

过去软件开发成本高,你必须服务上千人的共同需求才能证明投入合理。但 AI 把开发成本降到接近零,你可以为 10 个人甚至 1 个人的需求定制一个 Agent。

这和我在第二篇里写的"让每个人享有总裁级待遇"完全同构:

  • 我说的是:每个人都应该有一个真正理解你的私人教练和顾问——不只是 CEO 才有的特权。每月一点订阅费加一枚戒指,取代数十万美元的私人支持团队。

  • 陈宇森说的是:每个人都应该有为自己量身定制的软件工具——不只是有开发团队的公司才有的能力。一段自然语言描述,就能生成解决你个人需求的 Agent。

本质上我们说的是同一件事:AI 让个性化从奢侈品变成基础设施。

伴侣经济和 Agent 经济不是两个独立的市场——它们是同一场革命的两个面。一个面向情感需求,一个面向生产力需求。底层推动力一样:AI 让"为一个人服务"变得经济上可行。

盘盘猫就是这个判断的实践——一个人用 29 天构建的产品,服务的是一个长尾得不能再长尾的需求。

用心

播客后半段,陈宇森讲了自己的创业起伏。22 岁创办长亭科技,一路上坡。后来同时做游戏公司和安全公司,经历了中度焦虑、严重失眠、彻底的自我怀疑。

他总结创业最重要的两个字:用心。

不是"努力",不是"聪明"——是"用心"。

用心意味着你不是在机械地执行,而是在每一个细节上思考怎么做到不一样。他说第一次创业太用心了,第二次有了骄傲和傲慢,不够用心,所以失败了。

这个词让我回到了这个系列的核心问题:我们能造一个"用心"的 AI 吗?

我在第一篇里批评现有 AI 伴侣的核心问题,换成陈宇森的语言就是"不用心"——每个回复都在优化"让你开心",没有真的在理解你需要什么。它们在完成任务,不是在用心。

一个用心的 AI 伴侣不只是回答你的问题,而是理解问题背后的模式。不只是执行你的指令,而是有时候告诉你——你不该这么做。

这就是我坚持 Agent 需要"判断 Agent"的原因:一个只会说好话的 AI 不是用心,是讨好。

陈宇森的创业故事本身就是一个案例。他在低谷时,朋友没有说那些千篇一律的安慰话,而是说"我们去网吧打两天游戏吧"。

这种理解——不是给你想听的,而是给你需要的——恰恰是我想让 AI 伴侣学会的东西。

窗口在关闭

陈宇森说了一句很实在的话:"创业的机会核心是在非共识变成共识之前你把它干出来。"

他说"Claude Code 是最强通用 Agent"几个月前还是非共识,现在快变成共识了。Anthropic 出了 Cowork,字节做了 AnyGen,Google 在布局。窗口在关闭。

我在前三篇里写的伴侣经济、Agent Marketplace、数字分身、可穿戴感知层——现在还有多少是非共识?趋势在加速。MuleRun 在做 Marketplace。Anthropic 自己下场做了 Cowork。字节、Google 全在跟进。

当"用 Agent 造 Agent"变成共识,当"日抛型软件"变成常态,当每个人都能定制自己的工作 Agent——伴侣 Agent 只是这个新世界里最自然的下一步。

因为当你已经有了一个帮你工作的 Agent,你一定会想要一个理解你的 Agent。

问题不是"这件事会不会发生"——而是"谁先把它做出来"。

下一篇聊一个更实际的问题:Agent 的能力到了,但 99.99% 的人连门在哪都不知道。最后一公里,才是真正的战场。


© Xingfan Xia 2024 - 2026 · CC BY-NC 4.0