员工手册就是给人写的 system prompt

前段时间花了一天，把 MrBeast、Netflix、Duolingo 三家的员工手册从头到尾读了一遍。读完最大的感受是：员工手册就是给人写的 system prompt。这不是打比方，它们在回答的问题，跟我每天写 CLAUDE.md 要回答的一模一样——在优化什么、"好"长什么样、遇到模糊情况怎么办、什么事绝对不能做。

这三家的人效都挺夸张的，人均年营收都在百万美元量级，MrBeast 大概 280 万，Netflix 270 万左右，Duolingo 少一些，也有 78 万。手册的风格差得非常远，但干的事情是同一件：把创始人脑子里那套"什么算好"的隐性判断编码成一套系统，让别人能自主执行。或者说，把创始人的 tribal knowledge 变成可以直接分发的东西。

还有一层我觉得更有意思：给人写和给 agent 写这份文件，区别比我想象的大得多。这个放到后面讲。

三份手册长什么样

先说直观感受。MrBeast 的手册 36 页，Jimmy Donaldson 自己写的，满篇错别字和语法问题，开头他自己就道歉了，说"我是 YouTuber 不是作家哈哈"。读起来像凌晨两点的创始人独白，读完会觉得跟 Jimmy 吃过一顿饭，听他聊了怎么想视频、怎么管团队、什么事让他抓狂。

Netflix 的只有 5 页，精炼到有点离谱。四根柱子撑起整份文件：梦之队、人大于流程、令人不安的兴奋、永远更好。休假政策就两个字："休假。"报销政策五个字："按 Netflix 利益行事。"

Duolingo 做了一本 64 页的插图书，带版本号 1.0.0，封面是猫头鹰 Duo 的建模解剖图，背面还标注了"O.BUTT"。里面是五个原则、一套叫"绿色机器"的运营框架、外加一个术语表，整个读下来像一本软件的操作手册。

三份东西风格完全不同，但都在干同一件事，把创始人脑子里"什么算好"的判断从隐性变成显性，让别人拿着就能执行。跟写 CLAUDE.md 是一回事，我读的时候满脑子都是 CLAUDE.md。

三种编码方式

MrBeast：极度具体

Jimmy 的手册里有一条核心原则：你的目标是做最好的 YouTube 视频。不是最好看的，不是制作最精的，也不是最搞笑的，是最好的 YouTube 视频。就这一句，他后面花了 20 页展开讲。

YouTube 视频的好坏是可以精确度量的，就三个指标：CTR（点击率）、AVD（平均观看时长）、AVP（平均观看百分比）。每条视频的留存曲线精确到秒——60 万人点进来，第一分钟走了 21 万，第三分钟又走了多少，第六分钟在哪里回升，手册里直接放了真实的后台截图。所以品味在他那里不是个虚的东西：品味就是理解这三个指标、知道怎么优化、并且知道什么时候不该优化。

他举了个例子。100 天圆圈挑战，有人在一个圆圈里住满 100 天，就给 50 万美元。一般的制作公司会从人住进去第一天开始拍，Jimmy 的做法是开拍 30 秒，一台吊车把整个房子吊到半空中放进圆圈里。这个镜头从数据上看可能就是浪费钱，但 Jimmy 说这种事的价值在于 wow factor，原话比这个糙得多，大意是 YouTube 上还有谁能干得出这种事，要让观众记住 MrBeast 跟别的频道不一样。这个判断不在任何指标体系里，纯粹是品味。

手册里还有一段我印象很深，是 Jimmy 在教员工怎么向他提问。别说"我们要送一辆车，这辆雷克萨斯怎么样"，这等于把所有认知负荷都扔回给他。应该说："视频第 6 到 9 分钟有个送车环节，预算一万美元。我搜了北卡所有这个价位的酷车，找到 5 辆已经过了创意审批的，还有 5 辆备选，你觉得哪个好？"我只能说这就是 prompt engineering：教人怎么给足 context、界定约束、呈现选项，跟给 agent 写 system prompt 是同一个动作。

这么写的好处是 Jimmy 不在场，团队也知道该怎么做。但天花板也在这，就是创始人自己的带宽。他自己在手册里也承认"I am not always right"，整个系统围着一个人的品味转，纠错能力全看底下的人敢不敢推回来。

Netflix：极度抽象

Netflix 的做法正好反过来。MrBeast 会告诉你"知道你在做的是视频的第几分钟"，Netflix 只说"按 Netflix 利益行事"。它赌的是雇异常负责任的人，给他们最大的自由度，规则越少越好。

几个机制现在都挺有名的。Keeper test：管理者定期问自己，如果这个人要离职，我会不会拼命留他？不会的话，让他走。Context not control：管理者不做决定，给团队的是做好决定所需的 context。Farming for dissent：做重大决定之前，主动去找不同意的人。

这套打法不吊在任何一个人的品味上，组织韧性是三家里最强的。代价是只能配合极优秀的人运转。放到 AI 语境里说，它等于需要一个用极短 system prompt 就能做出高质量判断的模型，这种模型目前不存在。

Duolingo：一套流程

Duolingo 走了第三条路：五个原则，加一套叫"绿色机器"的六步循环——用好人、定义成功、设护栏、开建加反馈循环、紧迫执行、加倍有效的停掉无效的。它精妙的地方在于，系统自己产出品味：跑几百个实验，数据说哪个好就留哪个，不依赖任何个人的判断。

几个细节我觉得做得真的很好。V1 不是 MVP，手册里写"V1 可能没有所有功能，必须精良。MVP 经常成为发布半成品的借口"，这个命名本身就是在编码品味，每次有人说"发 V1"，这个词自带质量标准。99 个坏主意，领导层专门留时间头脑风暴荒谬的问题，比如"如果 Duo 在超级碗有 5 秒钟时间呢？"这个问题后来真的变成了 2024 年超级碗广告，花的钱是别人三十秒广告的零头。Trust Battery，信任是充出来的，不是默认给的，级别不决定信任，成果决定。

三种方式里这种最稳定，不依赖任何个人，跟 AI 的 agent loop 也天然兼容。问题是它只对可量化的东西有效，而最重要的判断往往没法事先量化。

三种编码方式的取舍，跟写 CLAUDE.md 的取舍是同一张表：

	具体（MrBeast）	抽象（Netflix）	流程（Duolingo）
接收方自主空间	小	大	中
对接收方能力要求	低	极高	中
创始人瓶颈	严重	无	无
品味一致性	高	看人	看实验

CLAUDE.md 写得太具体，agent 的自主空间就小，太抽象它又容易跑偏。写成流程最稳定，但前提是你得有一套好的度量体系。

三家公司三种把品味写成文件的方式——具体、抽象、流程，越往抽象走接收方的自主空间越大。

品味传递难就难在，大部分品味是隐性知识，你知道什么好什么不好，但从来没有被迫把它写成文字。写 CLAUDE.md 就是在逼你把脑子里模糊的判断标准变成明确的指令，写员工手册干的是同一件事。所以我觉得三家手册的质量，或者说品味编码的精度，挺大程度上决定了这个组织能自主到什么程度。

给人写和给 AI 写，到底差在哪

同一个问题，接收方不同，差别比表面大得多。我数下来至少有五处。

激励。人类的手册花大量篇幅讲 why。MrBeast 写"YouTube 是未来，我用全身每一个细胞相信它会持续增长"，Netflix 写"The best work of our lives"，Duolingo 的使命是"做世界上最好的教育，让所有人都能用"。这些段落存在的理由只有一个：人需要相信自己做的事有意义。CLAUDE.md 里没有一个字是干这个的，你不需要激励一个 agent，把配置写清楚它就干活了。
自尊。MrBeast 专门写了一整节 "Own your mistakes"，因为人会护短、怕背锅、找借口；Netflix 把 extraordinary candor 写进文化，因为人默认回避冲突。我没见过哪份 CLAUDE.md 里写"别找借口"，写了也没用，agent 那边根本没有这个问题。
归属感。Netflix 说"我们是职业运动队，不是家庭"；Duolingo 每年带全公司去坎昆度假；MrBeast 承诺"在这里你能赚到任何其他公司做梦都赚不到的钱"。这些全是为了让人想留下来。agent 不会辞职也不会孤独，团建这种东西对它来说没有意义。
遗忘。MrBeast 手册的结尾是这么写的："现在从头再读一遍，因为我保证你没记住足够多。"人会忘、会走偏、会偷懒。agent 这边这个问题不存在，system prompt 每个 session 重新加载，你不用提醒它第二遍。
推回来。这条我觉得是最重要的区别。人能基于自己的经验和信念真正反对你。Netflix 的 farming for dissent 有效，是因为人有真实的、值得挖掘的不同意见；MrBeast 的 "I am not always right" 重要，是因为人确实会推回来。agent 你可以指令它"生成反对意见"，但那个反对是模拟出来的，它没有信念，也不知道什么时候该基于切身经验拍桌子。

这五条摆在一起，其实说的是同一根轴：接收方的自主判断力越强，system prompt 就可以写得越短。Netflix 的 5 页手册能运转，是因为它的人足够优秀。agent 现在还没到这个程度，5 行 prompt 就能自主运转的模型，我反正还没见过。

同一根轴：接收方的自主判断力越强，需要写的 system prompt 就越短。

再往上想一层，公司本身就挺像一套 agent orchestration 的。创始人干的就是 orchestrator 的活，手册是配置文件，每个员工拿着这份配置去跑自己的活。三家的编排方式不太一样，MrBeast 是一个 orchestrator 直接指挥所有 agent；Netflix 反过来，每个 agent 高度自治，只靠价值观对齐；Duolingo 是把 agent 嵌在自动化循环里，让系统自己迭代。

把公司看成一套 agent 编排：MrBeast 是中心指挥、Netflix 是各自自治、Duolingo 是自动循环三种拓扑。

AI 原生公司要干的事情，不是从这三种里挑一种，是把人和 AI agent 混编进同一套系统里。到时候手册要同时配置两种 agent，一种需要激励、有自尊、会推回来，另一种全都不需要。我现在的感觉是，给人写的那份反而更难写，agent 你把要做什么写清楚就行，人这边你还得把为什么讲明白，讲不明白他就不信。

员工手册就是给人写的 system prompt

三份手册长什么样

三种编码方式

MrBeast：极度具体

Netflix：极度抽象

Duolingo：一套流程

给人写和给 AI 写，到底差在哪

继续阅读

把 AI 当工具用，瓶颈永远是发起的人

AI 能直接交付结果之后，「工具+人」的生意都要重写

给 AI 一篇范文，让它改成那个味

订阅更新