ENZH

我读了 MrBeast、Netflix 和 Duolingo 的员工手册

一个数字先摆出来。

MrBeast 大概 250 人,年营收超 7 亿美元。Netflix 约 14000 人,年营收 380 亿。Duolingo 不到 900 人,营收超 7 亿。

算一下人均产值:MrBeast 约 280 万美元,Netflix 约 270 万,Duolingo 约 78 万。三家都在百万美元量级附近。

最近这三家公司不约而同地公开了各自的员工手册。我花了一天把三份都读完了。风格天差地别。但拆到底层,它们在回答同一个问题。


三个判断:

一、高人效公司都找到了某种"杠杆"——用技术替代人头堆砌。 MrBeast 靠 YouTube 的分发算法,50 个人做一条视频,一亿人看。Netflix 靠推荐引擎,软件服务 2.6 亿用户。Duolingo 靠产品自增长,那只绿色猫头鹰自己就是市场部。人效百万不是目标,是拒绝线性扩张的结果。

二、三份手册代表三种组织原型。 MrBeast 是"创始人大脑"模式——一个人的品味驱动一切。Netflix 是"上下文而非控制"模式——雇最好的人,给最少的规则。Duolingo 是"实验机器"模式——系统自己产出品味,数据说了算。三种模式对 AI 的适配度完全不同。

三、这三份手册本质上在解决同一个问题:怎么把品味传递出去。 不是传递知识,不是传递流程——是传递"什么算好"这个判断标准。这跟给 AI 写系统提示词是同一件事。


1. 三份手册长什么样

先说直观感受。

MrBeast 的手册 36 页,Jimmy Donaldson 自己写的。满篇错别字和语法问题,他开头就道歉了——"我是 YouTuber 不是作家哈哈"。读起来像凌晨两点的创始人独白。读完这本手册你会觉得跟 Jimmy 吃过一顿饭,聊了他怎么想视频、怎么管团队、什么事让他抓狂。

Netflix 的只有 5 页。极度精炼。四根柱子撑起整份文件:梦之队、人大于流程、令人不安的兴奋、永远更好。休假政策两个字:"休假。"报销政策五个字:"按 Netflix 利益行事。"

Duolingo 做了一本 64 页的插图书。有版本号(1.0.0),封面是猫头鹰 Duo 的建模解剖图,背面标注"O.BUTT"。五个原则、一套叫"绿色机器"的运营框架、术语表。像一本软件操作手册。

风格完全不同。但每份手册都在做同一件事——把创始人脑子里关于"什么算好"的隐性判断,变成别人能执行的显性系统。

2. MrBeast:一个人的品味就是公司的操作系统

Jimmy 的手册有一条核心原则:你的目标是做最好的 YouTube 视频。 不是最好看的视频,不是制作水平最高的视频,不是最搞笑的视频——是最好的 YouTube 视频。

这句话看着像废话。但他后面花了 20 页解释为什么不是废话。

YouTube 视频的好坏可以精确度量。三个指标:CTR(点击率)、AVD(平均观看时长)、AVP(平均观看百分比)。每条视频的留存曲线精确到秒——60 万人点进来,第一分钟走了 21 万,第三分钟走了多少,第六分钟在哪里回升。他在手册里放了真实的后台截图。

品味在这里不是虚的。品味 = 理解这三个指标、知道怎么优化、并且知道什么时候不该优化。

他举了一个例子。100 天圆圈挑战——有人住在一个圆圈里 100 天就给 50 万美元。一般制作公司会从他住进去的第一天开始拍。Jimmy 的做法是:开拍 30 秒,一台吊车把整个房子吊到半空中放进圆圈里。

这对留存率没有直接帮助。从数据角度说,可能是浪费钱。但 Jimmy 说这种事的价值在于"wow factor"——"who the fuck else on Youtube can do that"。让观众记住 MrBeast 和其他频道不一样。

这个判断不在任何指标体系里。它纯粹是品味。而整个公司的运转围绕这一个人的品味展开。

手册里有一段特别值得注意。Jimmy 教员工怎么向他提问题。别说"我们要送一辆车,这辆雷克萨斯怎么样"——这让他承担了所有认知负荷。应该说:"视频第 6 到 9 分钟有个送车环节,预算一万美元。我搜了北卡所有这个价位的酷车,找到 5 辆已经过了创意审批的,还有 5 辆备选。你觉得哪个好?"

这不是沟通技巧。这是提示词工程。他在教人类怎么给他提供足够的上下文、界定约束条件、呈现选项。跟写 AI 的 system prompt 是一回事。

2.1 但这个模式的天花板是创始人本人

手册里有一段写得很诚实。Jimmy 说他同时管 4 个频道、3 个企业、一个慈善基金。他没法对每条视频都了如指掌。所以当你问他问题的时候,别指望他跟你一样清楚细节——你要把调研做完、把选项摆好、把背景讲清。

他提到一个人,James Warren,"理解这家公司每一个环节",5 个人做了一周解决不了的问题他 30 分钟搞定。不是因为 James 更聪明,是因为他掌握了全局上下文。

道升术降那篇文章里我说过:Will(方向、判断、品味)是升值资产,Skill(执行、技术、手艺)是贬值资产。MrBeast 的架构是这个论点的极端表达——一个人的 Will 驱动整个公司,所有 Skill 都是 Will 的放大器。

问题是:他手册里还写了一句话——"I am not always right"。他让员工挑战他、给他选项、告诉他哪里不对。这种来自人类的反馈是结构性的。换成 AI 执行会怎样?AI 目前不会真正推回来。它可以被指令"生成反对意见",但它不知道什么时候该推回来。

创始人大脑模式最容易迁移到人+AI 团队——结构几乎不用变。但你会失去人类推回来的那股力量。

3. Netflix:给最少的规则,换最大的自主权

Netflix 的做法正好反过来。

MrBeast 写具体操作,Netflix 写原则。MrBeast 说"知道你在做的是视频的第几分钟",Netflix 说"按 Netflix 利益行事"。

Netflix 的核心赌注:雇异常负责任的人,给他们最大自由度。 规则越少越好——因为规则会随公司变大而膨胀,最终扼杀创造力。他们明确说:"我们自己不会总是做到这些标准。"

几个关键机制。

Keeper test。 管理者要定期问自己:如果这个人要离职,我会拼命留吗?如果答案是不会,那就让他走。不是因为他做错了什么——是因为有更好的人存在。Reed Hastings 小时候钓到一条鱼,他爸说"That's a keeper, Reed!"——这就是名字的来源。

Context not control。 管理者不做决定。管理者给团队提供做出好决定所需的上下文和信息。但——手册里强调了——这不等于放手不管。管理者要参与、要提问、要在关键时刻介入。

Farming for dissent。 做重大决定之前,负责人要主动去找不同意的人。不是等他们来找你——是你去找他们。听完之后,做出决定。如果有人仍然不同意,要求他们"disagree and commit"——可以保留意见,但执行要全力以赴。

后 Agent 时代的组织那篇文章里,我分析了 Block 的 IC/DRI/player-coach 三角色模型——消灭永久中层管理。Netflix 的做法异曲同工但路径不同:不是取消中层,是让中层从"控制者"变成"上下文提供者"。

这个模式对 AI 来说最难复制。原因很简单——它要求代理人具备真正的自主判断力。不是执行指令,是在模糊情境下形成独立观点、有勇气表达、在决策逆风时依然全力执行。现在的 AI 还做不到。

Netflix 的体系只在一种条件下运转:组织里全是"异常负责任"的人。放到 AI 语境里就是:你需要一个用极短系统提示词就能做出高质量判断的模型。我们还没到那个阶段。

4. Duolingo:品味不靠人传递,靠系统生产

Duolingo 走了第三条路。

五个原则明确,但真正的操作系统是"绿色机器"——六步循环:

  1. 用好人。保持团队精简,成功之后才加人。
  2. 定义成功。设清晰可量化的目标。
  3. 设护栏,想长远。
  4. 开建,设反馈循环。
  5. 紧迫但精良地执行。
  6. 加倍投入有效的,停掉无效的。

这套机制的精妙之处:它不依赖任何个人的品味。 系统自己产出品味。跑几百个实验,数据说哪个好就留哪个。

Luis von Ahn 在 letter 里写道:"我们的文化不是从科技创业手册里抄来的,是几个书呆子在匹兹堡一个体育酒吧楼上的办公室里从零建起来的。"第一批员工大多是刚毕业的新人——得自己摸索"应该雇什么人?怎么组织团队?怎么做产品?"

这种从零摸索反而成了优势。没有预设,一切从实验中来。

几个细节值得注意。

V1 不是 MVP。 Duolingo 明确不做 MVP(最小可行产品)。他们做 V1——"V1 可能没有所有功能,但它必须精良。MVP 经常成为发布半成品的借口。"这个命名选择本身就是品味编码——每次有人说"发 V1",这个词自带质量标准。

99 个坏主意。 领导层会议上专门留时间头脑风暴"荒谬、不可能的问题"——"如果能跟 Duolingo 的角色对话呢?""如果 Duo 在超级碗有 5 秒钟时间呢?"前一个变成了产品功能。后一个变成了 2024 年超级碗 5 秒广告——花了别人三十秒广告的零头,效果一样好。

Trust Battery。 信任不是默认给的,是充出来的。不管你是实习生还是新来的副总裁,刚进来信任电池都是半格。每一次靠谱的交付充一格。每一次掉链子掉一格。级别不决定信任——成果决定。

这套系统跟 AI 的适配度最高。绿色机器的六步循环就是一个 agent loop:启动、定义目标、设约束、执行、测量、迭代。把其中几步交给 AI agent——特别是"跑实验"和"测量结果"——机器照样转。可能转得更快。

5. 底层是同一个问题

三份手册风格不同、长度不同、面向的组织规模不同。但拆到最底层,它们在回答同一组问题:

  • 我们在优化什么?
  • "好"长什么样?
  • 遇到模糊地带怎么办?
  • 什么事绝对不能做?
  • 怎么评估一个人(或一个产出)的质量?

如果你写过 CLAUDE.md——给 AI agent 的系统配置文件——你会发现这组问题一模一样。

CLAUDE.md 回答的是:这个 agent 应该怎么思考、怎么做决定、什么时候停下来问人、质量底线在哪。好的 CLAUDE.md 不写抽象原则,写具体操作——"遇到不确定的类型用 unknown 而不是 any","改 bug 之前先说根因","不要动没让你动的代码"。

MrBeast 的手册做的是同一件事。"知道你在做的是第几分钟。""向我提问时带着调研和选项来。""创意能省钱——一年的多力多滋只要 1825 美元。"

品味传递的难点在于:大部分品味是隐性知识。你知道什么好什么不好,但你从来没被迫把它写成文字。写 CLAUDE.md 的过程会逼你把脑子里模糊的判断标准变成明确的指令。写员工手册也是。

三家公司的手册质量——品味编码的精度——直接预测了组织能自主运转到什么程度。

MrBeast 的手册极具体,所以即使 Jimmy 不在场,团队也知道该怎么做。Netflix 的手册极抽象,所以它只能配合极优秀的人运转。Duolingo 的手册是一套流程,所以它不依赖任何个人。

给 AI 写系统提示词也是同一个取舍。写得太具体,agent 自主空间小。写得太抽象,agent 容易偏。写成一套流程,最稳定——但你需要好的度量体系支撑。


工具时代考的是你能执行什么。AI 时代考的是你能编码什么——你的判断、品味、对"好"的感觉——能不能变成一套系统,在你不在的时候自己运转。

三份手册,三种写法,同一个问题。跟给 AI 写系统提示词是同一件事。只不过对象是人的时候,更难写。


© Xingfan Xia 2024 - 2026 · CC BY-NC 4.0