ENZH

三种模式同时跑是什么感觉

三种协作模式并行运转三种协作模式并行运转

一张待办清单,26 分钟清零

Mio v0.0.3 的待办清单:给 Telegram bot 的 onboarding 流程加分级输入验证、部署、根据实际使用反馈调整限制、更新六个文档、写 changelog、打 tag、跑一遍完整的代码审计、修掉审计发现的所有问题、全部推到生产环境。

传统流程会把这些排成流水线:写代码、测试、提交、写文档、跑 linter、修 lint、开 PR、等 review、改 review 意见、合并、打 tag、发 release。认真做一整天,偷懒的话两天。

这次全部在大约 26 分钟内完成。

不是在同一条流水线上跑得更快——而是把三种完全不同的协作模式同时跑起来了。

模式一:说哪里不对,看着它改

Session 从一个具体需求开始:给 Mio 的 onboarding 流程加输入验证。Bot 会问用户昵称、爱好、性格偏好——全是自由文本输入,共享一个 500 字的上限。

昵称字段能输 500 个字。这也太离谱了。

我跟 Claude Code 说了需求。它读了 onboarding 的代码,识别出所有输入字段,实现了一个双层方案:SHORT_INPUT_KEYS 里的字段限制 50 字(昵称、爱好),其他长文本字段保持 500 字。

然后 build Docker 镜像、push registry、部署到 Cloud Run。Revision 44。从读代码到实现到部署,大约 14 分钟。

这就是直接模式:你和 Claude Code 在同一个问题上协作,AI 处理机械性的工作(Docker build、gcloud run deploy),你负责设计决策。

500 → 50 → 10 → 6

我测试了部署后的 bot。50 字还是太多了,而且空白输入没有被拦截。

"50 chars feels too much for name.. doing a one fit all max is bad, also validate blanks"

Claude Code 立刻调整。不再用双层方案,改成按字段配置:

昵称:           10 字
风格/性格选项:   30 字
爱好:           50 字
长文本:         500 字

加上空白拦截——空输入被弹回来,附带一句"不能空着哦~"。Build、push、deploy。Revision 45。从反馈到上线,大约两分钟。

然后我又看了一眼昵称限制。10 个字?中文名字一般 2-4 个字,连昵称都很少超过 6 个。

"max 10 char seems still a lot for chinese chars?"

Claude Code 改成 6。再部署一次。

昵称上限经历了四个阶段,每一轮从"这不对"到"上线了"大约两分钟。

跟传统开发完全是两种体感。反馈循环不是"提 ticket、等下个 sprint、staging 环境测"。而是"说哪里不对,看着它被修,线上测,重复"。

三次生产部署,全靠一段对话驱动。

模式二:踢个任务出去,自己继续干

有意思的来了。在我还在给昵称限制提反馈(10 → 6 那一轮)的同时,文档也需要更新。六个 docs 文件、一条 changelog、一个 v0.0.3 的 git tag。

传统流程里,这只能排后面:先改完代码,再写文档。更常见的是——"文档回头再补"(然后就没有然后了)。

我说了一句:

"spawn subagent to update all docs in docs/, todo, etc, and update changelog and tag v0.0.3 release"

Claude Code 启动了一个后台 agent,然后继续跟我讨论昵称限制。后台 agent 在读文档、更新六个文件、写 changelog、创建 git tag——与此同时,我还在跟主 session 迭代实现。

几分钟后,后台 agent 汇报:六个文档更新完毕、changelog 写好、v0.0.3 tag 已打。有个小偏差——它用的是旧的 10 字限制,因为它跟我最后的改动是并发跑的,它先跑完了。记下来回头改就行。

这就是后台模式:启动一个 agent 做不需要你盯着的工作,自己继续干主线任务。AI 版的"踢掉一个 CI pipeline 然后继续写代码"。

模式三:定好目标,让它自己收敛

实现做完了,文档也更新了。接下来我要一次完整的代码审计——不是随便扫一眼,要彻底审查并修复问题。

"spawn agent team to do full review and audit of current codebase, then fix any issues. Do this iteration until review agent cannot find issues"

Claude Code 创建了一个团队:一个审查 agent、一个修复 agent,用依赖链串起来。

第一轮

审查员扫描了整个代码库,产出 22 条发现——安全问题、可靠性隐患、正确性 bug。修复员接手,解决了 21 条。有一条被搁置:内存累加器的批处理效率优化,LOW 优先级,合理的技术债。

第二轮

审查员在修复后的代码库上重新跑了一遍。发现了 3 个新问题——第一轮修复引入或暴露出来的。修复员全部解决。

第三轮

最终验证。审查员没有发现新问题。结论:APPROVED

三轮总计:25 个问题中解决了 24 个。剩下那个是性能优化,不是 bug,不是安全风险,现在改的收益不值得增加的复杂度。

这就是团队模式:你定义目标("审查到干净为止"),Claude Code 创建 agent、设置依赖链,agent 自主迭代。我没有审查任何中间结果——只看了最终总结。

第五篇的区别在于迭代循环。第五篇是单次审查:四个审查员找问题,三个修复员改完,结束。

这次跑了三轮——审查员检查修复员的工作,发现遗漏,修复员再改。不只是并行审查,是收敛性审查:迭代直到增量为零。

三种模式交叠运行

实际发生的事情:

0:00   开始实现输入验证
       ├── 直接模式:读代码,实现分级限制
14:00  部署 revision 44
       ├── 直接模式:用户测试,给反馈
       ├── "50 字太多了,要拦空白"
16:00  部署 revision 45(按字段限制 + 空白拦截)
       ├── 直接模式:继续反馈
       ├── "10 个字对中文名还是太多"
       ├── 后台模式:文档 agent 启动 ← 并发
17:00  部署 revision 46(昵称 → 6 字)
       ├── 后台 agent 还在跑文档/changelog
19:00  后台 agent 完成(6 个文档、changelog、v0.0.3 tag)
       ├── 团队模式:审查团队启动 ← 并发
       ├── 第一轮:22 条发现 → 修复 21 条
       ├── 第二轮:3 条新发现 → 全部修复
       ├── 第三轮:验证通过 → APPROVED
26:00  全部提交、推送、gh release 创建完毕

我在跟主 session 结对编程的时候,文档 agent 在后台更新文档。审查团队在自主迭代的时候,我在处理发布事务。

串行流程的话,这至少是五个阶段:实现 → 迭代 → 文档 → 审查 → 发布。这里,阶段 2-3 重叠了(边改代码边后台更新文档),阶段 4 完全自治(审查团队自己迭代,不需要我介入)。

发布

审查团队 approve 之后,提交并推送:

git push origin main --tags
gh release create v0.0.3 --title "v0.0.3: Multimodal Input, Enhanced Onboarding, Selfie Generation"

从第一行代码到 GitHub release,一个 session。这次工作的产品视角单独写了——这篇纯粹讲工作流。

没有万能模式,但可以混着用

重点不是"AI 很快"。重点是三种模式可以组合

直接模式给你紧密的反馈循环——说哪里不对,看着它变。但需要你的注意力。

后台模式释放你的注意力——启动任务,忘掉它,完成了通知你。但它不能响应你的反馈。

团队模式给你自治迭代——定义目标,让 agent 收敛。但对于快速修改来说太重了。

没有哪一种模式能覆盖所有场景。真正的威力在于在同一个 session 里流畅地切换,有时候同时跑两三种。

第四篇暗示了这一点但没有完全展开。Agent Team 展示的是并行执行——五个 agent 构建不同的模块。这篇展示的是另一回事:混合模式编排——人类在结对编程、委派后台任务、AND 跑自治循环,全部同时进行。

瓶颈变了

传统流程:

写代码(2h)→ 测试(30m)→ 提交 → 文档(1h)→ Lint(15m)
→ 修 lint(30m)→ 开 PR → Review(等 1-3 天)→ 改 review 意见(1h)
→ 合并 → 打 tag → Release notes(30m)→ 发布
总计:1-4 天

混合模式编排:

直接模式:写代码 + 测试 + 部署(14m)
直接模式:根据反馈迭代(3 次部署,12m)
后台模式:文档 + changelog(并发,~8m)
团队模式:3 轮审查 + 修复(自治,~15m)
直接模式:打 tag + 发布(2m)
总计:~26 分钟活跃时间

以前的瓶颈是执行时间——写代码、写文档、等 review。现在的瓶颈是决策时间——做什么、限制设多少合适、什么时候发布。机械性工作在并行流里跑,我编排但不执行。

这才是真正的变化。不是"AI 写代码更快"。而是从 idea 到 release 的整条流水线并发运行,你是指挥。


© Xingfan Xia 2024 - 2026 · CC BY-NC 4.0