AI 的最后一公里不是技术问题

先把镜头拉远，看看 AI 的普及现在到底走到了什么位置。

AI 使用率可视化——每个小方块代表约 320 万人 AI 使用率可视化——每个小方块代表约 320 万人

全世界 84% 的人从来没跟 AI 对过一次话，只有 16% 用过免费的聊天机器人，大约 0.3% 每月为 AI 付费。使用编程 Agent 的人？大概 0.04%，是图上几乎看不见的那一个红点。（数据来源：Noah Epstein）

类比手机的话，现在大概相当于 iPhone 刚问世的时候：大多数人还在用诺基亚，没人知道移动互联网会怎么改变世界。AI 不光没走到中期，连中期的开头都没到，这才刚刚起步。

这就是那个周末，我那位从北京来西雅图的朋友走进的世界。

他是我大学最好的朋友之一，做金融，平时看 deal、写投资研报。这次来西雅图出差，除了叙旧，还有一个明确的目的：学会用 AI Agent 提高效率。他大学选过几节 CS 入门课，不过那是八年前的事，早就还给老师了。他人聪明，学东西快，动机也强。我平时经常跟他分享用 AI Agent 的各种 use case，他看到了这些东西的潜力，知道不能再等了。

于是我花了一个周末，手把手教他用 Claude Code。从零开始：在 GCP 上部署他自己的 OpenClaw 实例，接入飞书，配好 tunnel。然后用 Claude Code 做他真正需要的事，财务分析、数据整理，甚至给业务场景搭定制的小工具。这个周末让我看到了三件事，每一件都比我之前的理论思考更直接、更真实。

上一篇我写过 Agent Marketplace 的"对话式入口"：用户不该在货架上挑 Agent，直接说出需求，让平台来匹配。听起来很美。现实是，在我朋友能开始"对话"之前，先得跨过一道巨大的门槛。

最磨人的是搭环境。GCP 账号注册、gcloud CLI 安装、服务器配置、框架部署、飞书集成、tunnel 转发，每一步对我来说是几分钟的事，到他那里全是连环问号。问得最多的一句是："这是什么？为什么要这样？"这不怪他，这些东西本来就不在非技术人员的认知范围里。

等环境搭好，情况完全反了过来：Claude Code 几乎能接管后面的所有事，帮他写脚本、读文档、调试错误、部署服务。问题从来不在 Agent 本身，Agent 已经够强了；问题在从"我想要一个 Agent"到"我有一个能用的 Agent"之间的那段距离。

这就是 Agent 革命的"最后一公里"。物流行业有个经典说法：仓库到城市快，城市到小区也快。偏偏是小区门口到你家门口那几百米，成本最高、效率最低，吃掉了整条配送链里不成比例的资源。Agent 领域完全一样。大模型能力到了，Claude Code 够强，Skills 生态也在形成，可是从普通用户到真正用上这些东西的那条路，几乎是空白。大家都在讨论 Agent 能做什么，很少有人在解决普通人怎么用上。

入口的问题，我自己试过解。用同一套框架，我在 GCP 上给盘盘猫搭了一个全自动的 AI 工程师，接进飞书群。团队成员不需要提交 bug 报告或者 feature request，直接在群里跟 Agent 对话。Agent 自动验证、分类问题，创建 GitHub Issue，生成任务追踪。简单的 bug 直接提交修复 PR，复杂的需求会生成一份带上下文、分析和建议的详细报告。我从一个个收集信息的活儿里解放出来，只需要思考和做决定。团队成员用起 Agent 来，就像在飞书上找同事聊天，入口的问题确实解决了。

但搭起这套体验的人是我，一个天天泡在 Claude Code 里的工程师。普通用户既没有能力、也没有意愿走完这套搭建流程，甚至意识不到还存在这种体验。所谓"最后一公里"，真正卡住的地方在于：必须有人替你把那段路铺好，而目前能铺路的只有技术人员。绝大多数人身边，没有一个愿意花时间帮他们铺路的技术人员。

Anthropic 也看到了这件事。Claude Code 的创造者 Boris Cherny 在访谈里提到，内部的设计师、数据科学家、财务团队都在"跳过重重障碍"，往终端里装 Claude Code。非工程师自己搞定 Node.js 安装和终端命令，就为了用上 Agent 级的能力。外部也一样，有人用它监控番茄苗的生长，有人从损坏的硬盘里恢复婚礼照片，有人拿它做财务分析。需求明确无误，门槛也实在荒谬：一个终端命令行工具，不该是"想用 AI 交停车罚款"的人的入口。

于是 Anthropic 造了 Cowork：把 Claude Code 包进易用的桌面界面，跑在虚拟机里，加上删除保护和权限提示。四个工程师十天做出来，代码完全由 Claude Code 自己写。Cowork 是第一个认真尝试在规模上铺"最后一公里"的产品，保留了 Claude Code 完整的 Agent 能力，去掉了终端这道门槛。它没解决全部问题，用户还是得学会怎么下指令、怎么用目标而非步骤去描述需求。但最残酷的那道门槛已经拆掉了，你不再需要先成为工程师，才能开始用。

我朋友用过 ChatGPT 和豆包，也用过各种别的聊天机器人。他对 AI 的认知跟大多数人一样：一个比搜索引擎聪明一点的问答工具。大概 99.99% 的人都是这么理解的。他比大多数人多的那一点，是我平时分享给他的那些 Agent 真实使用场景，所以他知道"这东西应该很厉害"。但知道和亲眼看到，是两回事。

那个周末我们做了三件事。先让 Claude Code 读他的财务数据，建模，生成分析报告，再根据他的反馈迭代。一套流程跑下来，做的已经是完整的财务分析，远不止回答几个问题。然后从零做了一个用声音音调控制的 Flappy Bird：一个多小时，从零到能玩，最后变成两个成年人对着电脑嚎叫，靠调门控制那只鸟别撞上管子。最后 Claude Code 帮他搭了一个完全针对他业务场景的定制工具，一个只为他的需求而存在的应用，市面上没有任何通用软件能替代。

三件事做完，他说了一句："一个小时前，这些东西都不存在。"

这句话验证了上一篇写的"日抛型软件"判断：为一个人定制软件，技术上完全可行。但 99.99% 的人根本不知道可以提这个需求。他们没见过 Agent 级的能力，用的是免费版、限速的模型，对 AI 的全部印象，就是一个偶尔能给出有用答案的聊天框。说到底，卡住人们的是认知：不知道什么是可能的，就不会去想要，没人会要求一个自己不知道存在的东西。

Boris Cherny 提过一个产品术语，潜在需求（latent demand）："人只会做已经在做的事。不可能让人去做全新的事。如果人们在试图做一件事，你让它变得更容易，是好主意。但如果试图让他们做不同的事，他们不会做。"

我朋友不是没需求，他天天都在做财务分析、写报告、做投资决策，需求一直在。缺的只是"AI 能让这些事快十倍"这层认知。一旦亲眼看到 Claude Code 在自己的数据上跑起来，潜在需求瞬间就变成了显性需求。这样的需求规模大得惊人，数十亿信息工作者的工作都能被 Agent 改变，他们只是不知道供给已经存在。

Boris 在访谈里举的潜在需求场景，全都不在编程领域。比如每天都在做的重复工作，交停车罚款、取消订阅服务、汇总团队周报，每个人都有、但没人想做。比如数据分析和研究，从"帮我回答这个数据问题"变成"这是我的数据库，帮我探索数据，找出有意思的规律，写份报告"。跑什么查询、怎么呈现，Agent 自己决定。

再比如为具体场景定制工具，也就是第四篇讲的"日抛型软件"。不用在市面上找"差不多能用"的通用产品，直接描述需求，让 Agent 做一个只为你服务的工具。学习也是，从搜索引擎式的"X 是什么"变成"我想理解 X，我的背景是 Y，用我能理解的方式解释，给我实际例子，然后陪我一步步深入"。Agent 会根据你的知识水平调整解释的深度，像一个有无限耐心的私人导师。

需求无处不在，能力也到位了，剩下的瓶颈落在用的人身上：你能不能给 Agent 布置一个合理的任务。假设你雇了一个软件工程师，跟他说"给我弄个 XX 软件"，他能一晚上弄好吗？人能弄好的，AI 大概率也能；人弄不好的，AI 大概率也弄不好。

"给我弄个像微信的即时通讯软件"就属于人也做不好的需求，太模糊了：服务多少用户？"像微信"是指像微信这么难用，还是指支持语音输入？要不要朋友圈？换成"我有一个公司的中文网站，保持视觉风格不变，把所有内容翻译成英文，做一个一模一样的英文站出来"，验收标准明确，就可以做得很好。不论是人还是 AI，指望一两句话就完美交付，这个期待本身就不切实际。

用 AI 的最大瓶颈，是你能不能像一个好的管理者那样给它布置任务。这件事值得单独展开，第六篇接着聊。