AI 的最后一公里不是技术问题
先退一步看看我们到底在什么阶段。
AI 使用率可视化——每个小方块代表约 320 万人
全世界 84% 的人从来没有和 AI 对过一次话。只有 16% 用过免费的聊天机器人。大约 0.3% 每月为 AI 付费。使用编程 Agent 的人?大概 0.04%——图上几乎看不见的那一个红点。(数据来源:Noah Epstein)
想想 iPhone 刚问世的时候——大多数人还在用诺基亚,没人知道移动互联网会怎么改变世界。
我们还没走到 AI 的中期。连中期的开头都没到。才刚起步。
这就是那个周末,一个从北京来西雅图的朋友走进的世界。
一个周末的碰撞
老朋友从北京来西雅图出差。除了叙旧,他有一个明确的目的:想学怎么用 AI Agent 提高效率。
他是我大学时期最好的朋友之一,做金融的——看各种 deal、写投资研报。大学时选过几节 CS 入门课,但那已经是八年前的事了,早还给老师了。
他很聪明,学东西快。更关键的是——他有强烈的动机。我平时经常和他分享我用 AI Agent 的各种 use case,他亲眼看到这些东西的潜力,知道自己不能再等了。
于是我们花了一个周末做了一件事:我手把手教他用 Claude Code。
从零开始:在 GCP 上部署他自己的 OpenClaw 实例,接入飞书,配置 tunnel,然后用 Claude Code 做了一系列他真正需要的事——财务分析、数据整理、甚至给他的业务场景搭了一个定制化的小工具。
这个周末让我看到了三件事。每一件都比我之前的理论思考更直接、更真实。
那道看不见的墙
上一篇我写到 Agent Marketplace 的"对话式入口"——用户不该在货架上挑选 Agent,而是直接说出需求让平台匹配。听起来很美。
但现实是:在我朋友能"对话"之前,他得先跨过一道巨大的门槛。
GCP 账号注册、gcloud CLI 安装、服务器配置、框架部署、飞书集成、tunnel 转发……
每一步对我来说都是几分钟的事,但对他来说都是"这是什么?为什么要这样?"的连环问号。不是因为他笨——是因为这些东西对非技术人员来说根本不在认知范围内。
有意思的是,一旦环境搭好,Claude Code 几乎可以处理后面的所有事情。帮他写脚本、读文档、调试错误、部署服务。
问题不在 Agent 本身——Agent 已经足够强了。
问题在于从"我想要一个 Agent"到"我有一个能用的 Agent"之间的那段距离。
这就是 Agent 革命的"最后一公里"。
物流行业有一个经典概念:最后一公里是整个配送链中成本最高、效率最低的环节。仓库到城市很快,城市到小区很快,但从小区门口到你家门口——这最后几百米,吃掉了整个链条中不成比例的资源。
Agent 领域完全一样。
大模型的能力到了。Claude Code 够强。Skills 生态在形成。但从普通用户到能用上这些东西之间的那段路,几乎是空白的。
每个人都在讨论 Agent 能做什么。很少有人在解决普通人怎么用上 Agent。
其实有一些产品在一定程度上解决了入口问题。就拿我自己的例子——我用同一个框架在 GCP 上给盘盘猫搭了一个全自动的 AI 工程师,接入了飞书群。团队成员不需要提交 bug 报告或 feature request,直接在飞书群里和 Agent 对话。Agent 自动验证、分类问题,创建 GitHub Issue,生成任务追踪;简单的 bug 直接提交修复 PR;复杂的需求会在 GitHub Issue 里生成详细报告——包含上下文、分析和建议。
这极大地解放了我:不再需要一个个跟团队收集信息,我只需要思考和做决定。
对团队成员来说,用 Agent 就像在飞书里找一个同事聊天一样简单。入口问题确实解决了。
但问题是——搭建这个体验的人是我,一个每天在 Claude Code 里工作的工程师。
普通用户没有能力、没有意愿、也没有认知去完成这个搭建过程。 他们甚至不知道这种体验是可能的。
所以"最后一公里"的本质不是"Agent 不好用"——而是"必须有人替你铺好那段路"。
目前,这个铺路人只能是技术人员。而绝大多数人身边,没有一个愿意花时间帮他们铺路的技术人员。
Anthropic 也看到了这个问题。Boris Cherny——Claude Code 的创造者——在最近的访谈里提到:在 Anthropic 内部,设计师、数据科学家、甚至财务团队都在"跳过重重障碍"去安装终端里的 Claude Code。非工程师的员工自己搞定了 Node.js 安装和终端命令——只为能用上 Agent 级别的能力。
外部用户也一样:有人用它监控番茄苗的生长,有人用它从损坏的硬盘里恢复婚礼照片,有人用它做财务分析。
需求是明确无误的——但门槛也是荒谬的。一个终端命令行工具,不应该是"想用 AI 交停车罚款"的人的入口。
于是 Anthropic 造了 Cowork:把 Claude Code 包进一个易用的桌面界面,运行在虚拟机里,加了删除保护和权限提示。四个工程师用十天做出来,代码完全由 Claude Code 自己写的。
Cowork 是第一个认真尝试在规模上铺设"最后一公里"的产品。拥有 Claude Code 完整的 Agent 能力,但去掉了终端门槛。Anthropic 的销售团队已经开始从 Claude Code 迁移到 Cowork——"因为更容易上手,而且有虚拟机所以更安全一点,"Boris 说。
这没有解决全部问题——用户仍然需要学会怎么下好指令、怎么用目标而不是步骤来思考。但它移除了最残酷的那道门槛:你不再需要是个工程师才能开始。
99.99% 的人不知道什么是可能的
我朋友用过 ChatGPT,用过豆包,用过各种聊天机器人。他对 AI 的认知和大多数人一样:一个比搜索引擎聪明一点的问答工具。
这大概是 99.99% 的人的理解。
他比大多数人多一个条件——我平时会和他分享 AI Agent 的真实使用场景,他知道"应该很厉害"。但知道和亲眼看到是两回事。
那个周末我们做了三件事。
Claude Code 读取他的财务数据,建模,生成分析报告,根据反馈迭代——不是回答关于财务的问题,是真正在做财务分析。
然后我们从零做了一个用声音音调控制的 Flappy Bird——一个多小时,从零到能玩,两个成年人对着电脑嚎叫,试图控制那只鸟不撞管子。
最后 Claude Code 帮他搭了一个完全针对他业务场景的定制工具——不是通用软件的配置,是一个只为他的需求而存在的应用。
三件事做完,他说了一句话:
"一个小时前,这些东西都不存在。"
这验证了我在上一篇里写的"日抛型软件"判断:为一个人定制软件,技术上已经完全可行。
但 99.99% 的人根本不知道可以提这个需求。
他们从来没见过 Agent 级别的能力。他们用的是免费版的、限速的模型。他们对 AI 的全部印象就是一个偶尔能给出有用答案的聊天框。
这不是技术问题。这是认知问题。
人们不知道什么是可能的。不知道什么是可能的时候,你甚至不会去想要它。
你不会要求你不知道存在的东西。
Boris Cherny 有一个产品术语形容这件事:潜在需求(latent demand)。"人只会做他们已经在做的事。你不可能让人去做一件全新的事。如果人们在试图做一件事,而你让它变得更容易——这是好主意。但如果你试图让他们做一件不同的事,他们不会做的。"
我朋友不是没有需求——他已经在做财务分析了,在写报告了,在做投资决策了。需求一直都在。
他缺的是"AI 能让这些事快十倍"的认知。
一旦他亲眼看到——Claude Code 在他自己的数据上运行的那一刻——潜在需求瞬间变成了显性需求。
差距不在动机,在曝光。
最后一公里问题,本质上是一个潜在需求问题。需求存在——数十亿信息工作者的工作都可以被 Agent 改变。但他们不知道供给存在。
你不会要求你从未见过的东西。
那潜在需求长什么样?这是 Boris 在访谈中提到的真实场景——全都不是编程:
你每天都在做的重复工作。 交停车罚款、取消订阅服务、汇总团队周报。每个人都有但没人想做的事。
数据分析和研究。 不是"帮我回答这个数据问题"——而是"这是我的数据库,帮我探索数据,找有意思的规律,写成报告"。Agent 自己决定跑什么查询、怎么呈现。
为你的具体场景定制工具。 第四篇讲的"日抛型软件"——不需要在市面上找一个"差不多能用"的通用产品,直接描述需求,让 Agent 给你做一个只为你服务的工具。
学任何你想学的东西。 不是搜索引擎式的"X 是什么"——而是"我想理解 X,我的背景是 Y,用我能理解的方式解释,给我一个实际的例子,然后陪我一步步深入"。Agent 根据你的知识水平调整解释深度,像一个有无限耐心的私人导师。
需求无处不在。能力已经到了。
但最大的瓶颈已经不是工具有多强——而是你能不能给 Agent 布置一个合理的任务。
想象你雇了一个软件工程师,跟他说:"给我弄个 XX 软件。"他能在一个晚上弄好吗?人能弄好,AI 大概率也能;人弄不好,AI 大概率也弄不好。
"给我弄一个像微信一样的即时通讯软件"——太模糊了,人也做不好。服务多少用户?"像微信"是指像微信这么难用,还是指支持语音输入?要不要有朋友圈?
但如果你说:"我有一个公司的中文网站,保持视觉风格不变,把所有内容翻译成英文,做一个一模一样的网站出来"——有明确验收标准的需求,它就可以做得很好。
不论是人还是 AI,指望说一两句话就读心术般完美交付,这个期待本身就不切实际。
用 AI 最大的瓶颈,不是工具有多 powerful,而是我们能不能像一个好的管理者一样,给它布置任务。第六篇会展开聊这个。