ENZH

我眼里的 AI 全局:算力、芯片和一场万亿级的重新分配

📊 幻灯片

三条需求曲线汇聚于同一个根——算力三条需求曲线汇聚于同一个根——算力

前几天跟一个有可能加入团队的人聊了两个多小时。从芯片聊到 Agent,从 Agent 聊到每个人的未来。

挂掉电话我想:这些东西我想了一年多,但从来没完整写下来过。

我做了六个产品,写了快两百篇文章,这些想法散落在各处。跟投资人讲一段,跟朋友吹牛讲一段,在推特上怼人的时候讲一段。

今天把它们拼一次。

当代码变成日抛品

去年有一个瞬间让我愣住了。

我用 Agent 写了一段代码,跑完任务,Agent 自己把代码删了。生成、使用、丢弃,全程不到三分钟。

我盯着屏幕想了很久。如果代码是日抛品——想用就生成,用完就扔——那什么东西是不可抛弃的?

答案是认知。

一个 AI 跟你聊了三个月,积累下来的东西——你的决策模式、你的情绪触发点、你说一套做一套的那些矛盾——这些东西不可复制、不可压缩、不可加速。别人花钱买不到,别的 AI 从零开始也追不上。

我在《软件变成日抛品了》里详细写过这个判断。

这是我所有想法的地基:技术在贬值,关系在升值。代码越来越便宜,理解一个人越来越贵。

你可能觉得"理解一个人"听起来虚。但想想看:CEO 身边那套配置——私人助理、心理咨询师、健身教练、执行秘书——本质上就是"有人懂你"的变现。以前只有年薪千万的人才配得起。

AI 第一次让这件事变成了月费订阅。

三条需求曲线

我看 AI 的需求,看到三条曲线。起点不一样,速度不一样,但最后都指向同一个东西。

第一条:企业在裁人。

我自己的团队,3 个工程师,干的活放两年前需要 15-20 个人。每个人都是 Agent 的管理者,不是执行者。

关键技能变了。不是写代码——是定义目标、提供上下文、给出精准反馈。你现在是经理,你管的是 AI。我在《别写代码了,学管 AI 吧》里把这个逻辑掰开说了。

大厂已经在动了。Meta 光 2025 到现在已经砍了好几轮,从低绩效到整个部门一锅端。其他家在跟进,只是没说出来。

那种"大厂 PM 的一天,下午三点下班"的日子?结束了。

第二条:人人都是开发者。

我们团队有个没写过代码的人,用 Claude Code 给自己搭了个社交媒体发帖工具。以前每周花 12 小时手动发帖,现在砍掉一半。

这不是"更好的 App Store"。这是一个以前根本不存在的市场。

以前你想做个东西,得去 App Store 找个勉强能用的凑合。以后每个人都能给自己造一个,完全贴合自己的需求。SaaS 那套锁定用户的玩法——数据迁移成本、工作流惯性、集成复杂度——Agent 全绕过去了。我在《印刷术时刻》里写过:高毛利的 SaaS 正在变成套利目标。

第三条:人人都有 AI 秘书。

私人秘书这个东西,以前只有政府官员和 Fortune 500 高管才有。以后每个人都有。

但这里有个坑:纯聊天做不到。

所有 AI 陪伴产品最后都变得无聊,因为聊天是一维的。真正的关系需要三个维度:对话、时间(共同经历)、空间(环境感知)。我在《纯聊天注定无聊》里分析了这个结构性天花板。

怎么破?可穿戴设备。一个只知道你打字内容的 AI 是带自动回复的日记本。但一个能观察到"你昨晚写代码到凌晨两点"的 AI,那份关心有温度。棉花娃娃是有身体没灵魂,聊天机器人是有灵魂没身体——人想要的是两个都有。

三条曲线,同一个方向:算力。

企业在裁人,创作者在造工具,普通人在等一个真正懂他们的 AI。所有人都在用更多的 AI,而所有 AI 都在吃算力。

算力经济学

AI 能力的成本在以离谱的速度下降。

2023 年用 GPT-4 处理一百万个 token 要花 $30。今天同等甚至更强的能力,不到 $1。两年,砍掉了 97%。

Claude 最强模型也一样。Opus 系列输出价格从 $75 降到 $25——三分之一。背后是 TPU 合作、推理优化、芯片竞争多重因素叠加。

我判断这个趋势至少还能持续五年。理由很简单:芯片在迭代、模型蒸馏在进步、云厂商之间的价格战在加剧。三股力量同时往下压。

每砍一个零,就多一波人用得起。就像智能手机便宜到一定程度,移动互联网才真正爆发。

但这里有个更深的转变。

训练曾经是算力最大的瓶颈。训一个顶级模型要花上亿美金。

但从 2025 年开始,推理追上来了,Deloitte 年底的报告确认了这个拐点。原因就一个字:Agent。

每一次 Agent 调用都是推理。一个用工具的 Agent,一个任务要跑好几轮推理。Agent 还能生 Agent,推理需求是复利式增长的。

训练是一次性投入,推理是永久消耗。模型训一次,但每个用户每天都在烧推理。

所以 AI 基建的钱在搬家——从训练集群搬到推理芯片。

现在还有一个窗口:大厂在疯狂补贴。Claude Code 的订阅计划,你付一个固定月费,拿到的价值大概是直接调 API 的几十倍。这跟当年滴滴烧钱抢市场一个逻辑。

但补贴不会永远持续。趁还在,把能用 AI 做的事都做了。

有意思的是,固定月费这件事本身就很重要——不是因为省钱,是因为它消除了心理成本。按量计费时你每次调用都在算"值不值得",像出租车计价器一样让人焦虑。固定价格让你放开手用,反而用出了真正的价值。

芯片

Nvidia 的护城河不是芯片,是 CUDA。

你可以造一块更好的芯片。但你造不出第二个 CUDA 生态。几十万开发者用了十几年,所有主流框架默认跑 CUDA。这不是砸钱能追的。

TPU 是 Google 的豪赌。

专门为矩阵运算设计的 ASIC。今天所有 LLM 的核心计算就是矩阵乘法,跑起来效率极高。但有两个结构性限制:第一,如果哪天计算范式不再是矩阵运算,这些芯片就废了(短期概率低,但赌注是真的);第二,TPU 按超大规模网络设计,你不能买 100 块搭个小集群,要么几万块连一起,要么别玩。Google 量级的游戏。

GPU 灵活得多,小到 10 个机柜,大到万卡集群都行。代价是网络开销——每花一块钱在 GPU 上,还得再花一块到一块五在配套基础设施上。

ASIC 新玩家们(Groq 等)技术上有亮点,但面对 Nvidia 的生态加资本壁垒,要么被收购,要么被碾压。

芯片战争的胜负不在实验室,在开发者社区。详细分析见《TPU 凭什么挑战英伟达》

大厂各怀心思

Google:浪子回头。

Sergey Brin 回来了。回来发现员工连 Gemini 都不能用来写代码,因为内部政策不允许。他直接捅到 Sundar 那里。

一年前大家还在做 Gemini 图片生成的 meme。现在 Gemini 3 Flash 干日常任务已经很能打了。

Google 有几十亿用户的分发渠道、有自研 TPU、有 Transformer 的原始研究团队。这几张牌凑一起,别人很难打。

OpenAI:支线任务做太多了。

用游戏来类比:Sam 选了开放世界 RPG,跑去做支线——跟 Jony Ive 做硬件、做浏览器、做广告、做图片、做视频。

回来发现 boss 已经升级了。

核心战场是企业生产力。这条线上 Anthropic 一路狂奔,OpenAI 反而在追赶。据说 Sam 在 offsite 跟团队说要砍掉一切聚焦。但能不能做到,是另一回事。

Anthropic:专注的力量。

几乎只做企业和 Agent 方向——替代白领生产力。从十亿量级到百亿量级 ARR 只用了一年多,增速比 OpenAI 快。因为只赌一个方向。

企业已经在为 AI 工具付每人每月几百块了,而且这个数字还在涨。用了就回不去了。

Meta:有点停滞。

Llama 4 出来都好几个月了,之后呢?没什么记得住的。好的工程师拿着 VC 的钱走了。

但 Meta 有几十亿用户。分发能力能买时间。

半人马窗口

所有人都在争论 AI 会不会取代人。

真正的问题是:你有没有在窗口关上之前,学会指挥它。

短期的颠覆被高估了。78% 的企业只是"试了试" AI。95% 没产生任何 ROI。叙事跑在现实前面。我在《龙虾热》里写过这个模式——中国每隔三四年就来一轮,恐慌比技术跑得快。公司根据"潜力"而不是"表现"裁员,55% 事后后悔。

但长期的颠覆被灾难性地低估了。入门级岗位的招聘在收缩,成本曲线从不停歇。我在《阿马拉悖论》《AI 时代的达尔文陷阱》里反复说这件事:短期过热、长期致命。

半人马阶段——人加 AI 比纯 AI 强——现在是开着的。但在关上。窗口大概两到三年。

这期间会出现一种新物种:超级个体。一个人加一支 Agent 团队,等于一家公司。美国 36% 的新创公司是 solo founder。当造东西不再是瓶颈,什么是瓶颈?品味。知道该解决哪个问题,知道什么算"好"。品味是最后的护城河。详见《未来属于会指挥 AI 的人》

99.99% 的人还不知道 AI 能做什么。潜在需求是巨大的,差的不是技术,是认知。我在《AI 的最后一公里》里写过:最后一公里不是技术问题,是教育问题。

拼图之后

说了这么多技术、芯片、大厂。我越想越觉得,真正的瓶颈不是技术。

是分发。

我两个月做了六个产品,深有体会:造东西从来没这么快过。但让人用起来?那还是人的事。

技术在加速,但人性没变。最后赢的不是造得最好的,是卖得最好的。

现在的局面是这样:算力在被补贴,半人马窗口是开着的,成本曲线站在你这边。想造东西的话,没有比现在更好的时候了。

这些想法散在各处想了一年多。拼起来发现有些更清楚了,有些反而更迷糊了——比如 AI 陪伴到底该走 App 路线还是硬件路线,比如大众市场什么时候才真正准备好。

你如果想到了,来聊。


© Xingfan Xia 2024 - 2026 · CC BY-NC 4.0