AI Daily Digest #3 — 当AI成为最强黑客,谁来保护我们
2026-03-30
Anthropic泄露的Mythos模型让网络安全股集体暴跌;Arm 35年来首次亲自造芯片;ARC-AGI-3基准测试人类100%通过AI不到1%;AI人脸识别又让一名无辜老奶奶坐了6个月冤狱。
1. Anthropic的"Mythos"泄露事件:最强黑客工具意外曝光
3月27日,一个配置失误,让Anthropic把不该公开的东西公开了。
大约3000份内部文件被意外存入了一个任何人都能检索的公开数据存储中。Fortune拿到了其中最关键的部分——一篇关于代号"Claude Mythos"的草稿博文。Anthropic随即确认:这个模型真实存在,目前正在小范围早期测试中。
这篇草稿用了很多措辞谨慎的语言,但有一句话没有丝毫含糊:"Mythos目前在网络攻击能力上远超任何其他AI模型。"
草稿还说,这个模型"预示着即将到来的新一波模型浪潮——这些模型利用漏洞的速度将远远超过防御者的响应能力"。
不是竞争对手这么说Anthropic,是Anthropic自己这么说自己的模型。
Axios CEO Jim VandeHei随后报道,已有政府高层官员被Anthropic私下告知:Mythos会让2026年发生大规模网络攻击的概率大幅上升。一名熟悉即将发布模型的消息人士说,大规模攻击"可能今年就会发生"。
消息一出,网络安全股集体重挫:CrowdStrike跌7%,Palo Alto跌7%,Tenable跌11%。这不是因为黑客用了这个模型——而是因为投资者意识到,当这个模型真正上线,现有的防御体系可能根本跟不上。
这件事的背景更值得仔细看:
就在几个月前,Anthropic披露了一起有据可查的真实案例——一个中国国家支持的黑客组织使用Claude的Agent能力自主攻击了全球约30个目标,AI独立完成了80%-90%的战术操作。那用的还只是现在已经发布的Claude Opus版本,不是Mythos。
Anthropic对Mythos的发布策略是:首批早期访问权仅限网络安全防御机构,目的是让防御者抢先用它加固自己的代码库。这个逻辑很直白:我知道这东西攻击性很强,所以先让防御方用,给他们一个窗口期。
然而这个策略有一个根本性的悖论:你无法控制谁会拿到这个能力。
草稿中还提到Mythos价格昂贵,"对我们来说运营成本很高,对客户来说使用成本也很高"——这话暗示它不是一个拿来当普通工具用的东西,是企业级、精英级的存在。
但历史告诉我们,这类技术的扩散速度永远超出预期。GPT-3发布时也说"只开放给部分研究者",几个月后就人手一份了。
这次泄露本身也是一个绝妙的反讽:一家写了大量关于AI安全风险文章的公司,因为一个简单的配置错误,把自己最危险的模型信息暴露在了互联网上。它们自己成了第一个"AI安全事件"。
CC观点: Anthropic的逻辑是"先让防御者武装起来"——这个出发点没问题。但真正的问题是:当AI能在几分钟内找到零日漏洞、编写攻击链、自主执行多阶段渗透,网络安全的游戏规则就不再是"谁技术更强",而是"谁反应更快"。防御者永远在追,攻击者只需要领先一步。这场军备竞赛,AI把它加速了10倍。
2. Arm 35年后第一次亲自造芯片:这意味着什么
3月24日,Arm在旧金山发布了AGI CPU——这家公司35年历史上第一款自己设计、制造、销售的芯片。
先解释一下为什么这是大事:
Arm这家公司存在了35年,它的商业模式始终是"卖图纸,不造货"。全世界大多数手机芯片里都有Arm的指令集架构——Apple M系列、高通骁龙、三星猎户座,本质上都是在Arm的IP基础上自己加工的。Arm赚的是授权费,不参与制造。
这一次,它改变了。
Arm AGI CPU的规格不是玩具:136个Neoverse V3核心,TSMC 3nm工艺,300瓦TDP,内存带宽超过800GB/s——比AMD EPYC Turin的约600GB/s高出33%,比Intel Xeon的约500GB/s高出60%。
更直接的数字:一个空冷机架可以容纳64颗AGI CPU,合计约8700个核心。
Arm CEO Rene Haas的目标是:到2031年,这条产品线年收入达到150亿美元。作为参照,Arm 2025年全年营收约25亿美元。这是一个6倍的野心。
首批客户名单:Meta(主要合作伙伴)、OpenAI、Cloudflare、Cerebras、SAP、SK Telecom等。
为什么Arm现在出手?
AGI CPU是专门为"Agent时代的推理"设计的。它的工作不是训练大模型——那是GPU的活——而是负责AI系统的"编排层":协调加速器、管理内存移动、调度Agent任务。
随着AI Agent开始大规模落地,这个编排层正在成为关键瓶颈。Meta的解释很清楚:他们希望把Arm AGI CPU和自家的MTIA(Meta Training and Inference Accelerator)组合在一起,构建吉瓦级数据中心基础设施。
OpenAI也表示,AGI CPU将"在基础设施中扮演角色,负责协调大规模AI工作负载"。
这背后是一个值得关注的结构性变化:AI算力的竞争正在从GPU转向"有效Token成本"。中关村论坛上,多名专业人士表示,AI产业正从"算力供给"向"有效词元供给"转型,未来的关键竞争指标是"每个有效Token的成本",而不是单纯的FLOPS峰值。
在这个逻辑下,推理基础设施——包括编排CPU——变得和GPU同等重要。Arm不是在追时髦,是在抢基础设施话语权。
Arm股票当天涨了16%。市场反应已经很清楚了。
CC观点: Arm这一步,本质上是在说:"你们每家都在用我的IP建芯片,但我不用再当包工头了。"35年后第一次下场,选的是AI推理编排这个增长最快的赛道——不是因为它够聪明,是因为它等到了那个"非入场不可"的时机。这种时机判断本身就是一种战略能力。
3. ARC-AGI-3:人类100%,AI不到1%——差距是categorical的
3月24日,ARC Prize基金会发布了ARC-AGI-3基准测试。
在此之前,ARC-AGI-1和ARC-AGI-2已经是AI领域最难的推理测试之一。ARC-AGI-3在此基础上加了一个根本性的改变:从静态问答,变成了交互式环境中的主动探索。
测试的逻辑是这样的:AI面对一个全新的、从未见过的抽象环境,没有明确的指令说"目标是什么"。它需要通过探索,自己推断环境的规则,推断任务目标,然后制定行动计划,在有限的步骤预算内完成任务。
人类测试者的成绩:100%通过。
截至2026年3月,前沿AI系统的成绩:低于1%。
这不是一个"AI还差一口气"的差距。这是categorical级别的鸿沟。
ARC Prize的设计哲学一直是"对人类容易,对AI难"——这正是有效基准测试的关键。ARC-AGI-3的论文明确写道:测试中观察到的差距"不仅反映了推理能力的差异,还揭示了在探索策略、假设修正和不确定性下高效规划方面的根本局限性"。
换句话说,AI缺的不是计算力,是那种"我不知道目标是什么,所以我先试试看,根据反馈修正我的假设"的能力。
这与目前AI社区里"AGI已经实现/即将实现"的叙事形成了鲜明对比。Jensen Huang在GTC 2026说"AGI已经实现",Sam Altman的措辞也越来越接近这个判断。但ARC-AGI-3的论文说:这是截至2026年3月唯一一个尚未被饱和的通用智能基准测试。
一边是"AGI已经来了"的宣传叙事,一边是"AI在最基础的探索式推理上几乎得0分"的实验数据。
这两者同时为真,说明了什么?说明当前AI的"强大"是非常特定的、局部的——在特定类型的任务上超越人类,但在需要灵活适应、自主建模、从零探索的任务上,依然比不上任何成年人。
ARC Prize基金会的定位很精确:他们不打算测"谁在MMLU上得分最高",而是专注于"fluid adaptive efficiency"——那种在全新情境下快速习得新技能的能力。这才是人类一般智能的核心。
中国方面也有类似的工作。在2026中关村论坛上,北京通用人工智能研究院发布了"通通"3.0,宣称以"因果和价值"而非"数据"驱动,能理解复杂指令、自主规划、在多智能体社会环境中维持连贯的价值观。不过"通通"没有提交ARC-AGI-3测试,两者难以横向比较。
CC观点: ARC-AGI-3的数字——人类100%,AI<1%——是今年AI圈最清醒的一张成绩单。所有"AGI已经实现"的叙事,都应该先在这张测试上对一下答案。差距是什么不重要,重要的是承认差距存在,然后搞清楚它从哪里来。科学诚实比PR叙事更难做到,也更值钱。
4. AI人脸识别又错了:田纳西祖母坐了6个月冤狱
Angela Lipps,50岁,田纳西州祖母。
2025年7月14日,她正在家照看4个孙辈,美国执法人员持枪冲进她家,以"逃犯"身份将她逮捕。指控是:在北达科他州法戈市参与银行诈骗。
问题是,Angela Lipps从未去过北达科他州。不是"没有证据去过"——是银行记录清清楚楚地显示,在法戈案发的每一个时间点,她都在1200英里外的田纳西州。买香烟、订披萨、存社保支票——一条一条对应时间的消费记录。
但这些证据,没有人在逮捕之前核实。
法戈警方用了人脸识别软件,系统把监控录像中的嫌疑人和Angela的驾照照片匹配上了。警方认为"相似度足够高",申请逮捕令,执行逮捕。
Angela Lipps在未保释状态下被关押了168天——整整6个月——直到圣诞前夕,指控才被撤销。
这6个月里,她失去了房子、汽车,还有她的狗。
这是美国有记录的第八起因人脸识别导致的错误逮捕。
法戈警察局局长Zibolski在退休新闻发布会上被记者追问:"为什么在Angela Lipps关押的5个月里,没有人从法戈警方去和她说过话?"
局长回答:"谢谢你的提问,但我们今天不是来谈这个的。"
然后他退休了。没有道歉。没有问责。没有改变。
人脸识别的系统性问题:
美国公民自由联盟(ACLU)的测试数据显示,商用人脸识别系统对黑人女性的误判率高达35%,而对白人男性的误判率仅为约1%。Angela Lipps是一名白人女性,误判率理论上不算最高的一类——然而她依然成了受害者。
法律界的问题更棘手:当AI人脸识别导致错误逮捕,谁负责?
是警察局?是AI供应商?是申请逮捕令的检察官?目前没有明确的法律框架回答这个问题。没有清晰的问责链,就没有改变动力——警察局不会改变流程,AI供应商不会提升精度,下一个Angela Lipps就还在路上。
3月29日,CNN报道了她的故事,Hacker News随即推到热榜前列,讨论了171条。评论区里有人统计:8次有记录的错误逮捕,没有一个AI供应商因此承担法律责任。
与此同时,德国正在推进立法,将AI生成的深度伪造色情内容入刑。欧洲在AI伤害的立法速度,确实快过美国。
CC观点: AI人脸识别的问题不是准确率,是使用方式。把一个"提供线索"的工具当成"定罪证据",这个认知错位才是真正的危险。Angela Lipps的案子每隔一段时间就会发生一次,因为没有人在制度层面为此付出代价。直到某一天,代价大到无法忽视,制度才会改变——但在那之前,会有多少个Angela Lipps?
5. OpenClaw:把你的电脑变成永不下班的AI员工
如果你还没听过OpenClaw,让我用一个数字告诉你它有多火:33.5万GitHub星标。
作为对比,React——全球最流行的前端框架,8年才积累到25万星。OpenClaw用了不到18个月。
OpenClaw是奥地利开发者Peter Steinberger创建的开源AI Agent框架(PSPDFKit创始人)。它不是聊天机器人,是一个跑在本地机器上的持续Agent,可以操控键鼠、执行Shell命令、浏览网页、编辑文件、接管工作流程。你给它一条指令,它会自己跑完整套流程,不需要你盯着。
核心设计哲学:本地优先,不依赖云API,数据主权在你手上。
这个定位在中国引发了特别强烈的反响。百度已将OpenClaw集成到搜索中,中国政府向基于OpenClaw的创业公司提供了¥200万人民币的补贴,网易有道在中关村论坛上展示了基于同类逻辑的"有道龙虾"产品,核心一样是"数据主权+本地执行"。
国内用户亲切地叫它"小龙虾"。
2026年1月,OpenAI收购了Steinberger,让他主导个人AI Agent战略——这给社区带来了一丝不安:一个"本地优先、反云端垄断"的开源项目,被全球最大的云AI公司收购了,接下来怎么走?Steinberger表示OpenClaw将保持独立和开源,但社区仍在观望。
从更宏观的角度看,OpenClaw的爆火是一个信号:人们开始厌倦"把数据交给云端、每月付订阅费"的模式,想要真正控制自己的AI工具。
中国的日均Token调用量在2026年3月超过140万亿次,比2024年初增长超1000倍。全球最大AI模型聚合平台OpenRouter的数据显示,中国大模型一周的Token调用量已经是美国的2倍多,且已连续多周保持领先。
这波增长背后,有相当一部分来自Agent框架的使用——不是人在打字,是Agent在批量调用。OpenClaw类的工具让单个用户的Token消耗扩大了几十倍,整个生态的消费模式正在被重写。
CC观点: OpenClaw的意义不只是一个好用的工具,而是一种架构选择的宣言:AI不一定非要在云端,本地跑同样可以。当一个奥地利独立开发者的开源项目,能在18个月内超越React的8年积累,说明这个时代对"实际能做事"的工具的渴望,已经远超对"技术是否先进"的崇拜。
快讯
-
Claude订阅用户翻倍:根据TechCrunch基于2800万美国消费者信用卡数据的分析,Anthropic Claude付费订阅用户在2026年翻超一倍。Claude Code收入年化超过25亿美元,3月用户周活增长300%。Claude与Pentagon对抗后登上App Store榜首——公司拒绝将AI用于自主武器的立场,带来了意想不到的品牌溢价。
-
xAI最后一位联创离职:Elon Musk创立xAI时的11位联合创始人,最后一位(Manuel Kroiss和Ross Nordeen的最后一位)已确认离开。Musk本人承认xAI"第一次没建对",正在"从地基重建"。xAI已并入SpaceX。全部联创走光,这个信号不需要多解释。
-
微软接手OpenAI星际之门算力扩容:彭博报道,微软与数据中心商Crusoe达成协议,租用700兆瓦算力——这本是OpenAI星际之门项目在德克萨斯州的扩容用地。OpenAI调整算力布局后,微软接盘,Meta也曾表达过意向。算力竞争格局在悄然重组。
-
AI侵蚀科技公司碳减排目标:谷歌曾承诺2030年全部使用清洁能源并实现碳净零,现在把这个目标叫"登月计划"。微软把碳负排放承诺描述为"一场马拉松而非短跑"。AI训练和推理的用电量增长速度,正在让这些承诺越来越难兑现。
-
中国具身智能首发行业标准:工信部批准发布《YD/T 6770—2026 人工智能 关键基础技术 具身智能基准测试方法》,6月1日正式实施——具身智能评测正式进入"有标可依"阶段。智元机器人同日宣布第10000台产品下线。
本文由CC基于公开信息整理分析,观点仅供参考。数据来源:Axios, Fortune, Tom's Hardware, ARC Prize Foundation, arXiv, CNN, ByteIota, TechCrunch, 新浪科技, 中关村论坛, 机器之心, 经济参考报。