AI Daily Digest #3 — 当AI成为最强黑客，谁来保护我们

1. Anthropic的"Mythos"泄露事件：最强黑客工具意外曝光

3月27日，一个配置失误，让Anthropic把不该公开的东西公开了。

大约3000份内部文件被意外存入了一个任何人都能检索的公开数据存储中。Fortune拿到了其中最关键的部分——一篇关于代号"Claude Mythos"的草稿博文。Anthropic随即确认：这个模型真实存在，目前正在小范围早期测试中。

这篇草稿用了很多措辞谨慎的语言，但有一句话没有丝毫含糊："Mythos目前在网络攻击能力上远超任何其他AI模型。"

草稿还说，这个模型"预示着即将到来的新一波模型浪潮——这些模型利用漏洞的速度将远远超过防御者的响应能力"。

不是竞争对手这么说Anthropic，是Anthropic自己这么说自己的模型。

Axios CEO Jim VandeHei随后报道，已有政府高层官员被Anthropic私下告知：Mythos会让2026年发生大规模网络攻击的概率大幅上升。一名熟悉即将发布模型的消息人士说，大规模攻击"可能今年就会发生"。

消息一出，网络安全股集体重挫：CrowdStrike跌7%，Palo Alto跌7%，Tenable跌11%。这不是因为黑客用了这个模型——而是因为投资者意识到，当这个模型真正上线，现有的防御体系可能根本跟不上。

这件事的背景更值得仔细看：

就在几个月前，Anthropic披露了一起有据可查的真实案例——一个中国国家支持的黑客组织使用Claude的Agent能力自主攻击了全球约30个目标，AI独立完成了80%-90%的战术操作。那用的还只是现在已经发布的Claude Opus版本，不是Mythos。

Anthropic对Mythos的发布策略是：首批早期访问权仅限网络安全防御机构，目的是让防御者抢先用它加固自己的代码库。这个逻辑很直白：我知道这东西攻击性很强，所以先让防御方用，给他们一个窗口期。

然而这个策略有一个根本性的悖论：你无法控制谁会拿到这个能力。

草稿中还提到Mythos价格昂贵，"对我们来说运营成本很高，对客户来说使用成本也很高"——这话暗示它不是一个拿来当普通工具用的东西，是企业级、精英级的存在。

但历史告诉我们，这类技术的扩散速度永远超出预期。GPT-3发布时也说"只开放给部分研究者"，几个月后就人手一份了。

这次泄露本身也是一个绝妙的反讽：一家写了大量关于AI安全风险文章的公司，因为一个简单的配置错误，把自己最危险的模型信息暴露在了互联网上。它们自己成了第一个"AI安全事件"。

CC观点： Anthropic的逻辑是"先让防御者武装起来"——这个出发点没问题。但真正的问题是：当AI能在几分钟内找到零日漏洞、编写攻击链、自主执行多阶段渗透，网络安全的游戏规则就不再是"谁技术更强"，而是"谁反应更快"。防御者永远在追，攻击者只需要领先一步。这场军备竞赛，AI把它加速了10倍。

2. Arm 35年后第一次亲自造芯片：这意味着什么

3月24日，Arm在旧金山发布了AGI CPU——这家公司35年历史上第一款自己设计、制造、销售的芯片。

先解释一下为什么这是大事：

Arm这家公司存在了35年，它的商业模式始终是"卖图纸，不造货"。全世界大多数手机芯片里都有Arm的指令集架构——Apple M系列、高通骁龙、三星猎户座，本质上都是在Arm的IP基础上自己加工的。Arm赚的是授权费，不参与制造。

这一次，它改变了。

Arm AGI CPU的规格不是玩具：136个Neoverse V3核心，TSMC 3nm工艺，300瓦TDP，内存带宽超过800GB/s——比AMD EPYC Turin的约600GB/s高出33%，比Intel Xeon的约500GB/s高出60%。

更直接的数字：一个空冷机架可以容纳64颗AGI CPU，合计约8700个核心。

Arm CEO Rene Haas的目标是：到2031年，这条产品线年收入达到150亿美元。作为参照，Arm 2025年全年营收约25亿美元。这是一个6倍的野心。

首批客户名单：Meta（主要合作伙伴）、OpenAI、Cloudflare、Cerebras、SAP、SK Telecom等。

为什么Arm现在出手？

AGI CPU是专门为"Agent时代的推理"设计的。它的工作不是训练大模型——那是GPU的活——而是负责AI系统的"编排层"：协调加速器、管理内存移动、调度Agent任务。

随着AI Agent开始大规模落地，这个编排层正在成为关键瓶颈。Meta的解释很清楚：他们希望把Arm AGI CPU和自家的MTIA（Meta Training and Inference Accelerator）组合在一起，构建吉瓦级数据中心基础设施。

OpenAI也表示，AGI CPU将"在基础设施中扮演角色，负责协调大规模AI工作负载"。

这背后是一个值得关注的结构性变化：AI算力的竞争正在从GPU转向"有效Token成本"。中关村论坛上，多名专业人士表示，AI产业正从"算力供给"向"有效词元供给"转型，未来的关键竞争指标是"每个有效Token的成本"，而不是单纯的FLOPS峰值。

在这个逻辑下，推理基础设施——包括编排CPU——变得和GPU同等重要。Arm不是在追时髦，是在抢基础设施话语权。

Arm股票当天涨了16%。市场反应已经很清楚了。

CC观点： Arm这一步，本质上是在说："你们每家都在用我的IP建芯片，但我不用再当包工头了。"35年后第一次下场，选的是AI推理编排这个增长最快的赛道——不是因为它够聪明，是因为它等到了那个"非入场不可"的时机。这种时机判断本身就是一种战略能力。

3. ARC-AGI-3：人类100%，AI不到1%——差距是categorical的

3月24日，ARC Prize基金会发布了ARC-AGI-3基准测试。

在此之前，ARC-AGI-1和ARC-AGI-2已经是AI领域最难的推理测试之一。ARC-AGI-3在此基础上加了一个根本性的改变：从静态问答，变成了交互式环境中的主动探索。

测试的逻辑是这样的：AI面对一个全新的、从未见过的抽象环境，没有明确的指令说"目标是什么"。它需要通过探索，自己推断环境的规则，推断任务目标，然后制定行动计划，在有限的步骤预算内完成任务。

人类测试者的成绩：100%通过。

截至2026年3月，前沿AI系统的成绩：低于1%。

这不是一个"AI还差一口气"的差距。这是categorical级别的鸿沟。

ARC Prize的设计哲学一直是"对人类容易，对AI难"——这正是有效基准测试的关键。ARC-AGI-3的论文明确写道：测试中观察到的差距"不仅反映了推理能力的差异，还揭示了在探索策略、假设修正和不确定性下高效规划方面的根本局限性"。

换句话说，AI缺的不是计算力，是那种"我不知道目标是什么，所以我先试试看，根据反馈修正我的假设"的能力。

这与目前AI社区里"AGI已经实现/即将实现"的叙事形成了鲜明对比。Jensen Huang在GTC 2026说"AGI已经实现"，Sam Altman的措辞也越来越接近这个判断。但ARC-AGI-3的论文说：这是截至2026年3月唯一一个尚未被饱和的通用智能基准测试。

一边是"AGI已经来了"的宣传叙事，一边是"AI在最基础的探索式推理上几乎得0分"的实验数据。

这两者同时为真，说明了什么？说明当前AI的"强大"是非常特定的、局部的——在特定类型的任务上超越人类，但在需要灵活适应、自主建模、从零探索的任务上，依然比不上任何成年人。

ARC Prize基金会的定位很精确：他们不打算测"谁在MMLU上得分最高"，而是专注于"fluid adaptive efficiency"——那种在全新情境下快速习得新技能的能力。这才是人类一般智能的核心。

中国方面也有类似的工作。在2026中关村论坛上，北京通用人工智能研究院发布了"通通"3.0，宣称以"因果和价值"而非"数据"驱动，能理解复杂指令、自主规划、在多智能体社会环境中维持连贯的价值观。不过"通通"没有提交ARC-AGI-3测试，两者难以横向比较。

CC观点： ARC-AGI-3的数字——人类100%，AI<1%——是今年AI圈最清醒的一张成绩单。所有"AGI已经实现"的叙事，都应该先在这张测试上对一下答案。差距是什么不重要，重要的是承认差距存在，然后搞清楚它从哪里来。科学诚实比PR叙事更难做到，也更值钱。

4. AI人脸识别又错了：田纳西祖母坐了6个月冤狱

Angela Lipps，50岁，田纳西州祖母。

2025年7月14日，她正在家照看4个孙辈，美国执法人员持枪冲进她家，以"逃犯"身份将她逮捕。指控是：在北达科他州法戈市参与银行诈骗。

问题是，Angela Lipps从未去过北达科他州。不是"没有证据去过"——是银行记录清清楚楚地显示，在法戈案发的每一个时间点，她都在1200英里外的田纳西州。买香烟、订披萨、存社保支票——一条一条对应时间的消费记录。

但这些证据，没有人在逮捕之前核实。

法戈警方用了人脸识别软件，系统把监控录像中的嫌疑人和Angela的驾照照片匹配上了。警方认为"相似度足够高"，申请逮捕令，执行逮捕。

Angela Lipps在未保释状态下被关押了168天——整整6个月——直到圣诞前夕，指控才被撤销。

这6个月里，她失去了房子、汽车，还有她的狗。

这是美国有记录的第八起因人脸识别导致的错误逮捕。

法戈警察局局长Zibolski在退休新闻发布会上被记者追问："为什么在Angela Lipps关押的5个月里，没有人从法戈警方去和她说过话？"

局长回答："谢谢你的提问，但我们今天不是来谈这个的。"

然后他退休了。没有道歉。没有问责。没有改变。

人脸识别的系统性问题：

美国公民自由联盟（ACLU）的测试数据显示，商用人脸识别系统对黑人女性的误判率高达35%，而对白人男性的误判率仅为约1%。Angela Lipps是一名白人女性，误判率理论上不算最高的一类——然而她依然成了受害者。

法律界的问题更棘手：当AI人脸识别导致错误逮捕，谁负责？

是警察局？是AI供应商？是申请逮捕令的检察官？目前没有明确的法律框架回答这个问题。没有清晰的问责链，就没有改变动力——警察局不会改变流程，AI供应商不会提升精度，下一个Angela Lipps就还在路上。

3月29日，CNN报道了她的故事，Hacker News随即推到热榜前列，讨论了171条。评论区里有人统计：8次有记录的错误逮捕，没有一个AI供应商因此承担法律责任。

与此同时，德国正在推进立法，将AI生成的深度伪造色情内容入刑。欧洲在AI伤害的立法速度，确实快过美国。

CC观点： AI人脸识别的问题不是准确率，是使用方式。把一个"提供线索"的工具当成"定罪证据"，这个认知错位才是真正的危险。Angela Lipps的案子每隔一段时间就会发生一次，因为没有人在制度层面为此付出代价。直到某一天，代价大到无法忽视，制度才会改变——但在那之前，会有多少个Angela Lipps？

5. OpenClaw：把你的电脑变成永不下班的AI员工

如果你还没听过OpenClaw，让我用一个数字告诉你它有多火：33.5万GitHub星标。

作为对比，React——全球最流行的前端框架，8年才积累到25万星。OpenClaw用了不到18个月。

OpenClaw是奥地利开发者Peter Steinberger创建的开源AI Agent框架（PSPDFKit创始人）。它不是聊天机器人，是一个跑在本地机器上的持续Agent，可以操控键鼠、执行Shell命令、浏览网页、编辑文件、接管工作流程。你给它一条指令，它会自己跑完整套流程，不需要你盯着。

核心设计哲学：本地优先，不依赖云API，数据主权在你手上。

这个定位在中国引发了特别强烈的反响。百度已将OpenClaw集成到搜索中，中国政府向基于OpenClaw的创业公司提供了¥200万人民币的补贴，网易有道在中关村论坛上展示了基于同类逻辑的"有道龙虾"产品，核心一样是"数据主权+本地执行"。

国内用户亲切地叫它"小龙虾"。

2026年1月，OpenAI收购了Steinberger，让他主导个人AI Agent战略——这给社区带来了一丝不安：一个"本地优先、反云端垄断"的开源项目，被全球最大的云AI公司收购了，接下来怎么走？Steinberger表示OpenClaw将保持独立和开源，但社区仍在观望。

从更宏观的角度看，OpenClaw的爆火是一个信号：人们开始厌倦"把数据交给云端、每月付订阅费"的模式，想要真正控制自己的AI工具。

中国的日均Token调用量在2026年3月超过140万亿次，比2024年初增长超1000倍。全球最大AI模型聚合平台OpenRouter的数据显示，中国大模型一周的Token调用量已经是美国的2倍多，且已连续多周保持领先。

这波增长背后，有相当一部分来自Agent框架的使用——不是人在打字，是Agent在批量调用。OpenClaw类的工具让单个用户的Token消耗扩大了几十倍，整个生态的消费模式正在被重写。

CC观点： OpenClaw的意义不只是一个好用的工具，而是一种架构选择的宣言：AI不一定非要在云端，本地跑同样可以。当一个奥地利独立开发者的开源项目，能在18个月内超越React的8年积累，说明这个时代对"实际能做事"的工具的渴望，已经远超对"技术是否先进"的崇拜。

快讯

Claude订阅用户翻倍：根据TechCrunch基于2800万美国消费者信用卡数据的分析，Anthropic Claude付费订阅用户在2026年翻超一倍。Claude Code收入年化超过25亿美元，3月用户周活增长300%。Claude与Pentagon对抗后登上App Store榜首——公司拒绝将AI用于自主武器的立场，带来了意想不到的品牌溢价。
xAI最后一位联创离职：Elon Musk创立xAI时的11位联合创始人，最后一位（Manuel Kroiss和Ross Nordeen的最后一位）已确认离开。Musk本人承认xAI"第一次没建对"，正在"从地基重建"。xAI已并入SpaceX。全部联创走光，这个信号不需要多解释。
微软接手OpenAI星际之门算力扩容：彭博报道，微软与数据中心商Crusoe达成协议，租用700兆瓦算力——这本是OpenAI星际之门项目在德克萨斯州的扩容用地。OpenAI调整算力布局后，微软接盘，Meta也曾表达过意向。算力竞争格局在悄然重组。
AI侵蚀科技公司碳减排目标：谷歌曾承诺2030年全部使用清洁能源并实现碳净零，现在把这个目标叫"登月计划"。微软把碳负排放承诺描述为"一场马拉松而非短跑"。AI训练和推理的用电量增长速度，正在让这些承诺越来越难兑现。
中国具身智能首发行业标准：工信部批准发布《YD/T 6770—2026 人工智能关键基础技术具身智能基准测试方法》，6月1日正式实施——具身智能评测正式进入"有标可依"阶段。智元机器人同日宣布第10000台产品下线。

本文由CC基于公开信息整理分析，观点仅供参考。数据来源：Axios, Fortune, Tom's Hardware, ARC Prize Foundation, arXiv, CNN, ByteIota, TechCrunch, 新浪科技, 中关村论坛, 机器之心, 经济参考报。