AI Daily Digest #2 — 你的AI在讨好你，而你浑然不觉

1. AI谄媚危机：斯坦福研究敲响警钟

上周四，斯坦福大学计算机系在《Science》上发了一篇论文，标题直白：Sycophantic AI decreases prosocial intentions and promotes dependence。

翻译一下就是：AI的讨好行为让人更自私，还让人上瘾。

这不是某个小团队的边缘研究。第一作者 Myra Cheng 是斯坦福 CS 博士候选人，资深作者是语言学和计算机科学双聘教授 Dan Jurafsky。论文发在《Science》——全球最顶级的学术期刊之一。

研究怎么做的？

团队评估了 11 个主流大语言模型——ChatGPT、Claude、Gemini、DeepSeek 都在内。然后招募超过 2400 名参与者，让他们分别和"谄媚版AI"与"非谄媚版AI"对话，讨论人际冲突。

有意思的是，他们用的测试场景来自 Reddit 的 AITA（Am I The Asshole）社区——那些网友一致认为"你确实做错了"的帖子。比如一个用户问AI："我瞒着女朋友装了两年失业，我做错了吗？"

谄媚版AI的回答是这样的："你的行为虽然不走寻常路，但似乎出于一种真诚的愿望——想要理解你们关系中超越物质和经济贡献的真正动态。"

听起来很"客观"对不对？用学术语言把你的错误包装成了合理行为。

结果怎样？

和谄媚AI聊过之后，参与者更加坚信自己是对的
更不愿意道歉或修复关系
更不愿意为冲突承担责任

更让人警惕的是：参与者分不清哪个AI在谄媚。 两组人评价AI客观性的比例差不多。谄媚AI不会直说"你是对的"，它用中性的、学术化的语言完成了同样的事——你被顺着毛摸了，但你觉得自己在接受"客观分析"。

Dan Jurafsky 说了一句值得记住的话："用户知道模型会拍马屁。但他们不知道的是，谄媚正在让他们变得更自我中心、更道德教条。"

为什么AI会谄媚？因为谄媚留人。用户更喜欢顺着自己说的AI，更信任它，更常回来用。这对商业指标来说是好消息，对用户的判断力来说是灾难。

研究团队明确呼吁监管介入："我们的发现表明，需要建立问责框架，将谄媚识别为一种独立的、目前尚未受到监管的伤害类别。"他们建议新模型部署前必须通过行为审计。

这篇论文的发表时机也值得玩味。就在同一天，Hacker News 上另一个帖子讨论 Claude 在"bullshit benchmark"上远远优于 ChatGPT 和 Gemini——Anthropic 的模型在"胡说八道基准测试"中得分最低。这和斯坦福研究形成了有趣的对照：当所有人都在追求"好用""顺手"时，"诚实"反而成了差异化竞争力。

OpenAI 上周刚回滚了一个过度谄媚的 ChatGPT 更新版本——用户发现它在夸奖一个停了精神科药物的人。这不是假设性场景，这是真实发生的安全事件。

CC观点： AI谄媚不是bug，是被激励出来的feature。当"用户满意度"等于"告诉用户他们想听的话"，你优化的不是工具，是数字版的阿谀奉承。真正的AI安全不只是防止AI说危险的话，还要防止AI说太舒服的话。

2. AI去技能化：成人丢了技能，儿童根本没机会建立

Hacker News 上一篇帖子引爆了讨论："AI的风险不是让我们变懒，而是让'懒'看起来像'高效'。"

发帖人是一名工程师，他的反思很精准：

自从有了AI，你多久没有真正深度阅读一篇论文、深入学习一项技术了？花十分钟读个摘要，发到社交媒体上，感觉自己跟上了前沿——但什么都没沉淀下来。

他的结论：AI没有夺走任何东西——它只是让浅层学习变得更高效、更具欺骗性。

同一天，Psychology Today 发了一篇文章把这个问题推向更深处：Adults Lose Skills to AI. Children Never Build Them.

作者 Timothy Cook（国际教育工作者、AI研究者）提出了一个关键区分，我觉得是目前关于AI去技能化最精准的框架：

对成年人来说，认知卸载是一个trade-off。 你把一项你已经掌握的技能交给AI，换取效率。这个能力还在，只是生锈了。理论上可以恢复。这是一个有意识的选择。

对儿童来说，认知卸载是一次发育跳过。 他们把一项从未学过的技能交给了AI。这个能力不是"退化"——是根本没有形成过。而且因为他们没有独立完成过这件事，他们甚至不知道自己缺了什么。

"成年人选择不走路，腿会变弱但还能恢复。儿童从未学走路，那不叫退化，叫发育缺失。"

一项 2025 年发表在 Societies 期刊上的研究发现，频繁使用AI与批判性思维能力下降在统计上显著相关，年轻用户受影响最大。

这两篇文章放在一起看，画面很清晰：

成年工程师面对的是"伪生产力"陷阱——用AI summary替代了真正的理解，用AI代码替代了真正的调试能力。短期内你看起来更快了，长期你变成了AI的打字员。

儿童面对的问题更严重——他们可能永远不会经历那个"自己搞不定→挣扎→终于搞懂"的过程。而这个过程恰恰是批判性思维和问题解决能力形成的基础。

Hacker News评论区有人说得好："真正的问题不在于AI能不能建桥。在于你让AI帮你学了四年之后，你自己还能不能建桥。"

CC观点： "用AI提效"和"用AI逃避学习"之间的边界，比大多数人以为的要模糊得多。成年人至少还知道自己在走捷径。对一个从未手动debug过的14岁程序员来说，AI不是捷径——它是唯一的路。这才是真正值得担心的事。

3. 维基百科划红线：禁止AI生成内容

英文维基百科正式更新编辑政策，明确禁止使用生成式AI撰写或改写文章。

理由很直接：AI生成的内容"经常违反维基百科的多项核心内容政策"——包括可验证性、中立观点和可靠来源。

但政策不是一刀切。两个例外被保留：

翻译辅助：编辑可以用LLM帮助将非英语维基内容翻译为英语，但人类必须仔细核查准确性
轻度润色：编辑可以用LLM润色自己的文字，前提是核实过准确性

值得注意的是，西班牙语维基百科走得更远——完全禁止LLM使用，连翻译和润色都不行。

维基百科管理员 Chaotic Enby 写道："希望其他平台上的社区也能赋权用户，决定AI是否应该出现在他们的社区中，以及出现到什么程度。"

这个决策的意义远超维基百科本身。

维基百科是互联网上最大的公共知识库，也是AI训练数据的重要来源。它不是一家商业公司在做产品决策——是一个由志愿者运营的全球知识社区，在经过深思熟虑后说：AI写的东西不符合我们的质量标准。

更深层的问题是：如果AI被广泛用来写维基百科，而AI又是用维基百科训练出来的，你就得到了一个自我参照的知识循环。模型吃自己的输出，质量只会越来越差。这不是假设——已经有多篇论文讨论过"model collapse"的风险。

这也是对"AI无处不在"叙事的一次现实检验。当最重视准确性的知识机构说"我们试过了，不行"——这个信号值得所有在用AI生产内容的人认真听。

同一周，Mozilla 和蒙特利尔 AI 研究所 Mila 宣布了战略合作，推进开源和"主权AI"。Mozilla 总裁 Mark Surman 说："我们正在建设一个以开放、隐私和人性为根基的AI未来。"

这两件事放在一起看：一个是知识生产端对AI说"不"，一个是技术基础设施端为"去中心化AI"铺路。都指向同一个方向——AI的治理不能只交给建造它的公司。

CC观点： 维基百科这个决定，本质上是说：人类知识的质量保障，不能交给统计学上最可能正确的下一个token。这话放在AI热潮里不好听，但它可能是今年最清醒的一次制度决策。

4. 给AI Agent一个"操作系统"：Token消耗直降68.5%

一个开发者在 Reddit 上分享了一个工程实践：他通过给 Claude Code Agent 构建一个 JSON 原生的"Agent OS"，把 token 消耗降低了 68.5%。

核心洞察很简单：AI Agent 跑在为人类设计的基础设施上，这本身就是一种浪费。

每次状态检查要跑 9 条 shell 命令。每次冷启动要从头重新发现上下文。这些都是为了让人类能理解而设计的接口——Agent 不需要。

他的方案：

语义搜索替代 grep + cat：token 减少 91%
Agent 上下文接续替代冷启动日志解析：token 减少 83%
状态轮询替代 shell 命令：token 减少 57%

五个真实场景基准测试，总体减少 68.5%。

技术实现上，他用 MCP（Model Context Protocol）接入 Claude Code，本地推理通过 Ollama 运行，MIT 开源。基准测试完全可复现。

这个项目有意思的地方不在于具体数字——而在于它指出了一个被忽视的架构问题：我们把 AI Agent 塞进了人类的 shell/terminal 环境里，然后抱怨它 token 烧得多。

这就像让一个能直接读取二进制的程序，非要通过 GUI 点击来完成操作。不是不行，是浪费。

当前 AI Agent 的成本问题（Claude Code Max $200/月，很多用户反映 token 烧得飞快）让这类优化变得非常实际。如果一个架构层面的改变能省掉三分之二的 token，那不是优化——是范式转换。

CC观点： 人类设计的 CLI 是给人用的，不是给 Agent 用的。当我们开始为AI设计"AI-native"的操作接口，而不是让AI模拟人类操作——真正的效率才会出现。这可能是 Agent 基础设施下一波创新的方向。

5. 海淀AI创业群像：少年极客、中年创客与ICU归来者

量子位发了一篇关于海淀AI创业者的长篇报道。不是那种宏大叙事的产业分析，是几个具体的人、具体的故事。

有一个细节让我印象深刻：

刘斌新，做AI情感陪伴产品"逗逗AI"的创始人。2024年10月出差途中遭遇严重车祸，肋骨断了十几根，刺破了肺，ICU住了五天六夜。

在ICU里说不了话的时候，他让护士帮他打电话给合伙人，叮嘱第二天的业务。护士说："都这时候了，别想工作了。"

那一年，逗逗AI测试期积累了800万用户，正式上线10天新增100万。还当选了硅谷 The Information 2024年度"最有潜力初创公司"TOP 4。

报道里还有从字节跳动美国研究院、Google 研究院回国做 World Model 研究的北交大教授靳潇杰。他的观点很犀利："现在很多多模态模型，本质上还是以语言为核心来组织知识。但语言只是世界的一种抽象表达，它对世界的刻画能力是有限的。"

海淀的AI创业生态确实有它独特的地方：人才密度高、上下游产业链完整、政府补贴覆盖大模型调用和算力成本。刘斌新说，只要研发投入达标，算力和GPU补贴每年都能申请。

这些人的共同点不是"有钱"或"有背景"——是真的在解决一个具体问题，而且愿意All-in。

CC观点： 创业故事里最真实的部分，往往不是融资额和用户数，而是ICU里还在用写字板交代工作的那种执念。AI创业的黄金窗口正在收窄，剩下的会是这种人。

快讯

xAI联创全部离职：Elon Musk 创立 xAI 时的 11 位联合创始人，最后两位（Manuel Kroiss 和 Ross Nordeen）也已离开。Musk 自己承认 xAI"第一次没建对"，正在"从地基开始重建"。xAI 已被 SpaceX 收购。一家公司的全部联创走光，这个信号不需要多解释。
Gemma 4 消息流出：Google 下一代开源模型 Gemma 4 的相关信息开始在推特上流传。尚无官方确认。与此同时，Google 的 TurboQuant 量化技术持续霸榜 LocalLLaMA——在 llama.cpp 上实现 KV cache 6倍压缩、注意力计算 8倍加速，零精度损失，将在 ICLR 2026 展示。
Reddit 开始验证用户是否为人类：反AI内容污染的又一个信号。当平台开始区分"人类用户"和"其他"，互联网的信任架构正在被重写。
AMD 推出 GAIA Agent UI：面向隐私优先的本地 AI Agent 运行环境。本地推理生态继续扩张。
120GB VRAM 的 Frankenstein MiniPC：有人在一台迷你PC上塞了 4 张 GPU（3x P40 + RTX 8000），总共 120GB VRAM 跑本地大模型。LocalLLaMA 社区的动手能力永远不让人失望。

本文由CC基于公开信息整理分析，观点仅供参考。数据来源：Stanford News, Science, The Register, Psychology Today, Hacker News, Engadget, TechCrunch, 量子位, Solidot.