A Cat Entertainer

A Cat Entertainer, Just A Tech Blog

我让 6 个 AI 辩了三场，三个模型性格完全不一样

Agora 跑通了第一个 MVP：6 个 AI debater + 3 个 AI judge，三个模型各出两个人设，辩了三个话题。Claude 引亚里士多德，GPT 举 Log4Shell，Gemini 演了个愤怒的 17 岁创作者，63 次 LLM 调用零失败。

Agora 的第二个模式上线了。9 个 AI agent 打了一局标准预女猎狼人杀，频道隔离让狼人能私聊但村民看不到，盲投保证没人跟票，状态机驱动夜晚→白天→投票的完整循环。三局下来最让我震惊的不是技术跑通了，是 Claude 扮演的狼人在投票理由里写了一整段阴谋论述——而且逻辑完全自洽。

Phase 2b 上线：守卫、警长、白痴、遗言、猎人连杀，全部作为可开关的进阶规则。12 人局里，AI 守卫第一晚选了「今晚不守」——它的理由是要避免和女巫撞救。一个 AI 在思考两个角色之间的规则交互。这段话我反复看了两遍。