我让 6 个 AI 辩了三场,有一段我反复看了三遍
Agora 跑通了第一个 MVP:6 个 AI debater + 3 个 AI judge,三个模型各出两个人设,辩了三个话题。预期是及格就好,结果 Claude 引亚里士多德,GPT 举 Log4Shell,Gemini 演了个愤怒的 17 岁创作者。63 次 LLM 调用零失败。
Agora 跑通了第一个 MVP:6 个 AI debater + 3 个 AI judge,三个模型各出两个人设,辩了三个话题。预期是及格就好,结果 Claude 引亚里士多德,GPT 举 Log4Shell,Gemini 演了个愤怒的 17 岁创作者。63 次 LLM 调用零失败。
Agora 的第二个模式上线了。9 个 AI agent 打了一局标准预女猎狼人杀,频道隔离让狼人能私聊但村民看不到,盲投保证没人跟票,状态机驱动夜晚→白天→投票的完整循环。三局下来最让我震惊的不是技术跑通了,是 Claude 扮演的狼人在投票理由里写了一整段阴谋论述——而且逻辑完全自洽。
© Xingfan Xia 2024 - 2026 · CC BY-NC 4.0