5 个 Agent 开了场核保辩论会
V2 核保系统是一条线性流水线——提取一次,评估一次,报告一次。没有 agent 能质疑别人的结论。V3 用 5 个自治 agent 替换了它:反思输出质量、用工具验证论断、意见分歧时结构化辩论。63 个测试,每个 SME 只花几毛钱,一个 observe-think-act-reflect 循环驱动一切。
1 parts · Feb 28, 2026 – Feb 28, 2026
V2 核保系统是一条线性流水线——提取一次,评估一次,报告一次。没有 agent 能质疑别人的结论。V3 用 5 个自治 agent 替换了它:反思输出质量、用工具验证论断、意见分歧时结构化辩论。63 个测试,每个 SME 只花几毛钱,一个 observe-think-act-reflect 循环驱动一切。
© Xingfan Xia 2024 - 2026 · CC BY-NC 4.0