5 个 Agent 开了场核保辩论会
V2 核保系统是一条线性流水线——提取一次,评估一次,报告一次。没有 agent 能质疑别人的结论。V3 用 5 个自治 agent 替换了它:反思输出质量、用工具验证论断、意见分歧时结构化辩论。63 个测试,每个 SME 只花几毛钱,一个 observe-think-act-reflect 循环驱动一切。
V2 核保系统是一条线性流水线——提取一次,评估一次,报告一次。没有 agent 能质疑别人的结论。V3 用 5 个自治 agent 替换了它:反思输出质量、用工具验证论断、意见分歧时结构化辩论。63 个测试,每个 SME 只花几毛钱,一个 observe-think-act-reflect 循环驱动一切。
The V2 underwriting system was a linear pipeline — extract once, evaluate once, report once. No agent could question another's conclusions. V3 replaces it with 5 autonomous agents: they reflect on output quality, verify claims with tools, and hold structured debates when they disagree. 63 tests, pennies per SME evaluation, one observe-think-act-reflect loop driving it all.
© Xingfan Xia 2024 - 2026 · CC BY-NC 4.0