Mio 的账到底算不算得过来

AI 伴侣单位经济模型的商业概念插画 AI 伴侣单位经济模型的商业概念插画

从烧钱说起

造 OpenClaw 原型时，两周账单直接离谱——早期版本日成本高得离谱，一个用户两周就烧掉一笔不小的钱。那个数字逼着从第一天就把成本当架构问题来解，不是"以后再优化"。

八个版本后，Mio 真实生产数据讲了一个完全不同故事。

线上生产环境跑了一天（77 次调用，~28 条聊天消息），成本按类别拆开：

活跃用户一天总成本：极低。聊天占近六成，其次人格提取和记忆任务，剩下的——语音、嵌入、重排序——都是零头。

跑了 1000+ 次交互后，平均每条消息成本几乎可忽略。成本降低了两个数量级——对低价层级来说还不够低。

成本分两块看：

每日固定开销（占比不大）：

每条消息成本（几乎可忽略）：

媒体成本（按需叠加）：

上面数字是压缩前的。v0.1.4 把系统提示压缩 ~60%（9K-13K → 3K-5K tokens）。系统提示是每次聊天输入 tokens 最大头，压缩直接砍掉每条消息成本大头。

压缩后保守估计：

净效果：每个使用量级月度成本都明显下降。越高使用量层级，效果越明显——变动成本占比更大。

每个付费层级都有每日消息上限控制最坏情况成本。这里算上限打满的极端情况。

压缩前（当前）：

压缩后（v0.1.4+）：

说实话：压缩前成本下，只有高层级满载能盈利。压缩后，全部付费层级转正，高层级利润率改善明显。

重要背景："满载"意味着用户每天把消息额度用完。实际使用一般是上限 40-60%，真实利润率比最坏情况好得多。

为什么利润率逐级递增？ 低层级用户为真正吃成本的功能付费（LLM 聊天、语音识别、图像理解）。

高层级用户为几乎不产生额外成本的功能付高价——自拍生成成本可忽略、优先响应零成本、NSFW 解锁零成本、扩展记忆成本可忽略。

高层级卖的是体验溢价，不是成本溢价。

三股力量同时在推成本往下走：

1. 提示工程会复合累积。 v0.1.4 压缩砍掉 60% 系统提示 tokens。未来 lorebook 架构（按需注入背景故事而非全量加载）还能再降 30-40%。每次优化乘以所有用户所有消息。

2. 模型成本断崖式下降。 LLM 推理成本过去两年降了两个数量级。今天每条消息成本，一年内可能再降 3-5 倍——Gemini 持续降价，便宜模型能力也在快速提升。

3. 架构级优化会倍增。 Mio 智能路由已把 90% 对话发给 Gemini 3 Flash，只在人格提取和记忆摘要用 Gemini 3.1 Pro。随便宜模型能力提升，更多操作可以降级——每次切换在所有用户身上倍增。

三股力量加在一起：压缩后利润率是地板，不是天花板。6 到 12 个月内，提示优化 + 模型降价 + 架构改进组合应能把所有层级推到 50-70%+ 毛利。

指标	早期原型	Mio（压缩前）	Mio（压缩后）	Mio（12 个月预测）
每用户每天成本	天文数字	降两个数量级	再降一大截	只剩零头
每条消息成本	高得离谱	几乎可忽略	再降 ~35%	再降 3-5 倍
入门层级能盈利？	不能	仅高层级	能（稳妥盈利）	能（毛利很高）
记忆管理	无（只加不减）	多层检索引擎	+ 压缩提示	+ 自优化
情感细腻度	基于规则	灵魂驱动	+ 关系进化	+ 微调模型

从天文数字降到可忽略水平——压缩后还在继续降。方向很清楚。

这是 Mio 宣言的技术附录。关于愿景和产品故事，请从宣言开始。