Mio 的账到底算不算得过来
AI 伴侣单位经济模型的商业概念插画
从烧钱说起
造 OpenClaw 原型的时候,两周账单直接离谱——早期版本的日成本高得离谱,一个用户两周就烧掉一笔不小的钱。那个数字逼着我从第一天就把成本当架构问题来解,不是"以后再优化"。
八个版本之后,Mio 的真实生产数据讲了一个完全不同的故事。
真实数据
线上生产环境跑了一天(77 次调用,~28 条聊天消息),成本按类别拆开:
| 类别 | 成本占比 |
|---|---|
| 聊天(LLM) | ~59% —— 绝对大头 |
| 人格提取 | ~21% —— 单次贵但调用少 |
| 记忆摘要 | ~10% —— 中等成本,调用少 |
| 语音合成(TTS) | ~3% —— 单次很便宜 |
| 记忆提取 | ~3% —— 单次很便宜 |
| 主动消息 | ~2% —— 几乎可以忽略 |
| 记忆重排序 | ~2% —— 单次可忽略不计 |
| 向量嵌入 | <1% —— 约等于免费 |
一个活跃用户一天的总成本:极低。聊天占了近六成,其次是人格提取和记忆任务,剩下的——语音、嵌入、重排序——都是零头。
跑了 1000+ 次交互之后,平均下来每条消息成本几乎可以忽略。成本降低了两个数量级——但对低价层级来说还不够低。
钱花在哪了
成本分两块看:
每日固定开销(占比不大):
- 人格提取:最大头的固定成本(3 次调用/天,用 Gemini 3.1 Pro)
- 记忆摘要:中等成本(2 次调用/天)
- 记忆提取/嵌入:可忽略
- 主动消息:可忽略,按需触发
每条消息成本(几乎可以忽略):
- 聊天(LLM):占绝大部分(每次 8K-17K 输入 tokens)
- 记忆重排序:可忽略
- 30 条/天:月度账单不大
- 100 条/天:变动成本开始超过固定成本
- 200-300 条/天:变动成本是固定开销的好几倍
媒体成本(按需叠加):
- 语音合成:几乎可以忽略
- 图片理解:几乎可以忽略
- 视频理解:稍贵一点
- 自拍生成:几乎可忽略
提示压缩干了什么
上面的数字是压缩前的。v0.1.4 把系统提示压缩了 ~60%(9K-13K → 3K-5K tokens)。系统提示是每次聊天输入 tokens 的最大头,压缩直接砍掉了每条消息成本的大头。
压缩后保守估计:
- 每条消息成本降了 ~35%
- 每日固定开销降了 ~25%
净效果:每个使用量级上月度成本都明显下降。越是高使用量的层级,效果越明显——因为变动成本占比更大。
每个层级到底赚不赚钱
每个付费层级都有每日消息上限来控制最坏情况下的成本。这里算的是上限打满的极端情况。
压缩前(当前):
| 层级 | 消息上限 | 满载毛利 |
|---|---|---|
| 免费 | 20/天 | 获客漏斗(成本中心) |
| 入门 | 30/天 | 亏钱 —— 满载时入不敷出 |
| 进阶 | 100/天 | 勉强打平 |
| 高级 | 200/天 | 小赚 |
| 旗舰 | 300/天 | 小赚 |
压缩后(v0.1.4+):
| 层级 | 消息上限 | 满载毛利 |
|---|---|---|
| 免费 | 20/天 | 获客漏斗(成本中心) |
| 入门 | 30/天 | 转正 —— 稳妥盈利 |
| 进阶 | 100/天 | 毛利可观 |
| 高级 | 200/天 | 毛利很健康 |
| 旗舰 | 300/天 | 毛利很健康 |
说实话:压缩前的成本下,只有高层级在满载时能盈利。压缩后,全部付费层级都转正了,高层级利润率改善明显。
一个重要背景:"满载"意味着用户每天把消息额度用完。实际使用一般是上限的 40-60%,真实利润率比最坏情况好得多。
为什么利润率逐级递增? 低层级用户为真正吃成本的功能付费(LLM 聊天、语音识别、图像理解)。
高层级用户为几乎不产生额外成本的功能付高价——自拍生成成本可忽略、优先响应零成本、NSFW 解锁零成本、扩展记忆成本可忽略。
说白了就是:高层级卖的是体验溢价,不是成本溢价。
为什么只会越来越好
三股力量同时在推成本往下走:
1. 提示工程会复合累积。 v0.1.4 的压缩砍掉了 60% 的系统提示 tokens。未来的 lorebook 架构(按需注入背景故事而非全量加载)还能再降 30-40%。每次优化都乘以所有用户的所有消息。
2. 模型成本在断崖式下降。 LLM 推理成本过去两年降了两个数量级。今天的每条消息成本,一年内可能再降 3-5 倍——Gemini 持续降价,便宜模型的能力也在快速提升。
3. 架构级优化会倍增。 Mio 的智能路由已经把 90% 的对话发给了 Gemini 3 Flash,只在人格提取和记忆摘要时用 Gemini 3.1 Pro。随着便宜模型能力提升,更多操作可以降级——每次切换在所有用户身上倍增。
这三股力量加在一起意味着:压缩后的利润率是地板,不是天花板。6 到 12 个月内,提示优化 + 模型降价 + 架构改进的组合应该能把所有层级推到 50-70%+ 毛利。
对比
| 指标 | 早期原型 | Mio(压缩前) | Mio(压缩后) | Mio(12 个月预测) |
|---|---|---|---|---|
| 每用户每天成本 | 天文数字 | 降了两个数量级 | 再降一大截 | 只剩零头 |
| 每条消息成本 | 高得离谱 | 几乎可以忽略 | 再降 ~35% | 再降 3-5 倍 |
| 入门层级能盈利? | 不能 | 仅高层级 | 能(稳妥盈利) | 能(毛利很高) |
| 记忆管理 | 无(只加不减) | 多层检索引擎 | + 压缩提示 | + 自优化 |
| 情感细腻度 | 基于规则 | 灵魂驱动 | + 关系进化 | + 微调模型 |
从天文数字降到了可以忽略的水平——压缩之后还在继续降。方向很清楚。
这是 Mio 宣言的技术附录。关于愿景和产品故事,请从宣言开始。