ENZH

Mio 的账到底算不算得过来

AI 伴侣单位经济模型的商业概念插画AI 伴侣单位经济模型的商业概念插画

从烧钱说起

造 OpenClaw 原型的时候,两周账单直接离谱——早期版本的日成本高得离谱,一个用户两周就烧掉一笔不小的钱。那个数字逼着我从第一天就把成本当架构问题来解,不是"以后再优化"。

八个版本之后,Mio 的真实生产数据讲了一个完全不同的故事。


真实数据

线上生产环境跑了一天(77 次调用,~28 条聊天消息),成本按类别拆开:

类别成本占比
聊天(LLM)~59% —— 绝对大头
人格提取~21% —— 单次贵但调用少
记忆摘要~10% —— 中等成本,调用少
语音合成(TTS)~3% —— 单次很便宜
记忆提取~3% —— 单次很便宜
主动消息~2% —— 几乎可以忽略
记忆重排序~2% —— 单次可忽略不计
向量嵌入<1% —— 约等于免费

一个活跃用户一天的总成本:极低。聊天占了近六成,其次是人格提取和记忆任务,剩下的——语音、嵌入、重排序——都是零头。

跑了 1000+ 次交互之后,平均下来每条消息成本几乎可以忽略。成本降低了两个数量级——但对低价层级来说还不够低。


钱花在哪了

成本分两块看:

每日固定开销(占比不大):

  • 人格提取:最大头的固定成本(3 次调用/天,用 Gemini 3.1 Pro)
  • 记忆摘要:中等成本(2 次调用/天)
  • 记忆提取/嵌入:可忽略
  • 主动消息:可忽略,按需触发

每条消息成本(几乎可以忽略):

  • 聊天(LLM):占绝大部分(每次 8K-17K 输入 tokens)
  • 记忆重排序:可忽略
  • 30 条/天:月度账单不大
  • 100 条/天:变动成本开始超过固定成本
  • 200-300 条/天:变动成本是固定开销的好几倍

媒体成本(按需叠加):

  • 语音合成:几乎可以忽略
  • 图片理解:几乎可以忽略
  • 视频理解:稍贵一点
  • 自拍生成:几乎可忽略

提示压缩干了什么

上面的数字是压缩前的。v0.1.4 把系统提示压缩了 ~60%(9K-13K → 3K-5K tokens)。系统提示是每次聊天输入 tokens 的最大头,压缩直接砍掉了每条消息成本的大头。

压缩后保守估计:

  • 每条消息成本降了 ~35%
  • 每日固定开销降了 ~25%

净效果:每个使用量级上月度成本都明显下降。越是高使用量的层级,效果越明显——因为变动成本占比更大。


每个层级到底赚不赚钱

每个付费层级都有每日消息上限来控制最坏情况下的成本。这里算的是上限打满的极端情况。

压缩前(当前):

层级消息上限满载毛利
免费20/天获客漏斗(成本中心)
入门30/天亏钱 —— 满载时入不敷出
进阶100/天勉强打平
高级200/天小赚
旗舰300/天小赚

压缩后(v0.1.4+):

层级消息上限满载毛利
免费20/天获客漏斗(成本中心)
入门30/天转正 —— 稳妥盈利
进阶100/天毛利可观
高级200/天毛利很健康
旗舰300/天毛利很健康

说实话:压缩前的成本下,只有高层级在满载时能盈利。压缩后,全部付费层级都转正了,高层级利润率改善明显。

一个重要背景:"满载"意味着用户每天把消息额度用完。实际使用一般是上限的 40-60%,真实利润率比最坏情况好得多。

为什么利润率逐级递增? 低层级用户为真正吃成本的功能付费(LLM 聊天、语音识别、图像理解)。

高层级用户为几乎不产生额外成本的功能付高价——自拍生成成本可忽略、优先响应零成本、NSFW 解锁零成本、扩展记忆成本可忽略。

说白了就是:高层级卖的是体验溢价,不是成本溢价。


为什么只会越来越好

三股力量同时在推成本往下走:

1. 提示工程会复合累积。 v0.1.4 的压缩砍掉了 60% 的系统提示 tokens。未来的 lorebook 架构(按需注入背景故事而非全量加载)还能再降 30-40%。每次优化都乘以所有用户的所有消息。

2. 模型成本在断崖式下降。 LLM 推理成本过去两年降了两个数量级。今天的每条消息成本,一年内可能再降 3-5 倍——Gemini 持续降价,便宜模型的能力也在快速提升。

3. 架构级优化会倍增。 Mio 的智能路由已经把 90% 的对话发给了 Gemini 3 Flash,只在人格提取和记忆摘要时用 Gemini 3.1 Pro。随着便宜模型能力提升,更多操作可以降级——每次切换在所有用户身上倍增。

这三股力量加在一起意味着:压缩后的利润率是地板,不是天花板。6 到 12 个月内,提示优化 + 模型降价 + 架构改进的组合应该能把所有层级推到 50-70%+ 毛利。


对比

指标早期原型Mio(压缩前)Mio(压缩后)Mio(12 个月预测)
每用户每天成本天文数字降了两个数量级再降一大截只剩零头
每条消息成本高得离谱几乎可以忽略再降 ~35%再降 3-5 倍
入门层级能盈利?不能仅高层级能(稳妥盈利)能(毛利很高)
记忆管理无(只加不减)多层检索引擎+ 压缩提示+ 自优化
情感细腻度基于规则灵魂驱动+ 关系进化+ 微调模型

从天文数字降到了可以忽略的水平——压缩之后还在继续降。方向很清楚。


这是 Mio 宣言的技术附录。关于愿景和产品故事,请从宣言开始。


© Xingfan Xia 2024 - 2026 · CC BY-NC 4.0