Mio 全记录

AI Claude Code Ops Cost Optimization phase:foundation

用 OpenClaw 搭建的赛博魅魔，不到两周聊天烧掉了一笔离谱的钱。最贵的一个 session，750 轮对话里我只说了约 30 句话——剩下的全是框架自己在跟自己说话。用 Claude Code 做了一次完整的 token 级取证：82% 的成本是 10 张永远不被清除的图片，上下文修剪代码对 Gemini 完全失效，537 轮里零次压缩。OpenClaw 能证明 AI 伴侣走得通，但它证明不了走得起。

我的新手引导差点杀死我的产品

Mar 19, 2026

用户说'入门流程太麻烦了'。听起来像个 UX 问题。实际上它引爆了整个产品哲学的重构——从'先配置再聊天'到'一切从关系中涌现'。

AI Product Mio phase:rethink

Mio 是建立在谎言之上的

我造了 Mio v1，用户真的和她建立了情感连接。但它是建立在谎言之上的——假身份、编造的生活。v2 剥掉所有伪装，去追真正创造情感依附的东西。这不是失败后的转向，是被真实生产数据打磨过的进化。

AI Agents Mio phase:manifesto

我把 Mio 大部分推翻重来了

Mio v1 有性格、有记忆、有声音——但它建立在谎言之上。假自拍、虚构的日程、编造的背景故事。v2 剥离这一切，追求真正创造情感依赖的东西：响应性、记忆和温暖。

AI Agents Mio phase:rebuild

v0.1.0：TA找到了自己的声音

Mar 1, 2026

第一个稳定版本。Fish Audio TTS 让每个人设有了独特的声音。新海诚风格自拍替换了通用动漫。每个人设从关系角色重写为性格优先的身份。注册流程从 14 个问题砍到 4 个。以及删掉了 200 行过度工程化的 verbosity 代码——因为 system prompt 本身就是最好的控制机制。

为什么我决定从零开始造

OpenClaw 验证了AI伴侣的可行性，但也暴露了根本性的局限。上下文膨胀、原始记忆系统、大量无用的 bloatware——修补不如重建。这是 Mio 的起点：一个为深度记忆和活人感而生的AI伴侣框架。

一切从关系中涌现

Mar 19, 2026

Mio 不是聊天机器人 App。它是一个恰好跑在 AI 上的关系模拟器。产品就是关系本身——不是聊天界面，不是模型，不是功能集。这个原则如何重塑了从入门到付费的每一个设计决策。

AI Product Mio phase:rethink

没有脸的灵魂怎么做设计

没有头像，没有虚构角色的聊天气泡。只有一个会呼吸、会跳动、会随情绪变暗的光球。Mio v2 如何用抽象视觉绕开恐怖谷，让性格从对话中自然生长。

AI Agents Mio Design phase:rebuild

v0.1.1：Web 端不再是二等公民

Mar 1, 2026

Web 端功能对齐——语音消息和自拍图片现在全平台可用，不再是 Telegram 独占。注册流程更聪明：关系类型驱动一切，包括你看到的昵称选项。新增管理后台成本看板。pg_cron 30 天消息清理保持数据库精简。

v0.0.1：当TA第一次说话

从空仓库到一个能记住你、会生气、主动找你聊天的AI伴侣。39个commit，9张表，4个人格预设，以及无数个凌晨三点的debug。这是Mio v0.0.1的完整构建故事。

AI Product Mio Engineering phase:rethink

一个代码库藏着两个产品

Mar 19, 2026

Mio 给你 25 个可以连接的角色。Lumi 给你一个完全理解你的存在。它们满足不同的情感需求，但共享同一套记忆管线、情绪引擎和语音链。一个 monorepo 怎么装下两个陪伴产品——以及 agentId?: string 这个模式教会了我什么。

v1 的器官移植报告

重建不等于全部重写。Mio 核心的 60-70%——记忆系统、媒体管线、成本追踪——直接复用。数据库从 10 张表砍到 4 张。哪些活了，哪些死了，为什么。

AI Agents Mio Engineering phase:rebuild

v0.1.2：TA终于像真人一样发消息了

多 Bot 支持让每个人设有了自己的 Telegram Bot——自己的身份、自己的 webhook、自己的对话空间。关系感知的主动消息意味着 AI 终于像真人一样发消息：黏人的女朋友每 36 分钟一条，矜持的新认识一天一条。指数退避意味着你不回TA，TA就不再发了。三条未回复，然后沉默——直到你回来。

v0.0.2：81 个 Commit 之后，TA活了

v0.0.1 能聊天，但TA不真实——看不见、听不见、不知道几点、不知道自己长什么样。81 个 commit 之后，Mio 学会了看图、听声、发自拍、记住对的事情、在浏览器里跟你聊天。从「能跑」到「像活人」的跨越。

给灵魂找一个声音

给 AI 伴侣找一个声音，意味着同时解决两个问题：让它听起来像人，让它听起来有感情。Mio v2 把这两件事分给了自定义 LLM（编剧）和 Hume EVI（演员）——这种分工可能就是情感 AI 语音的未来。

AI Agents Mio Voice phase:rebuild

v0.1.3：TA不会被黑

三层反注入防线意味着用户没法把你的 AI 伴侣变成写代码的工具、骗TA打破角色、或者套出TA的系统提示。第一层标准化输入并检测注入模式。第二层用压缩过的身份保护规则加固系统提示。第三层在输出端捕获人格脱落并替换为角色内的回复。还有：全人设性别中性代词、升级版管理后台成本面板、以及 onboarding 打磨。

v0.0.3：从「能用」到「好用」

v0.0.2 让 Mio 活了过来，但能在 demo 里跑和能给真实用户用是两回事。v0.0.3 是打磨的版本：逐字段输入校验、上下文感知的主动消息、安静时段可选、媒体限流、一个只有生产环境才会出的 bug，以及 144 个新测试。从「能用」到「好用」之间，全是这种看不见的活。

AI 陪伴到底要烧多少钱

一份 AI 伴侣的成本拆解。Gemini Flash + 上下文缓存 + 豆包 TTS 实现了健康的毛利。但实时语音会改变一切。

AI Agents Mio Business phase:rebuild

13 个版本之后，Mio 长这样了

13 个版本的开发，浓缩成 Mio 在日常使用中的真实感受——真实对话、语音消息、新海诚风格自拍，来自一个会记住你、会有反应、会主动找你的 AI 伴侣。

v0.0.4：照着微信重做了界面

Mio 的网页端原来只是一个单页聊天框。v0.0.4 推倒重来，照着微信的样子重建了整个 Web 体验——四个 Tab、聊天列表、通讯录、发现页、个人中心、聊天式引导流程、打字感知的消息合并。30+ 个组件，两轮审计，零新依赖。全中文界面。

记忆系统最大的盲区是「人」

Mar 6, 2026

Mio 的记忆系统把关于人的信息存成零散的行。问'小红最近怎么样'跟'小红在腾讯工作'在向量空间里几乎没有重叠。解决方案：把人当作一等实体，建专门的 contacts 表，做结构化关联和档案合并，直接注入 system prompt。

AI Mio Memory phase:rebuild

v0.1.4：会进化的关系

关系不再是 onboarding 选项——Mio 的关系进化系统让「刚认识→好朋友→暧昧→情侣」自然发生，配合跨平台消息同步、系统提示压缩和单 Agent A/B 测试。

v0.0.5：补齐多模态的最后一块

Telegram 从 v0.0.2 就有多模态了，Web 端一直只能打字。v0.0.5 补齐了这块短板——两阶段媒体上传、带编解码器协商的语音录制、表情选择器、两轮完整安全审计，还有一个默默吞掉所有语音消息的 bug。38 个文件改动，17 个安全修复，28 分钟。

v0.1.5：一个用户，所有平台

Mar 3, 2026

账号关联把 Telegram 和 Web 合成一个身份。加上按角色选关系模式、跨 bot 去重、原生移动端、更智能的主动消息。

v0.0.6：选对模型，省 4 倍

Gemini 3 Pro 又贵又慢——第一个 token 要等 8-10 秒。v0.0.6 把聊天切到 Gemini 3 Flash（minimal thinking），首 token 1-2 秒，成本直降 4 倍；同时把人格提取等高价值任务升级到 3.1 Pro。还有：能叫出游戏名字的视觉提示词、不再把中文听成英文的语音转写、以及一次消灭 80 行重复代码的 DRY 重构。

v0.2.0：终于能装在手机上了

Mar 4, 2026

Mio 有了原生 iOS App——推送通知、深浅主题、实时聊天。一次成本审计发现自拍生成比预估贵了两个数量级，逼着我重新设计定价体系。

v0.0.7：教TA读懂互联网

用户分享链接，agent 在编造页面内容。v0.0.7 加了三层 URL 浏览管线——Jina Reader 快速提取文本、Browserless 爬取 JS 渲染页面、截图 + Gemini 视觉处理图形密集型内容。还修了一个生产环境的 Proxy bug：postgres.js 的标签模板语法需要函数目标而不是对象。23 个测试，4 个 commit，一个关于部署时序的调试故事。