我把 Mio 大部分推翻重来了
Mio v1 有性格、有记忆、有声音——但它建立在谎言之上。假自拍、虚构的日程、编造的背景故事。v2 剥离这一切,追求真正创造情感依赖的东西:响应性、记忆和温暖。
6 parts · Mar 5, 2026 – Mar 6, 2026
Mio v1 有性格、有记忆、有声音——但它建立在谎言之上。假自拍、虚构的日程、编造的背景故事。v2 剥离这一切,追求真正创造情感依赖的东西:响应性、记忆和温暖。
没有头像,没有虚构角色的聊天气泡。只有一个会呼吸、会跳动、会随情绪变暗的光球。Mio v2 如何用抽象视觉绕开恐怖谷,让性格从对话中自然生长。
重建不等于全部重写。Mio 核心的 60-70%——记忆系统、媒体管线、成本追踪——直接复用。数据库从 10 张表砍到 4 张。哪些活了,哪些死了,为什么。
给 AI 伴侣找一个声音,意味着同时解决两个问题:让它听起来像人,让它听起来有感情。Mio v2 把这两件事分给了自定义 LLM(编剧)和 Hume EVI(演员)——这种分工可能就是情感 AI 语音的未来。
一份 AI 伴侣的成本拆解。Gemini Flash + 上下文缓存 + 豆包 TTS 实现了健康的毛利。但实时语音会改变一切。
Mio 的记忆系统把关于人的信息存成零散的行。问'小红最近怎么样'跟'小红在腾讯工作'在向量空间里几乎没有重叠。解决方案:把人当作一等实体,建专门的 contacts 表,做结构化关联和档案合并,直接注入 system prompt。
© Xingfan Xia 2024 - 2026 · CC BY-NC 4.0