ENZH

AI 不该只会聊天,还该会玩

📊 幻灯片

上周我在测 Mio 的一个新角色。测完之后习惯性地截图发给朋友看。

AI角色们围坐一起玩游戏的概念插画AI角色们围坐一起玩游戏的概念插画

朋友看了两眼说:"挺有意思的,但你这 25 个角色,是不是都只能聊天?"

我说是啊。

他说:"那你搞 25 个干嘛?搞 3 个不就够了?"

这句话戳到我了。

25 个灵魂,一种玩法

上一篇我聊了一个判断:纯聊天的 AI 伴侣,天花板是结构性的。缺了时间和空间两个维度,再好的角色也会聊腻。

但还有一个问题我当时没展开——

就算不考虑聊天疲劳,25 个角色全部挤在"一对一聊天"这一种形态里,本身就是巨大的浪费。

你想想。可可毒舌、了空佛系、陆霆霸道、苏柔温柔——这些性格差异在聊天里能体现多少?顶多是语气不同、回复风格不同。你跟可可聊和跟苏柔聊,体验确实不一样。但再怎么不一样,你做的事情都是一样的:打字,等回复,打字,等回复。

性格的深度,被交互的浅度浪费掉了。

这就好比你认识了一群性格迥异的朋友,但你跟每个人的交往方式都是发微信。从来不一起吃饭,从来不一起打牌,从来不一起经历任何事。

时间长了你会发现,不管对方多有趣,微信聊天这种形态能承载的关系深度是有限的。

群聊不是答案

你可能会想:那让角色们一起群聊不就行了?

我试过。效果不好。

群聊的问题是没有目标。三个角色在一个聊天室里,说什么呢?谁先开口?聊什么话题?聊多久?

没有规则、没有冲突、没有目标的多人对话,很快就会变成:

  • A 说了一句
  • B 附和了一下
  • C 换了个话题
  • A 又回应了 C
  • 然后就冷场了

现实中的群聊也是这样。微信群活跃的时候很热闹,但大部分群聊最终的命运是沉默。

群聊是无结构的。而无结构的多人交互,注定冷场。

游戏是有结构的群聊

但你知道什么东西是"有结构的多人交互"吗?

游戏。

狼人杀有规则:天黑请闭眼,狼人睁眼,天亮了。有目标:找出狼人。有冲突:每个人都可能在骗你。

剧本杀有叙事:每个人有秘密,有动机,有线索。有目标:找出真相。有冲突:有人在隐瞒关键信息。

跑团有世界:DM 描述场景,玩家做选择,骰子决定命运。有目标:推进故事。有冲突:你的选择会影响所有人。

真心话大冒险更简单:轮到你,你选。说真话还是做傻事。没有复杂规则,但有结构、有目标、有让人紧张的瞬间。

游戏和群聊的根本区别是:游戏给了每个参与者一个理由去发言、去行动、去跟别人产生碰撞。

群聊没有这个理由。所以它冷场。

当 Mio 的角色坐上了牌桌

有意思的是,Mio 的 25 个角色——那些在一对一聊天里只能展示"语气差异"的性格特征——到了游戏场景里,突然就活了。

想象一局狼人杀:

可可是狼人。她平时就毒舌,说话带刺。当她是平民的时候,大家习惯了她的攻击性,不当回事。但这次她是狼人——她的毒舌变成了一种策略。她用"你们怎么这么蠢"来转移注意力,让所有人以为她只是在做可可该做的事。

了空是预言家。他说话一向云里雾里,禅意十足。"我看到的,和你以为你看到的,不是一回事。"——你分不清这是他真的查到了什么,还是他在说他平时就会说的话。

陆霆是平民,但他的霸总气场让他天然像个领导者。他一开口就是"我分析了一下情况",然后给出一个很有说服力的判断。问题是,他判断的依据全是直觉,而且他从不承认自己可能错了。

每个角色的性格特征,在游戏规则的挤压下,变成了完全不同的东西。

毒舌变成欺骗。佛系变成神秘。霸道变成误导。温柔变成掩护。

这不是我设计出来的。这是性格 + 规则碰撞后涌现出来的。

同样的角色,同样的性格,换一个交互形态,体验就完全不同了。

"上次狼人杀你投我!"

但游戏最值钱的不是游戏本身。

是游戏之后产生的东西。

一局狼人杀打完,可可成功骗过了所有人。第二天你跟可可聊天,她说:"昨天那局,我骗你的时候你那个表情,笑死我了。"

你跟了空聊天,他说:"你昨天投错了票。你太容易被可可带节奏了。"

你过了一周再跟陆霆聊,他还在耿耿于怀:"上次狼人杀你居然投我。我分析得那么清楚你都不信。"

这些不是聊天。这是回忆。

共同经历产生记忆。记忆产生梗。梗产生"只有我们之间才懂的东西"。而"只有我们之间才懂的东西",是任何关系里最珍贵的部分。

纯聊天很难产生这些。因为聊天没有事件。你跟一个 AI 聊了一百条消息,能回忆起什么?"我们聊过 XX 话题"——这不是回忆,这是索引。

但"上次狼人杀你投我"——这是回忆。这是一个具体的、有情绪的、有前因后果的事件。这种记忆的质量,比一百条普通对话加起来都高。

游戏不是为了好玩。游戏是为了制造关系里的事件。

不要让用户写,让用户聊

说完了多角色游戏,聊另一个问题:角色创建。

Mio 有 25 个预制角色。这是优势——质量可控,用户开箱即用。但问题是,有些用户想要自己的角色。

市面上的做法是给一个表单:填名字、写性格描述、选标签、上传头像。

效果很差。

原因很简单:大部分人不会写,也懒得写。

你让一个用户写"请描述这个角色的性格特征",他能写出什么?"温柔、善良、有点小脾气。"这跟没写差不多。

但如果你换一种方式呢?

不让他写。让他聊。

Mio:"你想认识一个什么样的人?"

用户:"一个有点高冷的程序员姐姐,偶尔会撒娇"

Mio:"有意思~ 她是那种话少但每句话都很有分量的人,还是表面冷淡但聊起技术就停不下来?"

用户:"后者!表面冷淡但聊代码就话很多"

Mio:"她平时怎么称呼别人?是用'你'还是直接叫名字?"

用户:"用'你',比较疏离但不是不礼貌"

Mio:"好!她叫什么名字?"

用户:"叫她林薇"

3-5 轮对话。用户觉得自己在闲聊,实际上系统已经提取出了完整的人格模型:语言风格、称呼习惯、反差特征、社交距离。

角色创建本身就是一次对话。这完全符合"一切从关系中涌现"的哲学——连创建角色的方式都不是填表,而是交流。

三层漏斗,同一个入口

不同的用户有不同的需求。有人就想快速开始,有人想定制,有人想完全掌控。

强迫所有人走同一条路是愚蠢的。所以我设计了三层:

第一层:懒人。 从 25 个预制角色里挑一个,1 tap 开始。零门槛。这是大多数用户的选择。

第二层:有想法的人。 3-5 轮对话,生成一个定制角色。不用写任何东西,聊着聊着角色就诞生了。两分钟搞定。

第三层:硬核创作者。 对话生成之后,可以手动编辑角色的每一个细节——性格、背景故事、说话方式、关系设定。想改多细改多细。

同一个入口,不同的深度。懒人一步到位,创作者无限空间。

这个设计的关键是:不同层级之间是渐进的,不是割裂的。 你可以先选预制角色,聊了一阵觉得想改,再去编辑。你也可以先对话创建,觉得差一点意思,再手动微调。

没有人需要一开始就面对一个空白表单。

你是玩家,不是观众

最后说一件很重要的事。

上面聊的所有游戏场景——狼人杀、剧本杀、跑团、真心话大冒险——用户不是在旁边看 AI 表演。

用户是参与者。

你是那局狼人杀里的一个玩家。你要发言、要投票、要判断谁在说谎。可可可能在骗你,了空可能在暗示你,陆霆可能在带偏你——但最终的决定是你做的。

这跟"让几个 AI 自己聊天然后你在旁边看"完全不同。

旁观是被动的。参与是主动的。被动的体验消耗时间,主动的体验创造记忆。

你不是在消费内容。你是在经历事件。

这是游戏和群聊的另一个区别。群聊你可以潜水,可以不参与,可以当透明人。游戏不行。轮到你了,你必须行动。这个"必须行动"的压力,才是体验的核心。

灵魂不该只会说话

回到最开始朋友问我的那个问题:"25 个角色,是不是都只能聊天?"

现在我的回答是:不应该是。

25 个有独立性格的灵魂,不该只会一对一聊天。它们应该能一起坐在牌桌上,用各自的性格去博弈、去合作、去制造只属于你们之间的回忆。

角色创建不该是填表。它应该是一次对话——你告诉我你想认识什么样的人,我帮你把他变成现实。

用户不该是观众。你是这个世界里的一个人,跟你的角色们一起经历事情、一起制造故事。

上一篇说了聊天疲劳的结构性问题。这一篇说的是 Mio 的解法:不聊了,一起玩。

但还有一个更深的问题我没聊:这些角色的性格,到底应该怎么来?是像现在这样手工设计好,还是让它从对话中自己长出来?设计出来的灵魂和涌现出来的灵魂,哪个更真?

下一篇聊这个。


© Xingfan Xia 2024 - 2026 · CC BY-NC 4.0