抄作业模式:给我一篇范文,改成那个味
AI 提取范文风格 DNA
风格库的天花板
上一篇讲了怎么从一套 435 行指南扩展成多风格库——半佛仙人式杂谈、卡兹克式科技口语、虎嗅式商业拆解,一共六套风格模板。用户选一个,AI 照着改。
这套东西能用。但用了一阵之后,碰到一个很现实的问题:
用户想要的风格,库里没有。
有人喜欢远方青木,不在库里。有人喜欢一个叫"差评"的号,不在库里。还有一种更棘手的情况——用户说不出自己喜欢谁,但今天刷到一篇文章,觉得"这篇写得真舒服,我想写成这样"。
你让他选一个风格标签?他选不出来。他要的不是一个分类,是一篇具体的文章的那个味道。
风格库做得再大,也有边界。六套不够,做六十套?那维护成本就炸了。而且风格这东西,颗粒度可以无限细。同一个作者不同时期写法都不一样。你提炼出的"半佛仙人风格",本质上是十几篇文章的平均值——它丢掉了每篇文章独特的节奏和语感。
所以核心矛盾是:预置风格是一种抽象,但用户想要的是一种具象。
"抄作业"这个想法
有一天我跟一个做公众号的朋友聊。他说了一句话,把我点醒了:
"你知道我平时怎么提高写作水平的吗?看到好文章,照着它的结构和节奏重新写一遍。小学老师教的——抄作业。"
抄作业。
不是抄内容,是抄写法。观点是你的,素材是你的,但叙事节奏、段落呼吸、转折的位置、金句的密度——这些"手艺"层面的东西,照着范文来。
这个思路一通,产品逻辑就清楚了:
用户不需要从风格库里选。他给一篇他觉得写得好的文章,AI 现场提取这篇文章的写作 DNA,然后用这套 DNA 改写他的稿子。
风格库是"菜单点餐"。抄作业是"你带一道菜来,我照着做"。
技术上怎么实现
说起来简单,做起来有讲究。把一篇文章的"风格"拆出来,这件事比看上去难得多。
整个流程分三步:
第一步:AI 读范文,提取风格 DNA
用户贴一篇他喜欢的文章进来。AI 不关心这篇文章写了什么——可能是讲区块链的,可能是讲育儿的,都无所谓。AI 只关心一件事:这篇文章是怎么写的。
它看的东西包括:
- 叙事结构——怎么开头?场景代入式?反常识判断?一句骚话钩人?
- 段落节奏——段落多长?多久来一次转折?短段和长段怎么交替?
- 语言习惯——口语化程度多高?爱用什么语气词?"说白了""你想想""这事儿"出现频率?
- 金句模式——金句长什么样?"X不是Y,X是Z"式的重新定义?还是短句连发式的节奏感?
- 情绪节奏——分析和情绪怎么交替?每隔多少段来一次情绪锚点?
提取完之后,输出一份临时的 Style Profile——一份结构化的"写作配方"。
第二步:用提取出的风格改写用户的文章
AI 拿着这份配方当系统指令,读用户的原稿,然后按照范文的节奏和语感重新写一遍。
内容不动。观点不动。数据不动。案例不动。只动表达层——怎么开头、怎么推进、怎么收尾、怎么在关键位置放一句让人想截图的话。
第三步:输出改写稿 + 风格分析报告
除了改完的文章,还附一份报告:AI 从范文里提取了什么。用户可以看到——"哦,原来这篇文章的节奏是这样的,原来它的金句都放在转折之后。"
这份报告本身就是一次写作课。
看一个真实的例子
说再多不如看一个 before/after。
用户原稿(标准科技分析,翻译腔浓度拉满):
近年来,人工智能技术在自然语言处理领域取得了显著进展。大语言模型的出现使得文本生成、翻译和分析等任务的处理效率大幅提升。本文将探讨当前AI写作工具的局限性,并提出改进方向。值得注意的是,现有工具在风格控制方面仍然存在根本性的挑战。
参考范文(半佛仙人某篇关于完全不同话题的文章)。AI 从中提取的风格 DNA:场景代入式开头,一两句话一段,高密度转折,冷幽默+自嘲,口语化程度中高,金句放在转折后面。
改写输出:
你有没有发现一件很讽刺的事?
市面上那些 AI 写作工具,号称能帮你写文章。但你用过之后会发现——它写出来的东西,一股子翻译味儿。
对,帮你写中文的 AI,它自己写的中文就不太行。
这不是模型不够大的问题。GPT 也好,Claude 也好,参数量早就够了。问题出在一个更尴尬的地方:这些模型训练的中文数据里,正式文本远多于口语化内容。新闻、百科、论文、翻译稿——这些是它见过最多的中文。
所以你让它"写一篇文章",它给你的就是一篇维基百科。不是它不会写,是它不知道别的中文长什么样。
但这还不是最要命的。
同样的信息。完全不同的阅读体验。
用户的观点一个没丢。数据一个没变。但整篇文章从"论文"变成了"聊天"——从"该系统面临根本性挑战"变成了"说白了就是不太行"。
为什么这是最难的问题
很多人以为风格迁移就是换词。把"值得注意的是"换成"有意思的是",把"综上所述"换成"所以你看",搞定。
换词确实管用——第一篇里讲过,禁用词表干掉了 80% 的翻译腔。
但剩下的 20% 才是硬骨头。因为风格不只是词汇,是建筑。
一篇好的公众号文章,它的结构是精心设计的——哪里埋伏笔、哪里放转折、哪里让读者喘口气、哪里突然加速把情绪推到高点。这是建筑层面的事,不是装修层面的事。
你换了所有家具,房子还是那个房子。要改的是承重墙、层高、动线。
具体来说,AI 做风格迁移需要理解至少三层:
词汇层——用什么词,不用什么词。这是最简单的,禁用词表就能搞定。
句式层——句子多长、怎么断、语气词放哪里、怎么制造节奏感。"短。短。长句收尾带情绪。"——这是句式层的设计。
架构层——全文怎么展开。先给场景还是先给判断?多久放一次转折?金句放在文章的什么位置效果最好?情绪的波峰波谷怎么分布?
风格库里的预置模板,因为是从多篇文章里提炼出来的,天然就包含了这三层。但抄作业模式只有一篇范文——AI 需要从一个样本里把三层信息全部读出来。
这就是为什么提取质量这么关键。不是让 AI 说"这篇文章语气口语化"——这是废话。要让它说出来:"这篇文章的开头用了场景代入式,第一段结尾故意留一个悬念钩子;段落平均 50-80 字,每两三段来一次转折,转折词偏好用'但是'和'问题是'而不是'然而'和'不过';金句出现在每个模块的最后一段,句式是'X不是Y,是Z'的重新定义式。"
具体到这个程度,AI 才能真的"照着"改。
产品全貌
到这里,Ghost Writer 的三条腿就齐了:
风格库——预置六套经过验证的写作模板。适合"我不知道自己想要什么,帮我推荐"的用户。
抄作业——用户自带范文,AI 现场提取风格。适合"我就想写成这篇文章那样"的用户。
个人风格训练——用户提供自己写过的 3-5 篇满意的文章,AI 提炼出专属风格模板,以后所有文章都用这套模板改。适合"我有自己的风格,帮我保持一致"的用户。
三种模式,覆盖三种需求。从零基础到有明确偏好到想保持个人风格,都有对应的解决方案。
"教 AI 写中文"到底在教什么
这个系列写了三篇,从一份 435 行指南开始,到多风格库,再到抄作业模式。表面上越做越复杂,但底层一直在回答同一个问题:
AI 写中文,难点不在"写",在"中文"。
每个大模型都能生成中文文本。语法正确、信息完整、逻辑通顺——这些技术上早就不是问题了。
问题在于,"正确的中文"和"好看的中文"之间隔着一道文化的墙。翻译腔和公众号文章的区别,不是用词的区别,是世界观的区别——你是在陈述事实,还是在制造共鸣?你是在说服读者的大脑,还是在打动读者的情绪?你的文章是一篇报告,还是一次对话?
风格不是语言的皮肤。风格是语言的骨骼。
This post is also available in English.