抄作业模式：给我一篇范文，改成那个味

AI 提取范文风格 DNA AI 提取范文风格 DNA

上一篇讲了怎么从一套 435 行指南扩展成多风格库——半佛仙人式杂谈、卡兹克式科技口语、虎嗅式商业拆解，一共六套风格模板。用户选一个，AI 照着改。

这套东西能用。用了一阵，碰到一个很现实的问题。

用户想要的风格，库里没有。

有人喜欢远方青木，不在库里。有人喜欢一个叫"差评"的号，不在库里。还有一种更棘手的情况——用户说不出自己喜欢谁，今天刷到一篇文章，觉得"这篇写得真舒服，我想写成这样"。

让他选风格标签？选不出来。要的不是分类，是一篇具体的文章的那个味道。

风格库做得再大也有边界。六套不够，做六十套？维护成本炸了。风格这东西，颗粒度可以无限细。同一个作者不同时期写法都不同。提炼出的"半佛仙人风格"，本质是十几篇文章的平均值——丢掉了每篇独特的节奏和语感。

核心矛盾：预置风格是一种抽象，用户想要的是一种具象。

"抄作业"这个想法

有一天跟做公众号的朋友聊。他说了一句话点醒：

"你知道我平时怎么提高写作水平的吗？看到好文章，照着它的结构和节奏重新写一遍。小学老师教的——抄作业。"

抄作业。

不是抄内容，是抄写法。观点是你的，素材是你的，叙事节奏、段落呼吸、转折位置、金句密度——这些"手艺"层面，照着范文来。

思路一通，产品逻辑就清楚了：用户不需要从风格库里选。给一篇他觉得写得好的文章，AI 现场提取写作 DNA，用这套 DNA 改写稿子。

风格库是"菜单点餐"。抄作业是"你带一道菜来，我照着做"。

技术上怎么实现

说起来简单，做起来有讲究。把一篇文章的"风格"拆出来，比看上去难得多。

整个流程分三步。

第一步：AI 读范文，提取风格 DNA。用户贴一篇喜欢的文章。AI 不关心写了什么——可能是讲区块链的，可能是讲育儿的，无所谓。只关心一件事：这篇文章是怎么写的。

看的东西包括：叙事结构——怎么开头？场景代入式？反常识判断？一句骚话钩人？段落节奏——段落多长？多久来一次转折？短段和长段怎么交替？语言习惯——口语化程度多高？爱用什么语气词？"说白了""你想想""这事儿"出现频率？金句模式——金句长什么样？"X不是Y，X是Z"式的重新定义？还是短句连发式的节奏感？情绪节奏——分析和情绪怎么交替？每隔多少段来一次情绪锚点？

提取完之后，输出一份临时的 Style Profile——一份结构化的"写作配方"。

第二步：用提取出的风格改写用户的文章。AI 拿这份配方当系统指令，读用户原稿，按范文的节奏和语感重新写一遍。内容不动。观点不动。数据不动。案例不动。只动表达层——怎么开头、怎么推进、怎么收尾、怎么在关键位置放一句让人想截图的话。

第三步：输出改写稿加风格分析报告。除了改完的文章，附一份报告：AI 从范文里提取了什么。用户可以看到——"哦，原来这篇文章的节奏是这样的，原来它的金句都放在转折之后。"报告本身就是一次写作课。

看一个真实的例子

说再多不如看 before/after。

用户原稿（标准科技分析，翻译腔浓度拉满）：

近年来，人工智能技术在自然语言处理领域取得了显著进展。大语言模型的出现使得文本生成、翻译和分析等任务的处理效率大幅提升。本文将探讨当前AI写作工具的局限性，并提出改进方向。值得注意的是，现有工具在风格控制方面仍然存在根本性的挑战。

参考范文（半佛仙人某篇关于完全不同话题的文章）。AI 从中提取的风格 DNA：场景代入式开头，一两句话一段，高密度转折，冷幽默+自嘲，口语化程度中高，金句放在转折后面。

改写输出：

你有没有发现一件很讽刺的事？

市面上那些 AI 写作工具，号称能帮你写文章。但你用过之后会发现——它写出来的东西，一股子翻译味儿。

对，帮你写中文的 AI，它自己写的中文就不太行。

这不是模型不够大的问题。GPT 也好，Claude 也好，参数量早就够了。问题出在一个更尴尬的地方：这些模型训练的中文数据里，正式文本远多于口语化内容。新闻、百科、论文、翻译稿——这些是它见过最多的中文。

所以你让它"写一篇文章"，它给你的就是一篇维基百科。不是它不会写，是它不知道别的中文长什么样。

但这还不是最要命的。

同样的信息。完全不同的阅读体验。

用户的观点一个没丢。数据一个没变。整篇文章从"论文"变成了"聊天"——从"该系统面临根本性挑战"变成了"说白了就是不太行"。

为什么这是最难的问题

很多人以为风格迁移就是换词。把"值得注意的是"换成"有意思的是"，把"综上所述"换成"所以你看"，搞定。

换词确实管用——第一篇讲过，禁用词表干掉了 80% 的翻译腔。

剩下的 20% 才是硬骨头。风格不只是词汇，是建筑。

好的公众号文章，结构是精心设计的——哪里埋伏笔、哪里放转折、哪里让读者喘口气、哪里突然加速把情绪推到高点。建筑层面的事，不是装修层面的事。

换了所有家具，房子还是那个房子。要改的是承重墙、层高、动线。

具体来说，AI 做风格迁移需要理解至少三层。

词汇层——用什么词，不用什么词。最简单的，禁用词表就能搞定。

句式层——句子多长、怎么断、语气词放哪里、怎么制造节奏感。"短。短。长句收尾带情绪。"——句式层的设计。

架构层——全文怎么展开。先给场景还是先给判断？多久放一次转折？金句放在文章的什么位置效果最好？情绪的波峰波谷怎么分布？

风格库里的预置模板，因为是提炼出来的，天然包含这三层。抄作业模式只有一篇范文——AI 需要从一个样本里把三层信息全读出来。

这就是为什么提取质量这么关键。不是让 AI 说"这篇文章语气口语化"——废话。是让它说出："这篇文章的开头用了场景代入式，第一段结尾故意留一个悬念钩子；段落平均 50-80 字，每两三段一次转折，转折词偏好用'但是'和'问题是'而不是'然而'和'不过'；金句出现在每个模块最后一段，句式是'X不是Y，是Z'的重新定义式。"

具体到这个程度，AI 才能真的"照着"改。

产品全貌

到这里，Ghost Writer 的三条腿齐了。

风格库——预置六套经过验证的写作模板。适合"我不知道自己想要什么，帮我推荐"的用户。

抄作业——用户自带范文，AI 现场提取风格。适合"我就想写成这篇文章那样"的用户。

个人风格训练——用户提供自己写过的 3-5 篇满意文章，AI 提炼专属风格模板，以后所有文章都用这套模板改。适合"我有自己的风格，帮我保持一致"的用户。

三种模式，覆盖三种需求。从零基础到有明确偏好到想保持个人风格，都有对应方案。

这个系列写了三篇，从一份 435 行指南开始，到多风格库，再到抄作业模式。表面上越做越复杂，底层一直在回答同一个问题：AI 写中文，难点不在"写"，在"中文"。

每个大模型都能生成中文文本，语法正确、信息完整、逻辑通顺，技术上早就不是问题。问题在"正确的中文"和"好看的中文"之间隔着一道文化的墙。翻译腔和公众号文章的区别不是用词，是世界观——在陈述事实，还是在制造共鸣？在说服读者的大脑，还是在打动读者的情绪？文章是一篇报告，还是一次对话？

This post is also available in English.