让 AI 写出中国人看得下去的中文
AI 学习中文写作
被读者打脸了
前阵子有个读者给我发消息:
"blog现在的中文版的阅读体验不是很好, 用语很生硬"
我当时第一反应是——不至于吧?我的中文文章都认真写过的。
然后我回去重新读了一遍。
读完我就沉默了。人家说得对。这些文章确实"生硬"。不是语法错误,不是用词不当,而是一种更微妙的问题:它们读起来不像中文博客,像英文博客的翻译稿。
每一句话都是对的。但整篇文章就是不对。
翻译腔长什么样
我随便挑一段早期文章(改写过,但味道一样):
该系统的核心特征在于其能够在无需人类持续干预的情况下,独立执行一系列复杂任务。
你品品这句话。语法没毛病吧?信息传达清楚吧?
但你会在微信上看到有人这么写吗?不会。这种句子只出现在两个地方:翻译教材和大学论文。
它的问题出在哪?
- 从句套从句,英语的定语结构硬搬过来
- "在...的情况下"——典型英语 "without..." 的翻译痕迹
- 先说抽象定义,再给例子——英文论文的思路
- 没有一丝"人味"
同样的意思,换个写法:
Agent和普通AI助手有什么区别?打个比方:AI助手像听话的员工——你说什么它干什么。Agent呢?更像靠谱的合伙人。你说"帮我把这个项目搞定",它自己拆任务、自己干活、干完了还给你写个总结。
一样的内容。读起来完全是两回事。
第一段像维基百科。第二段像朋友在饭桌上跟你解释。
根子上的区别
我一开始以为问题出在用词——把几个书面词换成口语词就行了。
后来发现不是。问题出在思维结构。
英文写作,思路是演绎的:先说观点,再摆证据,最后总结。写文章就像做陈述——我要说服你,所以我先亮结论,然后用数据和逻辑堆证明。
中文自媒体呢?思路是归纳的、螺旋的:先给你看一个场景,让你有感觉,然后点出道理。不是我告诉你什么是对的,而是我带你看一个东西,看完你自己会觉得。
说白了——
英文说服你靠逻辑。
中文自媒体说服你靠共鸣。
这不是哪个好哪个差。两种传统都能写出好东西。但你用英文的修辞结构写中文内容,出来的东西就像用筷子吃意面——能吃,但总觉得哪里不对。
去研究"别人怎么写的"
搞清楚问题之后,我做了一件可能有点蠢的事:去研究公众号爆款文章是怎么写的。
研究对象:半佛仙人、九边、卢克文、差评、虎嗅、36氪。
这些人风格各异,但有几个共同点:
1. 开头绝对不会是"本文将分析..."
半佛仙人会用一句骚话把你钩住。九边直接丢一个违反直觉的判断。卢克文从一个历史故事开始讲。差评用一张截图加一句吐槽。
没有人会在第一段告诉你"这篇文章要讨论什么"——那是论文的写法。
2. 短段落,短到你不好意思
一句话一段?常规操作。
两句话?已经算长了。
三句话以上?那是在做重大论述。
3. "但是"是最重要的词
好文章的节奏全靠转折。给你一个判断,然后"但是"——打破它。再给一个更深的判断,然后"问题是"——再打破。一波三折,读者才不会走。
4. 金句是社交货币
每篇爆款里都有那么一两句话,适合截图发朋友圈。不是因为信息量大,而是因为说得漂亮。"速度就是护城河。""AI不是来抢你饭碗的,是来抢你饭碗里最好吃的那块肉的。"
读者分享文章不是因为它有用,而是因为分享这篇文章让他们显得聪明。
我把这些分析整理成了一份 435 行的写作风格参考文档。
踩过的坑:抽象规则没用
搞完研究,我很兴奋,立刻给 AI 的指令加上了一堆规则:
- "用短段落"
- "语气要口语化"
- "写得像跟朋友聊天"
然后让 AI 重新写一篇文章。
写出来一看——跟没加规则一模一样。
为什么?因为"语气要口语化"不是一条可执行的指令。这就像你跟一个从小只读法律文书的人说"你写轻松点"——他根本不知道"轻松"长什么样。他的参考系里没有这个东西。
AI 的训练数据里,中文正式文本(新闻、百科、教材、翻译内容)的占比远高于口语化自媒体文本。你告诉它"说人话",它的"人话"还是翻译腔,因为那就是它见过最多的中文。
真正管用的:具体到不能再具体
转折来了——我后来想明白一件事:规则必须具体到AI没有解释空间。
禁用词表
别说"不要用学术语言"。直接列表:
| 杀掉这个 | 换成这个 |
|---|---|
| 值得注意的是 | 有意思的是 / 但你可能没注意到 |
| 综上所述 | 所以你看 / 说到底 |
| 首先...其次...再次...最后 | 第一个 / 更重要的是 / 但最狠的是 |
| 作为一个... | 直接说身份——"他是工程师"不要"作为一个工程师" |
| 进行了...分析 | 直接说——"分析了"不要"对此进行了分析" |
| 本文将... | 直接开始。永远不要预告你要做什么。 |
这个表一加进去,效果立竿见影。为什么?因为它是正则匹配级别的具体。AI 不需要理解什么叫"口语化",它只需要看到"值得注意的是"就替换成"有意思的是"。
Before/After 对比
最有效的方法是让 AI 看同一个意思的两种写法:
翻译腔:
该公司的商业模式面临着一个根本性的挑战。随着AI Agent技术的普及,传统的SaaS订阅模式正在被按使用量计费的消费模式所取代。
公众号风格:
这家公司的商业模式,说难听点,快走不下去了。原因很简单:以前你卖SaaS,客户按月付费,管你用不用,钱照收。现在呢?客户说,我有Agent了,用多少付多少,不用就不付。
AI 能看到这个变换——什么变了,为什么变了。单句成段、"说难听点"替换"面临根本性挑战"、用对话("客户说...")代替抽象描述、用比喻("旱涝保收"→"看天吃饭")把概念变成画面。
一个例子胜过十条规则。
结构模板
别说"用螺旋结构"。给具体步骤:
模板A:现象拆解
1. 钩子:反常识 or 场景代入(1段)
2. "你可能觉得...但其实..."(设反差)
3. 第一层:表面原因(场景+洞察)
4. "但这还不是最关键的"(转折加深)
5. 第二层:底层逻辑(场景+洞察)
6. "所以你看..."(回到读者的现实)
7. 金句收尾 or 行动建议
有了脚手架,AI 才知道往哪搭砖。
口语化的刻度尺
我定义了一条频谱——不是论文,也不是网络段子,而是**"聪明朋友在饭桌上聊天"**:
论文 ←————— 甜区 —————→ 段子手
"基于上述分析" "说白了" "笑死,绷不住了"
"值得注意的是" "这事儿有意思" "家人们谁懂啊"
"综上所述" "所以你看" "绝绝子"
目标:甜区。不端着,但也不油。
校对关
即使所有规则都到位,第一稿还是会漏出翻译腔。所以我加了一道强制校对:写完之后扫描全文,搜"作为""之一""进行""综上""值得注意"——看到一个杀一个。然后整篇读出声——读起来别扭的句子,写出来一定也别扭。
更深的一课
教 AI 写出文化特定风格的文字,比教它写代码难太多了。
代码有明确的对错。测试跑过了就是过了,lint 报错了就去修。反馈循环紧凑、客观。
但写作风格?"感觉像原生的"和"感觉像翻译的"——这个差距巨大,但很难精确描述。
翻译腔最阴险的地方在于它不是错的。每句话语法都对。信息传达都准确。你用语法检查器跑一遍,满分。但问题恰恰在这:它不是语法问题,是文化寄存器问题。文本模式匹配到了"翻译教材"而不是"原生内容",中文读者一秒就能感觉到,即使他们说不出哪里不对。
几个收获:
抽象规则活不过生成。 "语气口语化"不是规则,是愿望。规则要具体到正则表达式都能部分执行。
例子比描述好用十倍。 同一个意思的两种写法,教会 AI 的东西比任何关于"好中文"的论述都多。
禁用词表是杠杆最高的干预。 一张简单的替换表干掉了 80% 的翻译腔。剩下的结构、节奏、语气,都需要迭代。
风格是一条管线,不是一个开关。 你没法用一条指令修好文化寄存器。你需要研究、参考文档、显式规则、示例、结构模板、校对流程。这是一个系统,不是一个设定。
你现在读的就是考试
这篇文章本身就是测试用例。
一篇关于如何写好中文的文章,如果读起来还是像翻译的英文——那这个系统就失败了。
你觉得呢?读到这里,它像翻译稿,还是像一篇正常的中文博客?
这个答案只有你能给。
This post is also available in English.