ENZH

从万物回到三个品类

三个品类各自的模板集三个品类各自的模板集

上一篇讲了 6 个槽位通吃 7 个品类,一套管线跑下去。

跑了两周。上周测出一个 bug。

用户传了件牛仔外套,选了"材质拆解",出来的是白色 slate 底板,悬浮着六颗切面宝石。

牛仔。宝石。


抽象失守在哪一层

Part 2 的判断是:6 个槽位 = 6 个说服角度。第一印象、专业拆解、视觉识别、品质证明、生活场景、决策信息。这个抽象本身没错。

错的是抽象止于标签层。

珠宝的第二槽叫「宝石星图」,服饰的叫「材质拆解」,美妆的叫「成分拆解」。三个不同中文标签,指向同一个 prompt 函数。Prompt 里写的还是 "dark slate 上的珠宝样本星图"。

类型系统告诉我:每个槽位是抽象的、品类无关。但 prompt 里固化的视觉语言,从头到尾都是珠宝。

标签翻了,底层没翻。

这种 bug 最阴。类型绿、eslint 绿、UI 显示对。用户传图进来看一眼才发现不对劲。


抽象吃不了品类

更深的问题是:即使把每个 prompt 加三个品类分支,还是不够。

穿搭的第一槽不是棚拍。是 OOTD——全身人像占屏 60% 以上。千瓜、jizhil、ebrun 三个行业信源都把 OOTD 归为服饰商家主力,占内容 60-70%。

美妆的第一槽也不是棚拍。是试色拼图——五合一的品牌图+唇+掌+指+勺。Colorkey 这类彩妆品牌靠试色内容占了大约 45%。

珠宝的尺寸参考用硬币对比。穿搭的尺寸参考是模特身高叠字:"163cm/48kg 穿 M,微胖建议 L"。完全两回事。

说白了:珠宝、穿搭、美妆在小红书上的视觉语言,不是换个标签能通的。每个品类有自己的"语法"。

Part 2 的"6 个槽位一套管线"给了我一种安全感:一套 prompt,三个品类同时跑。实际上是珠宝的 6 张图套了三个标签。


分阶段是假的安全感

原计划分两步:

Phase 1:保留 6 个槽位,给 4 个弱 prompt(星图/工艺细节/尺寸参考/hero)加品类分支。一天搞完。 Phase 2:每个品类独立 6 个模板。一周左右。等用户数据来决定哪些模板该进该出。

Phase 1 的理由听起来很工程师:先发个小的、安全的,等数据再做大改。

问题是我没有用户。没有数据会来。

没数据的时候,Phase 1 的猜测质量 = Phase 2 的猜测质量。都是拍脑袋。差别只在:Phase 1 做完的 prompt 到 Phase 2 全扔——为旧 6 槽位写的品类分支,换新模板集后一张都留不下。

分阶段在没数据时不是风险管理,是假安全感。多做一轮 rework,换来"我在小步迭代"的心理效用。

直接 Phase 2。


让 agent 做定性调研

没用户就只能从公开资料挖。开了 3 个 agent 并行:

  • 第一个专盯 fashion(千瓜/jizhil/ebrun/niaogebiji 的服饰 XHS 研报)
  • 第二个专盯 beauty(数英/SocialBeta/品牌星球 的美妆和护肤拆解)
  • 第三个专看 10 个头部品牌的 XHS 账号 post-mortem(李宁、花西子、HFP、Colorkey、薇诺娜 等)

硬约束:agent 之间话题重合度 ≥ 50%。一个 agent 自己写出来的数据不信,两个 agent 独立查到同一个数字才信。

几个通过交叉验证站得住的数据点:

  • OOTD 占 XHS 服饰商家内容 60-70% — 千瓜、jizhil、ebrun 独立命中
  • 一衣多搭转发率 +50% — jizhil 案例:刘小被儿"10 套搭配 × 1 件牛仔外套"做到 220 万粉
  • 李宁火锅羽绒服靠"场景+产品+人物"组合在 XHS 双十一做到 30 万件、1 亿 GMV
  • 护肤 routine 视频笔记互动占比 51.32%(千瓜 2025 年报)
  • swatch 拼图是彩妆 XHS 标配(5 合 1:品牌+唇+掌+指+勺)——Colorkey 靠这一种形态跑出来

跨 10 个品牌的 post-mortem 还推翻了一个直觉:头部商家很少发纯 hero 棚拍图。实际爆款都是"产品+人+场景"的组合。这让 fashion 的独立 hero 槽直接被砍掉。


最终三套模板

服饰 6 张:OOTD 试穿、一衣多搭(四宫格)、场景化穿搭、平铺+上身图、前后对比("显高 5cm")、尺码建议(模特图叠字)。

美妆 6 张:产品主图、试色拼图(五合一)、使用前后对比、功效大字报、使用步骤(含 AM/PM)、合集榜单(TOP N / 红黑榜)。

珠宝 6 张:保持 Part 2 的原版不动。

共享基础设施:三个品类 6 张图都走同一条管线。变的只是 prompt 层的视觉语法。


砍比选难

迭代的真正开销不是选了哪 6 个,是砍了哪 6 个。

听起来合理但被砍掉的:

  • 版型/做工微距 — 找不到头部商家的爆款证据。只有高端设计师品牌偶尔用
  • 身高矩阵(155/160/165/170 同款对比)— 商家没有多模特预算。"小个子专精"是博主 niche,不是商家模板
  • moodboard 穿搭灵感拼贴 — 博主的自我名片工具,不是商家卖货工具。一衣多搭已经覆盖"多套组合"的功能
  • 成分三栏 infographic — AI 画分子式容易糊;HFP 这种以成分为卖点的品牌,实际做法是"单页大字报"。合并进功效大字报
  • AM/PM 独立 routine — 本质就是 routine 的一种,不需要独立槽位
  • 代言人东方美学大片 — 花西子那种 niche 高端玩法,普通商家抄不来

每一个都听起来合理。但合理不等于有证据。

硬约束"每品类严格 6 个"逼着我在一堆"像样"的候选里再砍。放开到 8 个,上面这些就都会进——"砍"比"选"难。

定了一条规则:若在研究里找不到至少一个头部商家的爆款案例作为证据,一个模板就不该占一个槽位


已知还没解决的

  1. 6+6+6 是 3 个 agent 的定性推断,不是千瓜订阅账号的帖子级实测。有用户之后要用 deselect 率 + 重生成率做 A/B 验证
  2. "通用"兜底品类还挂在珠宝的 6 张上。对文玩、香薰这类珠宝式小物件 OK,但将来加食品、家居要改
  3. 类型过 ≠ prompt 输出合格。10 个新 prompt 的实际产出需要本地 UAT。下一轮要补新旧对比的 A/B smoke test

迭代是反复自我推翻

Part 2 把管线抽象成"6 个槽位 = 6 个说服角度"。对的一半是:管线可以通用——API 调用、图片存储、UI 渲染、类型系统、计费,这些都长一样。错的一半是:内容层不能通用。小红书的服饰、美妆、珠宝有各自的视觉语法,不是换个标签能跨过去。

抽象能帮我少写三遍代码。不能帮我少写三遍 prompt。

每三到四周就得推翻自己上一次的判断一次。这不是做砸了,是做对了。

识川手记Part 3 of 3
← PrevNext →

© Xingfan Xia 2024 - 2026 · CC BY-NC 4.0