ENZH

18 张灵感卡是怎么设计出来的

灵感卡原子级拆解灵感卡原子级拆解

第一篇讲了 ÉLAN 的核心洞察:用户要的不是 AI 照片,是一整个"社交媒体瞬间"——照片加文案加情绪腔调。第二篇讲了让它跑起来的架构:多模态 Prompt、SSE 流式输出、VANITY_DESIGN_INSTRUCTIONS 系统。

这篇讲内容层——灵感卡目录本身。我怎么做调研的、每张卡的结构长什么样、四个分类怎么来的、以及如果重来一遍我会改什么。

同时这也是一个 Agent 编排的实战案例。


一个晚上,五路并发调研

我需要搞清楚:中国用户到底怎么在社交媒体上创造和分享"不经意的优越感"照片。不要观点,要数据。要模式。要那套让小红书帖子看起来"对"的具体视觉语法。

所以我用 Claude Code 同时跑了五个调研 Agent,每个负责一个维度:

  1. 拍照风格趋势 — CBNData 小红书修图精髓、港风调色教程、日系写真 AI 提示词、FantailFlo 和 JingDaily 的 2026 时尚趋势
  2. Pose 库 — 新浪时尚小红书博主宝藏姿势、知乎全身照 8 个姿势、GirlStyle 万能显瘦构图法、南都校探新式拍照方法
  3. 文案方法论 — 小红书文案套路研究、朋友圈高级感文案合集、凡尔赛/文艺/简约的分类体系
  4. 奢侈品美学 — 36 氪中式老钱风分析、JingDaily Safaricore 2025 报告、quiet luxury vs logo 最大化
  5. 竞品 UX — 妙鸭相机产品拆解、醒图参数过载分析、无他相机 App Store 评论挖掘

每个 Agent 返回结构化报告。维度之间有交叉的地方我做了交叉验证——Pose 调研说"品牌露出越不经意越好",文案调研独立得出"永远不要直接提品牌名",这就是高置信度信号。

合并输出是一份 18 页调研报告:42 个佐证数据点,3 个矛盾(标注并解决了),5 个孤证(没法交叉验证的)。

整个过程一个晚上。传统调研团队要 2-3 周。

说白了,这就是 Agent 编排在实际工作中的样子:不是一个超强 AI 单打独斗,而是多个聚焦的 Agent 并行跑,每个管一小块,人做最后的综合判断。

跟我在Agentic AI 系列里写的模式一模一样。ÉLAN 的调研阶段本身就是一个活例子。


四个分类怎么来的

从调研里,我提取出四种截然不同的用户发图意图。不是按人群分的,也不是按美学分的。是按发图场合分的——触发用户"我要发一条"的社交语境。

分类中文名英文名核心意图
远方的光Wanderlust奢旅度假"我在一个很美的地方度假"
城市漫游City Drift都市名媛"我的日常就是这么精致"
日常诗意Poetic Daily文艺生活"我有品味和内在世界"
时令之美Seasonal季节限定"我跟最美的当下同步"

分法是有意为之的。

远方的光覆盖目的地场景——无边泳池、酒店晨光、海岛漫步。是硬核的"向往感":用户想投射"我就是这么旅行的"。目前 8 张卡:无边泳池、酒店晨光、海岛漫步、葡萄庄园、山间禅境、海上游艇、雪山滑雪、头等舱候机。

城市漫游覆盖都市生活方式——天台日落、下午茶、美术馆、光影晚宴。意图不一样:"这就是我的周二。"把奢侈品日常化。10 张卡,从都市运动到马术俱乐部都有。

日常诗意是知性和创作赛道——咖啡角落、书店午后、花艺时光、居家创作。这个分类存在是因为不是每个用户都想展示财富。有人想展示的是品味、创造力、深度。7 张卡,包括新中式风韵和茶道雅集。

时令之美制造时间紧迫感——春天的樱花季、秋天的银杏、初雪、夏日花园。这些卡带 seasonalRange 字段,按日期自动上下架。目前 4 张,未来打算做到每月都有限定。

分类名故意写得很诗意。"远方的光"听起来比"奢旅度假"更让人想点进去。浏览灵感卡目录的时候,用户的心态是"我想过哪种生活",不是"我要选什么参数"。


拆一张卡给你看:无边泳池

我拿"无边泳池"这张卡完整拆解。它是测试期使用最多的卡,也是我给新人解释系统时用的那张。

类型系统

每张灵感卡实现 MuseCard TypeScript 接口:

interface MuseCard {
  id: string;
  name: string;           // "无边泳池"
  nameEn: string;         // "Infinity Pool"
  category: MuseCategory; // "travel"
  tags: string[];         // ["度假", "奢华", "海景", "黄金时刻"]

  scene: SceneConfig;     // 场景定义
  outfit: OutfitConfig;   // 服饰配置
  poses: PoseConfig;      // Pose 序列
  colorGrade: ColorGradeConfig; // 调色规格
  mood: string;

  captions: CaptionTemplates;    // 3 种风格
  narrative: NarrativeSequence;  // 4-5 镜叙事

  isNew: boolean;
  isSeasonal: boolean;
  sortOrder: number;
}

每个字段喂给生成管线的不同环节。无边泳池这张卡长这样:

场景配置

description: "豪华度假村无边泳池,俯瞰无际大海,金色黄昏将水面染成碎金。
              泳池边缘与天际线融为一体,天水相连。"
brandHints: ["四季酒店", "安缦", "宝格丽度假村", "悦榕庄"]
lighting: "黄金时刻侧逆光,暖橙色光晕,水面反光形成自然柔光"

brandHints 这个字段很关键。它告诉模型视觉上参考哪些度假村——但 VANITY_DESIGN_INSTRUCTIONS(第二篇讲过)确保这些引用只是背景,永远不居中。

泳池看起来像四季酒店,但照片不能像四季的广告。

服饰配置

description: "精致泳衣搭配真丝纱笼,设计师太阳镜随意架于发顶,
              整体透出不费力的优雅"
luxuryHints: ["真丝纱笼", "设计师墨镜", "精致泳装"]
colorPalette: ["沙金色", "象牙白", "玫瑰裸粉"]

服饰不是戏服,是方向。"真丝纱笼"告诉模型材质和垂坠感。色板约束生成结果跟黄金时刻的场景光线协调。

Pose 序列:四镜叙事

这是灵感卡跟传统模板最大的区别。每张卡不是随机生成照片——是生成一个视觉故事,4-5 镜:

镜号角色无边泳池描述
1全景建立宽幅全景:泳池延伸至海天交界,人物处于远景左三分之一
2人像中景:池边侧坐,黄金逆光勾勒轮廓,眼神望向远方
3细节特写:脚踝入水一刻,水纹涟漪与金色倒影
4氛围收尾剪影:夕阳最后一抹余晖中,人物背对镜头眺望大海

在小红书发组图的时候,有一个隐含的叙事结构。调研发现,高互动帖子都遵循电影式递进:远 → 中 → 近 → 氛围。Pose 序列直接编码了这个规律。

调色规格

style: "warmGold"
promptDescription: "golden hour warmth with amber tones, slightly lifted
                    shadows, creamy highlights, film-like grain"
temperature: "warm"
saturation: "medium"
contrast: "low"

promptDescription 最直接——原样送进 Gemini 的 Prompt。结构化字段(temperaturesaturationcontrast)用于 UI 展示,也为将来手机端的调色微调滑块(第四篇会讲)做准备。

三种文案模板

同一个无边泳池场景,三种完全不同的腔调:

凡尔赛风:

  • "随手拍的 没有调色 这个泳池的水真的是这个颜色"
  • "说好游两圈就走的 结果泡到日落都没舍得起来"

文艺风:

  • "水面收走了所有的光,我什么都不想要了"
  • "泳池尽头连着天,人泡在里面会变小"

简约高级风:

  • "泡着不想动"
  • "天水一色"

凡尔赛风是默认的,也是最受欢迎的。它体现了核心公式:文案说小事,照片露大事。 "随手拍的"——但照片明显是一晚上两千美元的度假村。错位就是全部意义。

每种风格还有 emoji 约束。凡尔赛风最多 2 个 emoji,从"高级感"白名单里选(🌊、✨、🌅)。不许用💰,不许用🥂,不许用👑。

调研很明确:某些 emoji 信号是"太用力了",会打破不经意的幻觉。


妙鸭死在哪,我们就从哪活

第一篇我讲过"烟花效应"——妙鸭相机的冲高暴跌曲线。灵感卡目录就是对这个问题的结构性回答。

核心洞察:功能会衰减,但内容会累积。

如果你的产品出了 10 个模板就不再更新,用户试完 10 个就走了。但如果每周上新,用户会回来看"这周有什么新的"。用户粘性从"试试 AI"变成"看看这周上了什么好看的"。

目录现在有 29 张卡,四个分类。计划:

策略频率内容
新卡上线每周 1-2 个跟随小红书热点/节日/季节
限定套餐每月情人节/圣诞/春节特别版
用户投票每两周"下一个你想要的套餐是?"
灵感上传持续高级用户上传参考图,最佳方案变成正式卡

季节卡带 seasonalRange 字段——樱花季 3 月 1 号自动上架,4 月 30 号自动下架。天然的 FOMO:"樱花卡还有 8 周就没了。"不需要推送通知,不需要人造稀缺。四季替你做了。

这套逻辑支撑的商业模式是订阅制。你买的不是一个 AI 工具——你订阅的是一个持续更新的"社交瞬间"目录。AI 只是交付方式。


文案才是真正拉开差距的地方

文案系统值得单独拿出来讲,因为这是跟竞品差距最大的点。没有任何其他 AI 拍照 App 生成社交可发的文案。它们给你一张照片,然后你对着空白文本框发呆。

调研发现,文案是整个"拍照→发帖"流程中摩擦力最大的环节。用户生成了一张好看的照片,然后花 10 分钟想写什么。很多人放弃了,照片永远没发出去。

反差凡尔赛

文案设计的核心原则是刻意的错位:

文案说小事 → 照片露大事 → 观看者自己脑补出仰慕

"说好游两圈就走的 结果泡到日落都没舍得起来"——文案说"我本来只想游两圈"。照片是黄金时刻的豪华度假村无边泳池。文字往小了说,画面往大了拍。观看者感受到的是毫不费力。

这跟大多数人发奢侈品照片的方式恰恰相反(所以大多数奢侈品文案看起来很尬)。本能是匹配:大照片配大文案。"安缦的日落太美了!"但匹配看起来像炫耀。错位看起来像……就是在过日子。

平台适配

同一段文案还会自动适配目标平台:

维度朋友圈小红书
文案长度1 句话(15-30 字)3-5 句(50-150 字)
标签不加3-5 个必加
Emoji0-1 个2-4 个
语气更私密、更凡尔赛更分享感、更"有用"
互动引导结尾加提问

一键切换。用户不需要思考格式差异。


坦白时间:什么灵什么不灵

行的

四镜叙事序列。 这个决定对了。测试显示,拿到电影式四连拍的用户,组图发出去的比例明显高于拿到四张随机照片的用户。全景 → 人像 → 细节 → 氛围的结构,直接对应人们滑动组图的自然阅读习惯。

文案生成 + 风格切换。 用户在看到之前不知道自己想要这个。但你给她看同一组照片的三种文案,她眼睛就亮了。"我点一下就能换?"这就是"把饭喂进嘴里"的设计哲学。

季节卡自动上下架。 三月份樱花卡自动出现,用户会觉得"这个 App 知道现在是什么季节"。小细节,大情绪。

还不行的

卡太多了,筛选不够。 从第一篇写的 18 张长到了 29 张。对浏览式界面来说已经多了。现在的分类 Tab 能用,但需要推荐层:"本周热门"或者"你所在城市适合的"。纯浏览超过 20 张卡就开始有选择疲劳。

策展和自由度的矛盾。 有些用户爱死了灵感卡的"全包"设计。另一些想微调——"我喜欢无边泳池的场景但想换个服装"。现在是一口价不能改。给每张卡加可选微调是对的方向,但必须藏在"高级"模式后面。一旦把滑块露出来,你就变成醒图了。

品牌安全。 brandHintsluxuryHints 引用了真实品牌——爱马仕、香奈儿、四季。AI 生成的图片里出现可辨识的品牌元素,法律上是灰色地带。目前 hints 写的是美学方向("真丝纱笼"而不是"爱马仕丝巾"),VANITY_DESIGN_INSTRUCTIONS 确保 logo 永远不突出。但产品做大了,这个需要正式法务评估。

文案质量波动。 凡尔赛风很难拿捏。太含蓄了读起来像废话。太明显了读起来像装逼。卡数据里的模板是手工打磨的,但 AI 生成的变体有时候跑偏。这是一个需要持续迭代的 Prompt 工程问题——不存在"搞一次就好了"。

有些卡就是不灵。 "健身自律"在测试中持续低迷——对健身照片感兴趣的用户,审美取向跟 ÉLAN 的奢侈休闲风格不太搭。"马术俱乐部"也太小众了。目录需要的不光是扩张,还有修剪。


目录不是功能,目录就是产品

大多数 AI 拍照 App 把模板库当成一个功能——产品"有"的东西。ÉLAN 把灵感卡目录当成产品本身。

AI 是基础设施。UX 是交付通道。用户真正在意的,是她可以走进去的那个策展好的"社交瞬间"集合。

这个重新定框改变了你构建和维护产品的一切。你出的不是功能——你出的是内容。你的路线图不是"加换脸"或"提高分辨率"。是"我们的用户这个月想投射什么样的瞬间?"

下一篇讲从 Web 到移动端的迁移——灵感卡 UX 怎么翻译成原生 App 体验,以及 Expo SDK 55 的业务逻辑共享方案。


第一篇:不经意的优越感 | 第二篇:架构 | 第三篇:灵感卡设计 | 第四篇:Web 到移动端


This post is also available in English.


© Xingfan Xia 2024 - 2026 · CC BY-NC 4.0