18 张灵感卡是怎么设计出来的
灵感卡原子级拆解
第一篇讲了 ÉLAN 的核心洞察:用户要的不是 AI 照片,是一整个"社交媒体瞬间"——照片加文案加情绪腔调。第二篇讲了让它跑起来的架构:多模态 Prompt、SSE 流式输出、VANITY_DESIGN_INSTRUCTIONS 系统。
这篇讲内容层——灵感卡目录本身。我怎么做调研的、每张卡的结构长什么样、四个分类怎么来的、以及如果重来一遍我会改什么。
同时这也是一个 Agent 编排的实战案例。
一个晚上,五路并发调研
我需要搞清楚:中国用户到底怎么在社交媒体上创造和分享"不经意的优越感"照片。不要观点,要数据。要模式。要那套让小红书帖子看起来"对"的具体视觉语法。
所以我用 Claude Code 同时跑了五个调研 Agent,每个负责一个维度:
- 拍照风格趋势 — CBNData 小红书修图精髓、港风调色教程、日系写真 AI 提示词、FantailFlo 和 JingDaily 的 2026 时尚趋势
- Pose 库 — 新浪时尚小红书博主宝藏姿势、知乎全身照 8 个姿势、GirlStyle 万能显瘦构图法、南都校探新式拍照方法
- 文案方法论 — 小红书文案套路研究、朋友圈高级感文案合集、凡尔赛/文艺/简约的分类体系
- 奢侈品美学 — 36 氪中式老钱风分析、JingDaily Safaricore 2025 报告、quiet luxury vs logo 最大化
- 竞品 UX — 妙鸭相机产品拆解、醒图参数过载分析、无他相机 App Store 评论挖掘
每个 Agent 返回结构化报告。维度之间有交叉的地方我做了交叉验证——Pose 调研说"品牌露出越不经意越好",文案调研独立得出"永远不要直接提品牌名",这就是高置信度信号。
合并输出是一份 18 页调研报告:42 个佐证数据点,3 个矛盾(标注并解决了),5 个孤证(没法交叉验证的)。
整个过程一个晚上。传统调研团队要 2-3 周。
说白了,这就是 Agent 编排在实际工作中的样子:不是一个超强 AI 单打独斗,而是多个聚焦的 Agent 并行跑,每个管一小块,人做最后的综合判断。
跟我在Agentic AI 系列里写的模式一模一样。ÉLAN 的调研阶段本身就是一个活例子。
四个分类怎么来的
从调研里,我提取出四种截然不同的用户发图意图。不是按人群分的,也不是按美学分的。是按发图场合分的——触发用户"我要发一条"的社交语境。
| 分类 | 中文名 | 英文名 | 核心意图 |
|---|---|---|---|
| 远方的光 | Wanderlust | 奢旅度假 | "我在一个很美的地方度假" |
| 城市漫游 | City Drift | 都市名媛 | "我的日常就是这么精致" |
| 日常诗意 | Poetic Daily | 文艺生活 | "我有品味和内在世界" |
| 时令之美 | Seasonal | 季节限定 | "我跟最美的当下同步" |
分法是有意为之的。
远方的光覆盖目的地场景——无边泳池、酒店晨光、海岛漫步。是硬核的"向往感":用户想投射"我就是这么旅行的"。目前 8 张卡:无边泳池、酒店晨光、海岛漫步、葡萄庄园、山间禅境、海上游艇、雪山滑雪、头等舱候机。
城市漫游覆盖都市生活方式——天台日落、下午茶、美术馆、光影晚宴。意图不一样:"这就是我的周二。"把奢侈品日常化。10 张卡,从都市运动到马术俱乐部都有。
日常诗意是知性和创作赛道——咖啡角落、书店午后、花艺时光、居家创作。这个分类存在是因为不是每个用户都想展示财富。有人想展示的是品味、创造力、深度。7 张卡,包括新中式风韵和茶道雅集。
时令之美制造时间紧迫感——春天的樱花季、秋天的银杏、初雪、夏日花园。这些卡带 seasonalRange 字段,按日期自动上下架。目前 4 张,未来打算做到每月都有限定。
分类名故意写得很诗意。"远方的光"听起来比"奢旅度假"更让人想点进去。浏览灵感卡目录的时候,用户的心态是"我想过哪种生活",不是"我要选什么参数"。
拆一张卡给你看:无边泳池
我拿"无边泳池"这张卡完整拆解。它是测试期使用最多的卡,也是我给新人解释系统时用的那张。
类型系统
每张灵感卡实现 MuseCard TypeScript 接口:
interface MuseCard {
id: string;
name: string; // "无边泳池"
nameEn: string; // "Infinity Pool"
category: MuseCategory; // "travel"
tags: string[]; // ["度假", "奢华", "海景", "黄金时刻"]
scene: SceneConfig; // 场景定义
outfit: OutfitConfig; // 服饰配置
poses: PoseConfig; // Pose 序列
colorGrade: ColorGradeConfig; // 调色规格
mood: string;
captions: CaptionTemplates; // 3 种风格
narrative: NarrativeSequence; // 4-5 镜叙事
isNew: boolean;
isSeasonal: boolean;
sortOrder: number;
}
每个字段喂给生成管线的不同环节。无边泳池这张卡长这样:
场景配置
description: "豪华度假村无边泳池,俯瞰无际大海,金色黄昏将水面染成碎金。
泳池边缘与天际线融为一体,天水相连。"
brandHints: ["四季酒店", "安缦", "宝格丽度假村", "悦榕庄"]
lighting: "黄金时刻侧逆光,暖橙色光晕,水面反光形成自然柔光"
brandHints 这个字段很关键。它告诉模型视觉上参考哪些度假村——但 VANITY_DESIGN_INSTRUCTIONS(第二篇讲过)确保这些引用只是背景,永远不居中。
泳池看起来像四季酒店,但照片不能像四季的广告。
服饰配置
description: "精致泳衣搭配真丝纱笼,设计师太阳镜随意架于发顶,
整体透出不费力的优雅"
luxuryHints: ["真丝纱笼", "设计师墨镜", "精致泳装"]
colorPalette: ["沙金色", "象牙白", "玫瑰裸粉"]
服饰不是戏服,是方向。"真丝纱笼"告诉模型材质和垂坠感。色板约束生成结果跟黄金时刻的场景光线协调。
Pose 序列:四镜叙事
这是灵感卡跟传统模板最大的区别。每张卡不是随机生成照片——是生成一个视觉故事,4-5 镜:
| 镜号 | 角色 | 无边泳池描述 |
|---|---|---|
| 1 | 全景建立 | 宽幅全景:泳池延伸至海天交界,人物处于远景左三分之一 |
| 2 | 人像 | 中景:池边侧坐,黄金逆光勾勒轮廓,眼神望向远方 |
| 3 | 细节 | 特写:脚踝入水一刻,水纹涟漪与金色倒影 |
| 4 | 氛围收尾 | 剪影:夕阳最后一抹余晖中,人物背对镜头眺望大海 |
在小红书发组图的时候,有一个隐含的叙事结构。调研发现,高互动帖子都遵循电影式递进:远 → 中 → 近 → 氛围。Pose 序列直接编码了这个规律。
调色规格
style: "warmGold"
promptDescription: "golden hour warmth with amber tones, slightly lifted
shadows, creamy highlights, film-like grain"
temperature: "warm"
saturation: "medium"
contrast: "low"
promptDescription 最直接——原样送进 Gemini 的 Prompt。结构化字段(temperature、saturation、contrast)用于 UI 展示,也为将来手机端的调色微调滑块(第四篇会讲)做准备。
三种文案模板
同一个无边泳池场景,三种完全不同的腔调:
凡尔赛风:
- "随手拍的 没有调色 这个泳池的水真的是这个颜色"
- "说好游两圈就走的 结果泡到日落都没舍得起来"
文艺风:
- "水面收走了所有的光,我什么都不想要了"
- "泳池尽头连着天,人泡在里面会变小"
简约高级风:
- "泡着不想动"
- "天水一色"
凡尔赛风是默认的,也是最受欢迎的。它体现了核心公式:文案说小事,照片露大事。 "随手拍的"——但照片明显是一晚上两千美元的度假村。错位就是全部意义。
每种风格还有 emoji 约束。凡尔赛风最多 2 个 emoji,从"高级感"白名单里选(🌊、✨、🌅)。不许用💰,不许用🥂,不许用👑。
调研很明确:某些 emoji 信号是"太用力了",会打破不经意的幻觉。
妙鸭死在哪,我们就从哪活
第一篇我讲过"烟花效应"——妙鸭相机的冲高暴跌曲线。灵感卡目录就是对这个问题的结构性回答。
核心洞察:功能会衰减,但内容会累积。
如果你的产品出了 10 个模板就不再更新,用户试完 10 个就走了。但如果每周上新,用户会回来看"这周有什么新的"。用户粘性从"试试 AI"变成"看看这周上了什么好看的"。
目录现在有 29 张卡,四个分类。计划:
| 策略 | 频率 | 内容 |
|---|---|---|
| 新卡上线 | 每周 1-2 个 | 跟随小红书热点/节日/季节 |
| 限定套餐 | 每月 | 情人节/圣诞/春节特别版 |
| 用户投票 | 每两周 | "下一个你想要的套餐是?" |
| 灵感上传 | 持续 | 高级用户上传参考图,最佳方案变成正式卡 |
季节卡带 seasonalRange 字段——樱花季 3 月 1 号自动上架,4 月 30 号自动下架。天然的 FOMO:"樱花卡还有 8 周就没了。"不需要推送通知,不需要人造稀缺。四季替你做了。
这套逻辑支撑的商业模式是订阅制。你买的不是一个 AI 工具——你订阅的是一个持续更新的"社交瞬间"目录。AI 只是交付方式。
文案才是真正拉开差距的地方
文案系统值得单独拿出来讲,因为这是跟竞品差距最大的点。没有任何其他 AI 拍照 App 生成社交可发的文案。它们给你一张照片,然后你对着空白文本框发呆。
调研发现,文案是整个"拍照→发帖"流程中摩擦力最大的环节。用户生成了一张好看的照片,然后花 10 分钟想写什么。很多人放弃了,照片永远没发出去。
反差凡尔赛
文案设计的核心原则是刻意的错位:
文案说小事 → 照片露大事 → 观看者自己脑补出仰慕
"说好游两圈就走的 结果泡到日落都没舍得起来"——文案说"我本来只想游两圈"。照片是黄金时刻的豪华度假村无边泳池。文字往小了说,画面往大了拍。观看者感受到的是毫不费力。
这跟大多数人发奢侈品照片的方式恰恰相反(所以大多数奢侈品文案看起来很尬)。本能是匹配:大照片配大文案。"安缦的日落太美了!"但匹配看起来像炫耀。错位看起来像……就是在过日子。
平台适配
同一段文案还会自动适配目标平台:
| 维度 | 朋友圈 | 小红书 |
|---|---|---|
| 文案长度 | 1 句话(15-30 字) | 3-5 句(50-150 字) |
| 标签 | 不加 | 3-5 个必加 |
| Emoji | 0-1 个 | 2-4 个 |
| 语气 | 更私密、更凡尔赛 | 更分享感、更"有用" |
| 互动引导 | 无 | 结尾加提问 |
一键切换。用户不需要思考格式差异。
坦白时间:什么灵什么不灵
行的
四镜叙事序列。 这个决定对了。测试显示,拿到电影式四连拍的用户,组图发出去的比例明显高于拿到四张随机照片的用户。全景 → 人像 → 细节 → 氛围的结构,直接对应人们滑动组图的自然阅读习惯。
文案生成 + 风格切换。 用户在看到之前不知道自己想要这个。但你给她看同一组照片的三种文案,她眼睛就亮了。"我点一下就能换?"这就是"把饭喂进嘴里"的设计哲学。
季节卡自动上下架。 三月份樱花卡自动出现,用户会觉得"这个 App 知道现在是什么季节"。小细节,大情绪。
还不行的
卡太多了,筛选不够。 从第一篇写的 18 张长到了 29 张。对浏览式界面来说已经多了。现在的分类 Tab 能用,但需要推荐层:"本周热门"或者"你所在城市适合的"。纯浏览超过 20 张卡就开始有选择疲劳。
策展和自由度的矛盾。 有些用户爱死了灵感卡的"全包"设计。另一些想微调——"我喜欢无边泳池的场景但想换个服装"。现在是一口价不能改。给每张卡加可选微调是对的方向,但必须藏在"高级"模式后面。一旦把滑块露出来,你就变成醒图了。
品牌安全。 brandHints 和 luxuryHints 引用了真实品牌——爱马仕、香奈儿、四季。AI 生成的图片里出现可辨识的品牌元素,法律上是灰色地带。目前 hints 写的是美学方向("真丝纱笼"而不是"爱马仕丝巾"),VANITY_DESIGN_INSTRUCTIONS 确保 logo 永远不突出。但产品做大了,这个需要正式法务评估。
文案质量波动。 凡尔赛风很难拿捏。太含蓄了读起来像废话。太明显了读起来像装逼。卡数据里的模板是手工打磨的,但 AI 生成的变体有时候跑偏。这是一个需要持续迭代的 Prompt 工程问题——不存在"搞一次就好了"。
有些卡就是不灵。 "健身自律"在测试中持续低迷——对健身照片感兴趣的用户,审美取向跟 ÉLAN 的奢侈休闲风格不太搭。"马术俱乐部"也太小众了。目录需要的不光是扩张,还有修剪。
目录不是功能,目录就是产品
大多数 AI 拍照 App 把模板库当成一个功能——产品"有"的东西。ÉLAN 把灵感卡目录当成产品本身。
AI 是基础设施。UX 是交付通道。用户真正在意的,是她可以走进去的那个策展好的"社交瞬间"集合。
这个重新定框改变了你构建和维护产品的一切。你出的不是功能——你出的是内容。你的路线图不是"加换脸"或"提高分辨率"。是"我们的用户这个月想投射什么样的瞬间?"
下一篇讲从 Web 到移动端的迁移——灵感卡 UX 怎么翻译成原生 App 体验,以及 Expo SDK 55 的业务逻辑共享方案。
第一篇:不经意的优越感 | 第二篇:架构 | 第三篇:灵感卡设计 | 第四篇:Web 到移动端
This post is also available in English.