自拍 App 怎么拐去做了珠宝

从云佩戴到产品摄影的转型从云佩戴到产品摄影的转型

朋友看了 ÉLAN，眼睛亮了："做珠宝云佩戴。小商家拍不起照片，让客户在线上试戴。AR + AI。市场巨大。"

写了一整份调研报告。定价模型、竞品分析、技术架构、7 天实施计划。很认真。

方向不对。

20 分钟，一份计划就死了

写任何代码之前，让 Claude 跑了四个维度的深度调研：竞争格局、技术成熟度、商业模型、合规风险。

20 分钟，结果回来了。三个致命问题：

巨头免费做了。 淘宝和京东已经内置 AR 试戴。小商家不可能跟免费竞争。

定价算不过来。 方案定价 1980 元/月，目标客户——小珠宝商——年均营收才 3 万。一个工具吃掉 6.6% 的毛收入？没人付。

合规比想的难。 中国 2025 年《人脸识别技术应用安全管理办法》要求设备端存储、单独知情同意、影响评估。报告说"合规零难度"，不对。

计划被否了。底层直觉是对的——小珠宝商确实需要负担得起的视觉内容。问题：什么形态？

方向不对，但直觉没错

小珠宝商有一个非常具体的痛点。需要专业产品图发小红书、淘宝、微信。目前的供应链：

角色	单套成本
摄影师	800-2,000 元
平面设计师	200-800 元
文案	100-300 元
合计	1,100-3,100 元

卖 50-200 块的银饰，请不起这套班子。大多数商家拿手机随便拍一张，纳闷为什么卖不动。

ÉLAN 的 Gemini 管线已经能做 90%。上传一张照片，注入一段详细的 prompt，拿到风格化输出。区别只是：

ÉLAN：输入自拍 → 输出本人写真
识川：输入产品照 → 输出产品内容套图

同一套管线。不同的 prompt。同一天。

传一张照片，出六张大片

识川（Shichuan）建在一个两步 AI 管线上：

第一步：分析。 Gemini Flash 分析产品照片加卖家描述，输出结构化 JSON：材质、宝石细节（切工/颜色/数量/镶嵌/特殊效果）、工艺、色彩、卖点、小红书文案。约 7 秒。

第二步：生成。 每个选中的模板注入分析数据，生成编辑级图片。所有模板并行跑。

六个模板：

模板	生成内容
Hero（产品主图）	棚拍级产品照，材质专属灯光
Constellation（宝石星图）	博物馆陈列风格——宝石被提取为标本，深色背景上呈星座排列
Color DNA（色彩基因）	珠宝放在织物上，旁边解构其色彩的水彩色块
Craft Detail（工艺微距）	极限微距拍摄工艺细节
Lifestyle（佩戴场景）	小红书风格佩戴场景
Size Reference（尺寸参考）	干净的平铺 + 硬币对比

商家上传一张产品照，选填描述（比如"akoya 7-7.5mm，无调色，强光泽，近正圆，925 银扣"），拿到六张图加文案。每套成本？一杯蜜雪冰城都不到。

好看才是硬道理

第一版的材质分解图长得像工程图纸。白底、箭头、技术标注。准确但冰冷。没人想把这个发小红书。

产品之间的差异不在 AI 生图能力（每个竞品都有），在编辑美学。

Constellation 模板把材质分解重新想象成博物馆展览——每颗宝石像标本一样摆放在深炭色背景的展柜里，松散排列成星座图案。看起来像珠宝展览画册的一页，不是产品规格书。

Color DNA 模板把色彩解构成有机的水彩晕染，在纹理纸上流淌开来。珠宝放在天然亚麻布上，色彩向外扩散成艺术色块。设计师的手账，不是淘宝详情页。

这些模板在竞品里不存在。绘蛙和 WeShop 生成的是"模特戴产品"——有用但同质化。没人在给一条 50 块的银手链生成看起来像《Vogue Jewelry》内页的内容。

计划外的惊喜：原石变设计方案

做到一半，计划外的功能冒了出来。

珠宝商手里经常有散石——未镶嵌的蓝宝石、裸钻、原石翡翠——想做成成品。传统流程：

角色	成本
宝石鉴定师	200-500 元
珠宝设计师（手稿）	800-3,000 元
CAD 设计师（3D 渲染）	500-2,000 元
合计	1,500-5,500 元

识川能拍一张散石照片，生成完整的设计提案吗？

第一次尝试用写实 CAD 渲染风格。太通用——跟任何建模软件出来的一样。否掉。

第二次改成手绘水彩 + 铅笔速写，画在纹理纸上——跟真正的珠宝设计师呈现提案的方式一样。加上设计师签名（"Xingfan Xia" 英文手写体 + "夏星帆印"朱红篆刻章）。

这才对——人类设计师的提案，不是 AI 输出。

设计提案包含：水彩手稿、3D 概念渲染、佩戴预览、材质星图、情绪板、色彩基因页。六张图讲一个完整的设计故事。299 元一套，替代几千块的设计费。

Flash 够用吗？拉出来比一比

拿两个产品做了对比测试：Akoya 珍珠手链（简单）和 Candeer 多宝石戒指（复杂）。

分析速度： Flash-Lite 6.7 秒 vs Flash 15.5 秒 vs Pro 37.4 秒。分析这步 Flash 够用。

图片质量： Flash 平均 5.8-6.2 分。Pro 平均 8.3-8.4 分。差距巨大——Flash 连管扣都画不对，Pro 在材质细节上精准得多。

MVP 决策： 全用 Flash。够用就行，先验证再说。Pro 作为后续质量升级选项。每套成本差距可以忽略——速度差距（并行生成 ~30 秒 vs ~90 秒）影响体验。

一个意外发现：Gemini 能检测卖家描述和产品照片之间的矛盾。商家说"天然蓝宝石"照片看着像合成？分析会标记出来。可能成为一个信任功能。

一天，从想法到上线

完整时间线：

第 1-2 小时： 深度调研否掉云佩戴，确认内容生成机会
第 3-4 小时： 搭建分析管线，用 Akoya 珍珠手链测试
第 5-6 小时： 搭建 6 个内容模板，迭代美学方向
第 7-8 小时： 搭建前端（4 步流程：上传 → 分析 → 选模板 → 生成）
第 9-10 小时： 部署 Vercel，用 Upstash Redis 搭邀请码 + 额度系统
第 11-12 小时： 发现并验证原石设计提案功能
第 13 小时： AB 测试 Flash vs Pro，锁定架构决策

一个人。一天。复用了 ÉLAN 约 60% 的基础设施（Gemini 客户端、图片预处理、Vercel Blob、SSE 流式、Zustand 状态管理）。

新写的代码主要是分析 prompt、六个模板 prompt（带材质专属灯光）、和原石设计 prompt。

这就是在第三篇：超级个体里说的——AI 把试错成本压到接近零。验证整个产品的全部投入是一天时间加可以忽略不计的 Gemini API 调用费。

做完识川回头看 ÉLAN

从 C2C 产品衍生出 B2B 产品，看清了底层平台的本质。ÉLAN 输入自拍，做面部一致性，输出个人写真。识川输入产品照，做材质保真度，输出编辑级内容套图。管线一样。Prompt 不同。价值主张完全不同——一个让人变好看，一个让产品变好看。都用同一套 Gemini 多模态生成、同一套 SSE 流式、同一套 Vercel 基础设施。

护城河不在技术——在 prompt 工程和美学方向。Constellation 模板、Color DNA 概念、ÉLAN 的 VANITY_DESIGN_INSTRUCTIONS、材质专属灯光函数——这些是让输出看起来像编辑内容而不是 AI 生成的累积手艺。

定价：盯着你替代的东西定

定价策略就一个原则：锚定替代的东西，不是运行成本。

内容模式： 99 元/套（按需）或 399-699 元/月（10-30 套）。替代 1,100-3,100 元的摄影师 + 设计师 + 文案组合。便宜 10-30 倍。API 成本只占营收的零头，毛利率远超传统内容服务。

设计模式： 299 元/套。替代 1,500-5,500 元的鉴定师 + 设计师 + CAD 组合。便宜 5-18 倍。

这种利润率下，问题不是"跑得起跑不起"——"多快能找到需要的商家"。

起源是 ÉLAN 的衍生——同一套 Gemini 管线，不同的 prompt，不同的市场。

This post is also available in English.