自拍 App 怎么拐去做了珠宝
从云佩戴到产品摄影的转型
朋友看了 ÉLAN,眼睛亮了:"做珠宝云佩戴。小商家拍不起照片,让客户在线上试戴。AR + AI。市场巨大。"
她写了一份完整的调研报告。定价模型、竞品分析、技术架构、7 天实施计划。很认真。
但方向不对。
20 分钟,一份计划就死了
在写任何代码之前,我让 Claude 跑了四个维度的深度调研:竞争格局、技术成熟度、商业模型、合规风险。
20 分钟,结果回来了。三个致命问题:
巨头免费做了。 淘宝和京东已经内置 AR 试戴。小商家不可能跟免费竞争。
定价算不过来。 方案定价 1980 元/月,但目标客户——小珠宝商——年均营收才 3 万。一个工具吃掉 6.6% 的毛收入?没人付。
合规真的难。 中国 2025 年《人脸识别技术应用安全管理办法》要求设备端存储、单独知情同意、影响评估。报告说"合规零难度",这不对。
计划被否了。但底层直觉是对的——小珠宝商确实需要负担得起的视觉内容。问题是:什么形态?
方向不对,但直觉没错
小珠宝商有一个非常具体的痛点。他们需要专业产品图发小红书、淘宝、微信。目前的供应链:
| 角色 | 单套成本 |
|---|---|
| 摄影师 | 800-2,000 元 |
| 平面设计师 | 200-800 元 |
| 文案 | 100-300 元 |
| 合计 | 1,100-3,100 元 |
卖 50-200 块的银饰,请不起这套班子。大多数商家就用手机随便拍一张,然后纳闷为什么卖不动。
我意识到:ÉLAN 的 Gemini 管线已经能做 90%。上传一张照片,注入一段详细的 prompt,拿到风格化输出。区别只是:
- ÉLAN:输入自拍 → 输出本人写真
- 识川:输入产品照 → 输出产品内容套图
同一套管线。不同的 prompt。同一天。
传一张照片,出六张大片
识川(Shichuan)建在一个两步 AI 管线上:
第一步:分析。 Gemini Flash 分析产品照片加卖家描述,输出结构化 JSON:材质、宝石细节(切工/颜色/数量/镶嵌/特殊效果)、工艺、色彩、卖点、小红书文案。大约 7 秒。
第二步:生成。 每个选中的模板注入分析数据,生成编辑级图片。所有模板并行跑。
六个模板:
| 模板 | 生成内容 |
|---|---|
| Hero(产品主图) | 棚拍级产品照,材质专属灯光 |
| Constellation(宝石星图) | 博物馆陈列风格——宝石被提取为标本,在深色背景上呈星座排列 |
| Color DNA(色彩基因) | 珠宝放在织物上,旁边是解构其色彩的水彩色块 |
| Craft Detail(工艺微距) | 极限微距拍摄工艺细节 |
| Lifestyle(佩戴场景) | 小红书风格佩戴场景 |
| Size Reference(尺寸参考) | 干净的平铺 + 硬币对比 |
商家上传一张产品照,选填描述(比如"akoya 7-7.5mm,无调色,强光泽,近正圆,925 银扣"),拿到六张图加文案。每套成本?一杯蜜雪冰城都不到。
好看才是硬道理
第一版的材质分解图长得像工程图纸。白底、箭头、技术标注。准确但冰冷。没人想把这个发小红书。
这是我意识到产品真正差异化的时刻——不是 AI 生图能力(每个竞品都有),而是编辑美学。
Constellation 模板把材质分解重新想象成博物馆展览——每颗宝石像标本一样摆放在深炭色背景的展柜里,松散排列成星座图案。看起来像珠宝展览画册的一页,不是产品规格书。
Color DNA 模板把色彩解构成有机的水彩晕染,在纹理纸上流淌开来。珠宝放在天然亚麻布上,它的色彩向外扩散成艺术色块。看起来像设计师的手账,不是淘宝详情页。
这些模板在竞品里不存在。绘蛙和 WeShop 生成的是"模特戴产品"——有用但同质化。没有人在给一条 50 块的银手链生成看起来像《Vogue Jewelry》内页的内容。
计划外的惊喜:原石变设计方案
做到一半,一个计划外的功能冒了出来。
珠宝商手里经常有散石——未镶嵌的蓝宝石、裸钻、原石翡翠——想做成成品。传统流程:
| 角色 | 成本 |
|---|---|
| 宝石鉴定师 | 200-500 元 |
| 珠宝设计师(手稿) | 800-3,000 元 |
| CAD 设计师(3D 渲染) | 500-2,000 元 |
| 合计 | 1,500-5,500 元 |
如果识川能拍一张散石照片,生成完整的设计提案呢?
第一次尝试用的是写实 CAD 渲染风格。太通用了——看起来跟任何建模软件出来的一样。否掉。
第二次改成手绘水彩 + 铅笔速写,画在纹理纸上——跟真正的珠宝设计师呈现提案的方式一样。加上设计师签名("Xingfan Xia" 英文手写体 + "夏星帆印"朱红篆刻章)。
这才对——看起来像人类设计师的提案,不是 AI 输出。
设计提案包含:水彩手稿、3D 概念渲染、佩戴预览、材质星图、情绪板、色彩基因页。六张图讲一个完整的设计故事。299 元一套,替代几千块的设计费。
Flash 够用吗?拉出来比一比
我拿两个产品做了对比测试:Akoya 珍珠手链(简单)和 Candeer 多宝石戒指(复杂)。
分析速度: Flash-Lite 6.7 秒 vs Flash 15.5 秒 vs Pro 37.4 秒。分析这步 Flash 够用。
图片质量: Flash 平均 5.8-6.2 分。Pro 平均 8.3-8.4 分。差距巨大——Flash 连管扣都画不对,Pro 在材质细节上精准得多。
MVP 决策: 全用 Flash。够用就行,先验证再说。Pro 作为后续质量升级选项。两者的每套成本差距可以忽略——但速度差距(并行生成 ~30 秒 vs ~90 秒)影响体验。
一个意外发现:Gemini 能检测卖家描述和产品照片之间的矛盾。商家说"天然蓝宝石"但照片看着像合成的?分析会标记出来。这可能成为一个信任功能。
一天,从想法到上线
完整时间线:
- 第 1-2 小时: 深度调研否掉云佩戴,确认内容生成机会
- 第 3-4 小时: 搭建分析管线,用 Akoya 珍珠手链测试
- 第 5-6 小时: 搭建 6 个内容模板,迭代美学方向
- 第 7-8 小时: 搭建前端(4 步流程:上传 → 分析 → 选模板 → 生成)
- 第 9-10 小时: 部署 Vercel,用 Upstash Redis 搭邀请码 + 额度系统
- 第 11-12 小时: 发现并验证原石设计提案功能
- 第 13 小时: AB 测试 Flash vs Pro,锁定架构决策
一个人。一天。复用了 ÉLAN 约 60% 的基础设施(Gemini 客户端、图片预处理、Vercel Blob、SSE 流式、Zustand 状态管理)。
新写的代码主要是分析 prompt、六个模板 prompt(带材质专属灯光)、和原石设计 prompt。
这就是我在第三篇:超级个体里说的——AI 把试错成本压到接近零。验证整个产品的全部投入是一天时间加可以忽略不计的 Gemini API 调用费。
做完识川回头看 ÉLAN
从 C2C 产品衍生出 B2B 产品,反而让我看清了底层平台的本质:
| 维度 | ÉLAN(C2C) | 识川(B2B) |
|---|---|---|
| 输入 | 自拍 | 产品照 |
| 核心挑战 | 面部一致性 | 材质保真度 |
| 输出 | 个人写真 | 编辑级内容套图 |
| 价值锚点 | "我好好看" | "我的产品好高级" |
| 定价 | 消费者订阅 | 按套或月度额度 |
管线一样。Prompt 不同。价值主张正交。一个让人变好看,一个让产品变好看。都用同一套 Gemini 多模态生成、同一套 SSE 流式、同一套 Vercel 基础设施。
护城河不在技术——在 prompt 工程和美学方向。Constellation 模板、Color DNA 概念、ÉLAN 的 VANITY_DESIGN_INSTRUCTIONS、材质专属灯光函数——这些是让输出看起来像编辑内容而不是 AI 生成的累积手艺。
定价:盯着你替代的东西定
定价策略就一个原则:锚定你替代的东西,不是你的运行成本。
内容模式: 99 元/套(按需)或 399-699 元/月(10-30 套)。替代 1,100-3,100 元的摄影师 + 设计师 + 文案组合。便宜 10-30 倍。API 成本只占营收的零头,毛利率远超传统内容服务。
设计模式: 299 元/套。替代 1,500-5,500 元的鉴定师 + 设计师 + CAD 组合。便宜 5-18 倍。
这种利润率下,问题不是"跑得起跑不起"——是"多快能找到需要的商家"。
这是"造识川"系列的第一篇。起源是 ÉLAN 的衍生——同一套 Gemini 管线,不同的 prompt,不同的市场。
有时候最好的产品想法来自一份不靠谱的商业计划。第二篇把珠宝 MVP 扩展到全品类。
This post is also available in English.