ENZH

自拍 App 怎么拐去做了珠宝

从云佩戴到产品摄影的转型从云佩戴到产品摄影的转型

朋友看了 ÉLAN,眼睛亮了:"做珠宝云佩戴。小商家拍不起照片,让客户在线上试戴。AR + AI。市场巨大。"

她写了一份完整的调研报告。定价模型、竞品分析、技术架构、7 天实施计划。很认真。

但方向不对。


20 分钟,一份计划就死了

在写任何代码之前,我让 Claude 跑了四个维度的深度调研:竞争格局、技术成熟度、商业模型、合规风险。

20 分钟,结果回来了。三个致命问题:

巨头免费做了。 淘宝和京东已经内置 AR 试戴。小商家不可能跟免费竞争。

定价算不过来。 方案定价 1980 元/月,但目标客户——小珠宝商——年均营收才 3 万。一个工具吃掉 6.6% 的毛收入?没人付。

合规真的难。 中国 2025 年《人脸识别技术应用安全管理办法》要求设备端存储、单独知情同意、影响评估。报告说"合规零难度",这不对。

计划被否了。但底层直觉是对的——小珠宝商确实需要负担得起的视觉内容。问题是:什么形态?


方向不对,但直觉没错

小珠宝商有一个非常具体的痛点。他们需要专业产品图发小红书、淘宝、微信。目前的供应链:

角色单套成本
摄影师800-2,000 元
平面设计师200-800 元
文案100-300 元
合计1,100-3,100 元

卖 50-200 块的银饰,请不起这套班子。大多数商家就用手机随便拍一张,然后纳闷为什么卖不动。

我意识到:ÉLAN 的 Gemini 管线已经能做 90%。上传一张照片,注入一段详细的 prompt,拿到风格化输出。区别只是:

  • ÉLAN:输入自拍 → 输出本人写真
  • 识川:输入产品照 → 输出产品内容套图

同一套管线。不同的 prompt。同一天。


传一张照片,出六张大片

识川(Shichuan)建在一个两步 AI 管线上:

第一步:分析。 Gemini Flash 分析产品照片加卖家描述,输出结构化 JSON:材质、宝石细节(切工/颜色/数量/镶嵌/特殊效果)、工艺、色彩、卖点、小红书文案。大约 7 秒。

第二步:生成。 每个选中的模板注入分析数据,生成编辑级图片。所有模板并行跑。

六个模板:

模板生成内容
Hero(产品主图)棚拍级产品照,材质专属灯光
Constellation(宝石星图)博物馆陈列风格——宝石被提取为标本,在深色背景上呈星座排列
Color DNA(色彩基因)珠宝放在织物上,旁边是解构其色彩的水彩色块
Craft Detail(工艺微距)极限微距拍摄工艺细节
Lifestyle(佩戴场景)小红书风格佩戴场景
Size Reference(尺寸参考)干净的平铺 + 硬币对比

商家上传一张产品照,选填描述(比如"akoya 7-7.5mm,无调色,强光泽,近正圆,925 银扣"),拿到六张图加文案。每套成本?一杯蜜雪冰城都不到。


好看才是硬道理

第一版的材质分解图长得像工程图纸。白底、箭头、技术标注。准确但冰冷。没人想把这个发小红书。

这是我意识到产品真正差异化的时刻——不是 AI 生图能力(每个竞品都有),而是编辑美学

Constellation 模板把材质分解重新想象成博物馆展览——每颗宝石像标本一样摆放在深炭色背景的展柜里,松散排列成星座图案。看起来像珠宝展览画册的一页,不是产品规格书。

Color DNA 模板把色彩解构成有机的水彩晕染,在纹理纸上流淌开来。珠宝放在天然亚麻布上,它的色彩向外扩散成艺术色块。看起来像设计师的手账,不是淘宝详情页。

这些模板在竞品里不存在。绘蛙和 WeShop 生成的是"模特戴产品"——有用但同质化。没有人在给一条 50 块的银手链生成看起来像《Vogue Jewelry》内页的内容。


计划外的惊喜:原石变设计方案

做到一半,一个计划外的功能冒了出来。

珠宝商手里经常有散石——未镶嵌的蓝宝石、裸钻、原石翡翠——想做成成品。传统流程:

角色成本
宝石鉴定师200-500 元
珠宝设计师(手稿)800-3,000 元
CAD 设计师(3D 渲染)500-2,000 元
合计1,500-5,500 元

如果识川能拍一张散石照片,生成完整的设计提案呢?

第一次尝试用的是写实 CAD 渲染风格。太通用了——看起来跟任何建模软件出来的一样。否掉。

第二次改成手绘水彩 + 铅笔速写,画在纹理纸上——跟真正的珠宝设计师呈现提案的方式一样。加上设计师签名("Xingfan Xia" 英文手写体 + "夏星帆印"朱红篆刻章)。

这才对——看起来像人类设计师的提案,不是 AI 输出。

设计提案包含:水彩手稿、3D 概念渲染、佩戴预览、材质星图、情绪板、色彩基因页。六张图讲一个完整的设计故事。299 元一套,替代几千块的设计费。


Flash 够用吗?拉出来比一比

我拿两个产品做了对比测试:Akoya 珍珠手链(简单)和 Candeer 多宝石戒指(复杂)。

分析速度: Flash-Lite 6.7 秒 vs Flash 15.5 秒 vs Pro 37.4 秒。分析这步 Flash 够用。

图片质量: Flash 平均 5.8-6.2 分。Pro 平均 8.3-8.4 分。差距巨大——Flash 连管扣都画不对,Pro 在材质细节上精准得多。

MVP 决策: 全用 Flash。够用就行,先验证再说。Pro 作为后续质量升级选项。两者的每套成本差距可以忽略——但速度差距(并行生成 ~30 秒 vs ~90 秒)影响体验。

一个意外发现:Gemini 能检测卖家描述和产品照片之间的矛盾。商家说"天然蓝宝石"但照片看着像合成的?分析会标记出来。这可能成为一个信任功能。


一天,从想法到上线

完整时间线:

  • 第 1-2 小时: 深度调研否掉云佩戴,确认内容生成机会
  • 第 3-4 小时: 搭建分析管线,用 Akoya 珍珠手链测试
  • 第 5-6 小时: 搭建 6 个内容模板,迭代美学方向
  • 第 7-8 小时: 搭建前端(4 步流程:上传 → 分析 → 选模板 → 生成)
  • 第 9-10 小时: 部署 Vercel,用 Upstash Redis 搭邀请码 + 额度系统
  • 第 11-12 小时: 发现并验证原石设计提案功能
  • 第 13 小时: AB 测试 Flash vs Pro,锁定架构决策

一个人。一天。复用了 ÉLAN 约 60% 的基础设施(Gemini 客户端、图片预处理、Vercel Blob、SSE 流式、Zustand 状态管理)。

新写的代码主要是分析 prompt、六个模板 prompt(带材质专属灯光)、和原石设计 prompt。

这就是我在第三篇:超级个体里说的——AI 把试错成本压到接近零。验证整个产品的全部投入是一天时间加可以忽略不计的 Gemini API 调用费。


做完识川回头看 ÉLAN

从 C2C 产品衍生出 B2B 产品,反而让我看清了底层平台的本质:

维度ÉLAN(C2C)识川(B2B)
输入自拍产品照
核心挑战面部一致性材质保真度
输出个人写真编辑级内容套图
价值锚点"我好好看""我的产品好高级"
定价消费者订阅按套或月度额度

管线一样。Prompt 不同。价值主张正交。一个让人变好看,一个让产品变好看。都用同一套 Gemini 多模态生成、同一套 SSE 流式、同一套 Vercel 基础设施。

护城河不在技术——在 prompt 工程和美学方向。Constellation 模板、Color DNA 概念、ÉLAN 的 VANITY_DESIGN_INSTRUCTIONS、材质专属灯光函数——这些是让输出看起来像编辑内容而不是 AI 生成的累积手艺。


定价:盯着你替代的东西定

定价策略就一个原则:锚定你替代的东西,不是你的运行成本。

内容模式: 99 元/套(按需)或 399-699 元/月(10-30 套)。替代 1,100-3,100 元的摄影师 + 设计师 + 文案组合。便宜 10-30 倍。API 成本只占营收的零头,毛利率远超传统内容服务。

设计模式: 299 元/套。替代 1,500-5,500 元的鉴定师 + 设计师 + CAD 组合。便宜 5-18 倍。

这种利润率下,问题不是"跑得起跑不起"——是"多快能找到需要的商家"。


这是"造识川"系列的第一篇。起源是 ÉLAN 的衍生——同一套 Gemini 管线,不同的 prompt,不同的市场。

有时候最好的产品想法来自一份不靠谱的商业计划。第二篇把珠宝 MVP 扩展到全品类。


This post is also available in English.

造识川Part 1 of 2
← PrevNext →

© Xingfan Xia 2024 - 2026 · CC BY-NC 4.0