GPT Image 2 做美妆电商产品图:口红、眼影、护肤 3 类瓶身与色号实操
美妆品类的产品图一到上新就卡住:口红金属管拍不出细腻金属感、眼影盘十二色上盘后色号漂移、精华玻璃瓶高光一打就过曝。截至 2026-04,图叮AI 已经把 GPT Image 2 跑过不少美妆订单,这篇按口红、眼影、护肤三大类拆开讲每类的痛点、参考图怎么搭、prompt 怎么写、以及哪些点人工仍然要盯。
图注:口红、眼影、护肤三大类各自有不同的材质难点,AI 切入点也不一样
为什么美妆这条线要单独讲
在讲三个品类之前,先把”美妆产品图为什么比一般品类难”说清楚,不然后面的参考图组合和 prompt 模板读起来没根。
美妆产品的买家决策路径跟服装鞋履完全不同。消费者会把详情页图放大到最大倍率看膏体切面、看盘内珠光、看瓶身透光。任何一个地方 AI 没画对,实物到手时退货理由直接写”色号跟图不一样""质感跟图不一样”。所以美妆图的及格线比很多品类都高——“看上去 90% 像”在这个品类里等同于不合格。
再加一层约束:美妆三大主材(金属电镀管、哑光压粉、透明玻璃)的光学表现都不容易。金属管是镜面反射 + 微观漫反射叠加,哑光粉体是次表面散射,玻璃瓶是折射 + 局部全反射。AI 模型学到的是这些现象的统计分布而不是真正的光路,所以 GPT Image 2 在美妆线上的最大价值不是替代精修,而是替代场景合成和色号扩展——把已经拍好的干净主体,放到昂贵棚景里,或者在一张主图基础上批量生成多个色号变体。
有了这层认知,下面三类的拆解才站得住。新读者也可以先看总体上线公告《GPT Image 2 在图叮AI 正式上线》补背景,价格从 0.06 元/张起,美妆场景单张成本跟外包一张精修相比差出两个量级。
第一类:口红 · 金属管身与色号批量
口红是美妆类目里最适合用 GPT Image 2 的一类,原因是主体结构稳定、色号需求量大、金属管在柔光下的表现 AI 训练数据覆盖得比较好。
图注:金属管身口红是 GPT Image 2 在美妆线表现最稳的一类主体
典型痛点 有三个。一是管身高光带控制不住——拍摄阶段随便打一盏光就容易把管体右侧烧成一条白线,细节全丢;二是色号上盘(口红膏体切面的颜色)和管身涂装颜色视觉上经常”对不上”,明明一支”豆沙色”成品,拍出来膏体偏冷、管身偏暖;三是品牌系列图的”一致性”——同一批十二个色号的口红,拍摄跨了两天换了灯位,后期再拉色号卡都有轻微色偏。
参考图组合 建议这样搭:1 张干净白底的主体正面图(管身锐利无抠图毛边)+ 1 张品牌调性图(比如该品牌官网已有的产品氛围大图)+ 1 张色卡参考图(把需要的膏体色号直接印在色卡上拍一张清晰图)。如果要做场景化主图,再加 1 张场景参考(如米色大理石台 + 丝绸手帕)。GPT Image 2 在图叮AI 上支持最多 5 张参考图,口红场景用到 3-4 张基本够了,再多反而让模型”不知道听谁的”。多参考图的搭法细则见《GPT Image 2 的 5 张参考图用法》。
prompt 模板 可以照这个骨架改:
keep the lipstick tube shape, metallic finish and proportions unchanged,
only change the background to warm beige marble with soft side light.
metallic cap: rose gold, soft specular highlight on left edge only,
no overblown reflection.
lipstick bullet color: muted mauve-pink (#C08480 reference),
matte finish, clean diagonal cut.
camera angle: 30 degrees front-right, product centered,
30% empty space on top for copy.
四个关键词建议尽量锁死:管身造型(keep unchanged)、高光位置(left edge only)、膏体色号(给十六进制色值 + 质感描述)、构图留白(给版式留接口)。缺了其中任何一个,生成图大概率会漂移。prompt 结构化写法可以对照《GPT Image 2 prompt 写法总结》这篇。
可能翻车点 有两个:一是金属管接缝处偶尔会出现 1-2 像素的”融合糊化”,要用 PS 反选边缘做一次锐化;二是同一系列批量生成多个色号时,膏体色号的一致性会比单张差约 15%,最好把十二个色号分成 3-4 组批次,每组用同一张主体图 + 同一条 prompt + 只改色号色值,批次内一致性会明显好于一把梭哈。口红色号批量生产的完整流程可以看《美妆 SKU 多色号批量生成》。
我们前阵子经手过一个国货品牌的秋冬口红系列图,12 个色号 + 3 种场景 = 36 张主图,原本外包报价小两千、工期四天。换成”摄影棚只拍一支裸管参考 + GPT Image 2 换色换景”的路径之后,出图在图叮AI 里跑了约四个小时,PS 人工补锐和贴字贴号字再花了半天,整体单张平均成本降到个位数元。这个订单里真正让客户满意的不是省钱,而是”12 个色号放在一张 3×4 系列图里,视觉一致性肉眼看不出差别”——这件事单靠摄影棚跨两天补拍反而更难做到,因为棚里换日期就等于换了一次环境光。
第二类:眼影 · 盘内多色与珠光哑光混排
眼影盘是美妆里最难的一类,难点集中在”盘内多色同时在场”。
图注:眼影盘十二色一次全在场,哑光和珠光质地混排,AI 最容易翻车的一类
典型痛点 三个。第一个是珠光与哑光混排时,AI 生成图里哑光色的质感容易”做出珠光味”——因为模型学到的”眼影”视觉特征里有相当比例来自带亮片的珠光色;第二个是盘格之间的分隔线,真实盘子是厚度均匀的塑料边框或磁吸凹槽,AI 生成时这条线经常画歪或画糊;第三个是内盖镜面反射的控制,镜面反射把盘内色全映射进去,用力不对整张图就成了”镜子里又一个眼影盘”的套娃视觉。
参考图组合 建议:1 张俯拍的干净盘内色块图(十二格都能看清)+ 1 张该品牌官方色号分布示意图(最好是平面矢量图,把每格色值标得清清楚楚)+ 1 张产品包装外壳参考图(盘身闭合状态)。场景化时可再加 1 张桌面 flatlay 参考,但眼影盘本身就是画面主角,场景留白不需要太多。
图注:把五张参考图平铺在桌面上排好,再决定哪几张喂给 GPT Image 2,能省掉一半漂移
prompt 模板:
eyeshadow palette, 12 shades in 3 rows × 4 columns grid,
keep the exact shade positions and color values from reference image 1.
palette frame: matte white plastic, 2mm uniform border between shades.
textures: shades 1-3-5-7-9-11 matte finish,
shades 2-4-6-8-10-12 shimmer with fine pearl particles.
inner lid mirror: visible but softly reflective,
do not duplicate the whole palette visually.
top-down flat lay, neutral beige paper background,
soft diffused light from above.
三个建议锁死的点:盘内色号位置(直接引用参考图 1)、哑光和珠光的分布(按格子编号区分)、镜面反射的收敛(softly reflective)。
可能翻车点:一是珠光亮片颗粒感经常偏大,像撒了闪粉而不是压粉里自带的细腻亮片——这点用当前 GPT Image 2 版本(截至 2026-04)还没法完全解决,生成后要人工在 PS 里用亮度/对比度局部压一下亮片区;二是色号 7 号和 8 号这种相近棕色,AI 生成时常会画成几乎同色,所以相近色号一定要在 prompt 里用色值拉开(比如 #8B5A3C vs #A47456);三是如果参考图的色号分布图分辨率太低,AI 会”瞎猜”格子顺序,导致十二色错位——参考图本身的清晰度比数量更重要。
眼影盘还有一个容易被忽视的点:出图交付之前最好让 QC 拿一把真实的盘子放在屏幕前肉眼对一次色。AI 生成的棕色系眼影在屏幕上看常常偏暖偏橘,跟实物放一起对比就会发现差了半个色阶,这种偏差走批量印刷的详情页几乎看不出来,但走小红书封面图(用户会拿截图对色买)就容易出事。一次对色投入大约 3-5 分钟,能过滤掉 70% 以上的色号退货投诉。
第三类:护肤 · 玻璃瓶反光与透光质感
护肤产品图的核心是瓶身的光学表现,特别是透明或半透明玻璃瓶的”高光位置 + 透光层次”这两件事。
图注:精华瓶左侧的高光带只铺 40% 高度不过曝,是这类图能不能过审的第一关
典型痛点 四个。一是高光带过曝——真实摄影棚里调高光要反复试拍,AI 一次就生成的图高光几乎全过曝;二是透光质感失真,液体本身有轻微琥珀色或乳化质感,AI 生成时常做成”一瓶白开水”或”一瓶奶昔”两个极端;三是瓶身标签(logo、产品名、规格)AI 无法准确复原,生成图里的文字基本都是模糊字符;四是压头/滴管的金属配件经常画错比例,压头过大或滴管过长都很常见。
参考图组合:1 张干净白底的主体图(瓶身 + 标签都要清晰)+ 1 张该品牌的环境氛围图(米色调 / 冷白调等品牌视觉基线)+ 1 张高光参考图(可以是其他高级品牌官网的瓶身高光处理方式,供 AI 学”高光应该落在哪”)。这组参考图喂进图叮AI 的 GPT Image 2 通道,单张成本从 0.06 元/张起算,一个中等订单里跑三十张变体也就十几块钱的量级。
prompt 模板:
serum glass bottle, keep bottle shape, label position and dropper
proportions unchanged from reference image 1.
glass: frosted matte on the body, transparent on the shoulder and neck,
warm amber liquid inside visible through transparent area.
highlight: single vertical highlight band on left edge,
covering bottom 40% of bottle height only, soft not overblown.
shadow: soft right-side shadow, bottle appears grounded on surface.
background: warm beige marble with subtle veining, shallow depth of field.
do not modify any text on the label.
两个关键约束:高光位置要给数值(bottom 40% of bottle height),防止 AI 把整个瓶身铺满白色高光;标签文字用”do not modify any text on the label”锁住,虽然这个指令对字面改动几乎兜不住(AI 依然会自行重绘文字),但能明显降低乱改概率。瓶身高光控制更细的做法单独写在《美妆瓶身高光控制》这一篇里。
可能翻车点:一是透明瓶肩位置的液位线经常画歪,生成图里液体”悬浮在瓶身中段”而不是有清晰的水平液面——要在 prompt 里加”clear horizontal liquid level line at 75% bottle height”;二是标签上的产品名和规格字几乎必定乱码,所以生成图的标签区域在交付前要用 PS 拉原始白底图的标签位贴回去(属于”AI 出壳,人工贴字”的标准做法);三是金属压头的反光方向经常和瓶身反光对不上(AI 生成时会独立判断每个部件的光向),交付前用 PS 统一压一层环境光图层可以对冲。
完整从拍摄到交付的护肤产品图全链路,可以对照《美妆电商图片全流程 SOP》那篇看,它讲的是”整条流水线怎么走”,这篇讲的是”GPT Image 2 在这条流水线的哪些工位可以切进来”,两者是互补关系。团队排班时也建议按这个分工来:摄影师负责拍主体和标签字,AI 负责跑场景和批量,PS 负责最后贴字和统一环境光,三个角色各做一件事不互相踩脚。
三类放一起看:哪步让 AI 做,哪步留给人
前面三个品类拆得很细,最后把视角拉高一层给一个统一判断:GPT Image 2 在美妆线上的最优工位是”已拍摄主体的场景扩展 + 色号变体”,而不是”从零生成一张新产品图”。截至 2026-04,我们经手的美妆订单里,真正跑得顺的都是这个模式——先让摄影棚把主体拍干净(白底或纯色底,一张就够),然后在图叮AI 的 GPT Image 2 通道里跑 10-30 张场景变体 / 色号变体,交付前在 PS 里做一次边缘锐化 + 高光压暗 + 标签字贴回。
那些”从零让 AI 生成一张新产品图”的需求,基本都卡在两个点:一是标签字画不对(AI 暂时没法准确生成中英文产品名和规格字符),二是材质质感会漂(哑光做出珠光味、玻璃做出塑料感)。这两件事在当前模型版本里还没法靠提示词完全兜住,建议直接退回”拍摄 + AI 补景”的混合模式。
至于什么时候该用它、什么时候该跳过,有几个简单的判断口径可以参考:主体结构简单且量大(口红、单瓶精华)→ 上;同一系列多色号同时在场(眼影盘、腮红盘)→ 慎上,准备做批次一致性校对;需要精准复原品牌标签的图(新品首图)→ 不上,老老实实拍。把这三条写在 brief 上,美妆组的出图节奏就会稳很多。
最后留一个观察给运营同学:图叮AI 这边跑美妆订单最显著的变化不是单张成本(0.06 元/张起的价格本来就已经很低了),而是设计师愿意尝试的场景数量明显变多了。以前棚拍一套成本摆在那儿,客户通常只敢试两三个主视觉方案;AI 链路上来之后,一个系列顺手跑十几个场景备选是常态,最后挑中的那张往往不是最早 brief 里写的那套,而是在中间第 8 张 / 第 11 张里跳出来的”意料之外但就是好看”的那张。这个”试错成本塌下来之后创造力被释放”的效应,可能比任何单点节省都更值得在团队里慢慢消化。
相关文章
AI 出图卡住时,不要只把提示词越写越长
提示词越写越长,往往说明流程已经卡住。把问题拆成素材、区域、步骤顺序和每轮验证,比继续堆描述词更容易让画面稳定可控可复盘。
粉底液色号图怎么修:统一质感,但不要把色号修跑
美妆电商的粉底液色号图可以优化质感、清理反光、统一背景,但不能让色号偏移。本文拆解色卡锚点和瓶身质感的处理边界。
中文 vs 英文 prompt 实测对比:跨境电商场景的 5 个差异
同一件雾面陶瓷面霜罐,中文 prompt 出来偏暖灰、英文 prompt 出来更纯白。截至 2026-04 在图叮AI 上跑了几百轮跨境出图后,我把中英文 prompt 在风格词、品牌术语、节日、平台规范、混合时机这 5 个点的差异拆开讲一遍,每个差异给实测对照、输出对比和适用场景。
AI 模型版本切换迁移 SOP:旧 prompt 适配新模型的 6 步检查
新模型一上线,老 prompt 第二天就失灵。本文按能力对照、prompt 兼容测试、参数翻译、风格关键词映射、批量回归、客户告知 6 步,给图叮AI 工作室一份 1-2 天可跑完的迁移清单。
推荐阅读
玻璃透明材质产品溶图:AI精准识别玻璃质感保留通透光影
用图叮AI产品溶图打光功能处理玻璃瓶、透明容器等透明材质产品的场景融合,AI自动适配折射、高光和通透感,两张素材即可出图。
潮玩手办从正面转侧面:智能转角度的边缘保持能力
用图叮智能转角度功能将国潮风格娃娃手办从正面生成侧面视角,实测产品轮廓特征的智能识别和边缘不拉伸效果。
商品图进 Photoshop 收尾前,先做这 6 个判断
AI 修图完成后,不是所有图都要进 Photoshop。先检查尺寸、色彩、文字、边缘、阴影和交付渠道,再决定是否人工收尾。
选区消除实操:一键去掉场景图中的多余物体
图叮AI选区消除功能实操,框选场景中的多余物体一键消除,背景自动填充,无需手动修补。