跳转到主内容
· 图叮AI团队

GPT Image 2 在服装鞋包电商的模特上身和 SKU 一致性:4 个典型场景实操

服装电商的痛在上身。平铺图便宜,但一挂到详情页就显得”没人气”;外拍模特有质感,但五种颜色五个尺码拍一轮下来预算见底。GPT Image 2 这轮能把参考图组合做到相对稳定,我们把服装店最常碰到的 4 个场景拆开讲,每个都给出参考图怎么搭、prompt 要怎么写、大约多久出一张、以及哪里最容易翻车。

买手店样衣展示橱窗场景 图注:服装电商的模特上身,本质是把”平铺图 + 人”两件事合成一张能传达穿着效果的成片。

为什么服装电商特别需要”上身 + 一致性”

先说为什么这件事在服装比在别的品类更刚需。3C、家居、美妆,拍一组主图基本就能交差,后续 SKU 换颜色大多靠调色。服装不行:同一件 T 恤有白、黑、浅灰、浅粉、军绿五个颜色,换色之后袖口的阴影、胸前的 logo 反光、布料垂坠感都会变。买家点进详情页看到的那张主视觉,决定了他愿不愿意往下翻价格。

老做法是请模特一天拍五个颜色,摄影 + 后期 + 模特档期三头赶,成本压在每件 SKU 上能到两三百块。改造之后,一组基础拍摄 + AI 换色换角度,边际成本降到每张几毛钱——但前提是 AI 出图不能崩:脸不能换、身材不能变、衣服版型不能走样。这正是 GPT Image 2 这一代(截至 2026-04)可以吃下的活。

关于基础能力和参考图机制,我们在 GPT Image 2 能力边界参考图组合玩法 里讲过,本文只聚焦服装场景怎么落地。

场景一:单款多色 SKU 一致性

适用卖点:同款多色 T 恤、连衣裙、卫衣、polo,颜色 3-8 个。

最高频的一个场景。品牌今年春季上了一款基础圆领 T,有 5 个颜色,需要 5 张详情主图,模特、姿势、光照、背景都要一致,只有衣服颜色不同。如果真人拍,模特得换 5 次衣服重复同一个姿势;AI 做则是一次拍摄 → 五次参考图投喂。

同款 T 恤 5 色 SKU 网格 图注:同一模特 + 同一姿势 + 5 色衣服的 SKU 宫格是服装电商最高频的需求之一。

参考图组合(5 张槽位用满 3 张):

  • 槽位 1:基础色(通常是白色或黑色)模特实拍上身图
  • 槽位 2:目标颜色的白底平铺图
  • 槽位 3:色卡或 Pantone 色块特写(防颜色漂移)

prompt 要点

参考图 1 为模特姿势与面部基准,保持模特身材、发型、面部特征、姿势、拍摄视角完全一致;参考图 2 为目标服装的版型与细节;参考图 3 为目标颜色。生成:模特穿着参考图 2 的 T 恤(颜色以参考图 3 为准),其他所有元素与参考图 1 保持一致。

耗时估算:单张 40-60 秒,5 色 SKU 串行跑约 5 分钟;批量时建议并发两路,控制在 3 分钟内。

可能翻车点

  1. 颜色漂移:只投一张成品图作为参考,模型容易把颜色做偏(浅粉变粉紫、军绿变墨绿)。靠色卡参考图把颜色拉回来,或者在 prompt 里加”颜色 hex 值 #E8A5B0 为准”辅助描述
  2. 袖口/领口细节掉边:某些颜色的布料明暗差异会让领口线条糊掉。验收时必须把 5 张并排放大 200% 对比,领口不齐就得重跑
  3. 模特微表情差异:就算姿势一样,嘴角和眼神可能每张略有浮动,要求极致一致的品牌方可以指定”面部与参考图 1 完全一致”

场景二:白底平铺图升级为模特上身图

适用卖点:没预算请模特、库里只有供应链白底平铺、上架急、SKU 多到拍不过来。

这是中小卖家的刚需。1688 拉来的白底平铺图,挂到详情页”像挂在衣架上没人气”,转化率比上身图差一截。以前要靠摄影师外拍,现在可以直接把平铺图喂给模型,2 分钟出一张上身图。

参考图组合(用 2-3 张):

  • 槽位 1:衣服的白底平铺图(正面、反面各一张更稳)
  • 槽位 2:目标模特风格参考(可以是品牌历次拍过的模特、Pinterest 截图、甚至一张 AI 预生成的”标准脸”)
  • 槽位 3(可选):目标场景(街拍背景、工作室纯色背景等)

prompt 要点

参考图 1 为服装款式和颜色的绝对依据(版型、颜色、logo 位置、扣子细节必须还原),参考图 2 为模特的面部与体型依据。生成一张模特穿着参考图 1 服装的上身照,模特需与参考图 2 保持一致,场景为浅灰无缝纸商业棚拍,全身或四分之三身,光线均匀。

耗时估算:单张 60-90 秒(含一次重跑的缓冲);熟练后一件衣服 2-3 分钟出三张候选。

可能翻车点

  1. 版型走样:平铺图是圆领,出图变 V 领;平铺是短袖,出图变中袖。prompt 里必须逐条锁死关键细节(“圆领、短袖、下摆直剪、无口袋”)
  2. logo 扭曲:品牌 logo 在 AI 生成时经常变成”类似 logo 的糊团”。解决办法是 AI 出图后在图叮 AI 里二次修图,把 logo 局部替换回高清原图
  3. 布料质感偏塑料感:廉价感来自光照平均、材质模糊。出图时在 prompt 里加入布料描述(“棉质平纹、自然垂坠、有轻微起皱”),能显著改善

白底升级的交付流程我们在 服装电商试穿交付 里讲过闭环,可以对照看。

场景三:多角度展示(正/侧/背)

适用卖点:外套、连衣裙、有设计细节的服装(腰带、褶皱、后背剪裁);详情页需要多角度展示。

同款外套正侧背三角度 图注:三角度并排是服装详情页的标配,模特身材、发型、妆容在三帧中必须完全一致。

详情页里三角度展示(正面、侧面 90 度、背面)是展示版型的最佳方式。真人拍需要摄影师盯着模特严格站在同一个位置转身,AI 的挑战在于三张图里”是同一个人穿同一件衣服”。

参考图组合(3 槽位各占用 1 张):

  • 槽位 1:模特正面基准照(已上身成品)
  • 槽位 2:衣服的平铺或白底照(正、背各一张最好)
  • 槽位 3(生成侧面/背面时用):之前生成的正面成品图本身回投作锚点

prompt 要点(以生成侧面为例):

参考图 1 为模特正面基准(保持面部、身材、发型、妆容、站姿重心完全一致),参考图 2 为服装细节依据。生成同一模特同一服装的侧面 90 度视角,模特朝向画面左侧,双手自然垂放,背景与参考图 1 保持一致的浅米色无缝纸。

耗时估算:三张一组大约 3-5 分钟;第一张做好后,后两张用它做锚点能显著降低翻车率。

可能翻车点

  1. 身材比例漂移:侧面图中模特突然”瘦了”或”高了”。必须把正面图作为参考图 1,明确要求身材比例一致
  2. 背面剪裁走样:衣服的后背如果有特殊剪裁(露背、绑带、拉链),AI 常常自己发挥。必须有背面平铺图作为参考图 2
  3. 光影方向不一致:三张图的光源方向要统一,否则拼起来像三次拍摄。在 prompt 里锁死”光源来自画面右上方 45 度”

多角度的更完整流程可以参考 服装虚拟试穿多角度工作流,那篇按 phase 走了一遍完整交付。

场景四:上新专题海报

适用卖点:品牌每月上新、季节主题活动、双十一双十二大促、私域朋友圈首图。

春季上新多单品 banner 图注:上新 banner 把 5-10 件单品合成一张画面,考验的是构图和光影一致性。

一张 banner 上要出现 5-10 件单品,如果每件都找模特拍再用 PS 合成,成本最起码五位数。AI 能做的事是先把”模特 + 单品”的基础素材批量生成,再在一张大画布上重新构图。这不是纯一张 prompt 出图能完成的,需要两阶段。

工作流两阶段

阶段 1 · 生成素材库

  • 针对 5-10 件主推单品,每件用场景二的流程生成 1-2 张模特上身图
  • 按品牌 VI 规范统一背景色(比如全部米白无缝纸)
  • 成品保留到同一文件夹

阶段 2 · 合成构图

可以走两条路:

  1. 全 AI 合成:用 GPT Image 2 的多图参考能力,把 3-5 张阶段 1 的成品作为参考图,在 prompt 里描述构图(“左侧一位穿针织衫的女模特,中间陈列三件平铺服装,右侧一位穿风衣的女模特,背景浅米色,光源均匀”)。优点是快,缺点是单品细节可能走样
  2. AI + PS 半自动:阶段 1 AI 出素材,阶段 2 在图叮 AI 的画布里手动拖拽合成 + 统一调色。优点是可控,缺点是需要一点设计基础

prompt 要点(走全 AI 合成路线):

以参考图 1、2、3、4 为构图元素依据(不可改变其中服装的款式与颜色),生成一张横版春季上新 banner:画面左侧为参考图 1 的模特造型,画面中间陈列参考图 3、4 的平铺服装,画面右侧为参考图 2 的模特造型,画面左上留白约 20% 用于后期叠加品牌标题,背景浅米色无缝纸,光源柔和均匀,整体风格克制高级商业时装感。

耗时估算:阶段 1 每件 2-3 分钟,5 件约 15 分钟;阶段 2 全 AI 合成 1-2 分钟出图 + 2-3 次迭代,约 10 分钟;总计 25-30 分钟出一张可用 banner。比外拍节省至少两个工作日。

可能翻车点

  1. 单品细节失真:合成时某件衣服的领口从圆领变成 V 领。阶段 2 可以分两张 banner 跑(每张只合成 2-3 件单品),再 PS 拼起来
  2. 模特脸变形:画面中模特太小(占比 < 1/4)时,脸常常糊成一团。解决办法是 banner 里模特占比别太小,或者事后局部替换脸部
  3. 品牌色走偏:画面里某件 T 恤的蓝色不是品牌指定的 Pantone 色。必须在 prompt 里精确给 hex,并在验收阶段用品牌 VI 色卡对比

一次真实的翻车

写到这里讲一个具体事件。2026-03 月有一家义乌的基础款服装卖家,5 款 T 恤 × 4 色 SKU = 20 张详情主图,按场景一的流程跑。前 3 款跑得很顺,到第 4 款出问题:模特的脸在 4 个颜色里”有三张是同一张,有一张明显变了个人”。

回头查参考图,发现他们前 3 款用的是同一个模特基准照(一张四分之三身正面),到第 4 款换成了另一张基准照(全身侧身四分之三)——两张基准照本来就不是同一个角度,模型在跨参考时做了”内插式”的面部推断,结果就是一张脸换了人。

解决办法是把所有 SKU 的基准照锁定成同一张,哪怕角度不完美也不换。从那之后他们的 SKU 主图都有一个”基准照档案”,每次拍摄第一件都拍一张大特写做永久锚点。这是那种文档里写不出来但一定要自己踩一次的细节。

4 个场景的选择顺序

按落地优先级排:

  1. 场景二优先做(白底升级模特上身)——ROI 最高、门槛最低、对 SKU 图质量提升最明显
  2. 场景一紧跟(单款多色 SKU)——熟悉参考图用法后,单款多色是批量出图的主战场
  3. 场景三按需(多角度)——如果你的品类以基础款为主(T 恤、卫衣),一张正面图就够用;以设计款为主(外套、连衣裙)才值得做三角度
  4. 场景四最后(上新 banner)——需要设计审美 + 图叮 AI 画布操作基础,适合有设计师的品牌

关于如何选择合适的 prompt 模板,prompt 写作模式 给了一组可复用的模板骨架;想了解 GPT Image 2 上线图叮 AI 的公告与价格,可以看 GPT Image 2 上线公告,这里只提一句:0.06 元/张起的定价让服装电商批量出图的边际成本降到真人拍摄的 1% 不到。

写在最后

服装电商不是最早用 AI 生图的品类,却可能是被 AI 改变最彻底的品类——因为这个行业天然存在”SKU 爆炸 + 模特贵”的结构性矛盾。四个场景合起来其实是一套渐进式的替换路径:从最小成本的白底升级,到批量 SKU 一致性,到完整的多角度详情页,最后到需要审美判断的 banner 合成。

没有哪个店铺应该一次性铺开做完四个场景。先从场景二做通一个 SKU,看着自己店铺里的第一件”从平铺变成了模特上身”的 T 恤能跑出高于原来 3-5 个点的 CTR,那一刻你会明白为什么要走这条路。

本文技术细节基于 GPT Image 2 截至 2026-04 的公开能力描述;定价、平台规则以图叮 AI 官方公告最新版为准。

相关文章

推荐阅读