AI 生图参考图包交付 SOP:主商品、材质锚点和禁改字段怎么写清楚
这篇解决一个很具体的问题:给 AI 生图前,参考图包到底怎么交,才能让生成图既有场景感,又不把商品改成另一件货。做完这 5 步,你会得到一份能给运营、修图师和审核人共用的参考包:一张主商品基准图,几张材质锚点,若干场景参考,一份禁改字段表,再加一张首轮返检样张。
近期团队已经反复讨论过“AI 生图场景图 vs 原图精修”和“场景图品牌一致性返检”。这篇不再讨论要不要生图,也不再重复品牌色检查,而是往前移一步:出图前,参考图包怎么准备。
图注:参考图包先分层,后面返检才有基准。
Step 1:先选一张主商品 ground truth
先别急着收集十几张“好看的参考”。第一步只做一件事:选出一张主商品 ground truth。
这张图不一定最漂亮,但要最可信。它要能回答四个问题:商品真实外轮廓是什么,主色是什么,关键结构在哪,比例关系能不能量。比如护肤品套装要看瓶身高度、瓶盖比例、泵头方向和外盒关系;手机配件要看孔位、按键、边缘厚度和摄像头圈;服装配件要看织纹、吊牌、边线和尺码信息。
很多返工都不是“模型不懂美学”,而是没有 ground truth。运营给了 5 张图,每张都承担一点信息,模型最后只能做平均。平均出来的图很顺,但商品身份被稀释。我的做法是把基准图文件名写得很硬:sku-032-ground-truth-main.jpg。后面任何图,只要和它在形状、比例、颜色、结构上冲突,就先判为需复核。
举个假设场景,不计入真实项目数据:一款护手霜有管身正面、瓶盖特写、礼盒图、生活场景图和模特手持图。ground truth 应该选管身正面或 45 度实拍,不要选生活场景图。生活场景图可以管光线,但不该管管身比例。
图注:基准图不求漂亮,求能量、能对、能追溯。
Step 2:补齐材质锚点和细节裁片
主商品图锁大形,材质锚点锁“它到底是什么材料”。这两类图不能混用。
材质锚点最好是局部裁片,而不是另一张完整海报。金属要给高光边缘,透明塑料要给折射边,纸盒要给纸纹和压痕,布料要给织纹和缝线,玻璃要给厚度和边缘反光。每个锚点只承担一个任务,不要让一张图同时负责材质、构图和氛围。
团队实际经验里,材质漂移最常出现在“高级感”这个词后面。模型会把金属磨成镜面,把布料磨成塑料,把纸盒磨成无纹理卡片。参考图包里如果没有材质锚点,提示词写“保留真实材质”作用有限,因为模型不知道真实材质的参照物是哪一张。
我建议按材料命名:material-metal-brushed.jpg、material-paper-box-grain.jpg、material-clear-plastic-edge.jpg。命名不用花哨,但要让接手的人一眼知道这张图的职责。团队可以把这类图叫做“不可争论图”:如果生成图和材质锚点冲突,就不靠主观审美投票,直接回到锚点判断。
图注:材质锚点越窄,模型越不容易乱学。
Step 3:把场景参考和商品参考分开
场景参考只能管场景。它可以告诉模型:桌面是什么材质,光从哪里来,背景是厨房、浴室、露营地还是直播间,画面是 3:4、1:1 还是 16:9。它不能告诉模型商品长什么样。
这个边界很关键。很多团队会把一张竞品海报、一张客户原图、一张小红书截图和一张包装照片放进同一个文件夹,统称“参考”。模型看不到你脑子里的分工。它可能从竞品海报学到了场景,也顺手学走了竞品的瓶型;可能从小红书截图学到了光线,也学走了人物手势和不该出现的文字贴纸。
参考包里建议分三个文件夹:01-product-ground-truth、02-material-anchors、03-scene-mood-only。第三个文件夹的每张图都要在提示词里声明:只参考空间、光线、构图,不参考商品结构、logo、包装文字和数量关系。
这一步和前面写过的品牌一致性返检不同。品牌一致性是出图后检查有没有偏;这里是出图前把职责切开,减少偏离发生。两者顺序不能反。
Step 4:写出禁改字段而不是形容词
“保持真实”“不要乱改”“产品一致”这些话太软。真正有用的是禁改字段。
禁改字段要写成可核对对象:logo 位置、包装标签、容量数字、色号、批次号、孔位数量、按键形状、套装数量、吊牌、证书编号、瓶口方向、透明件厚度、配件相对大小。能写名词就不要写形容词,能写位置就不要写感觉。
一个可用的写法是:
do not change: product silhouette, bottle cap height, pump direction, label layout, color code area, package quantity, shadow contact under product
中文项目也可以写中文,但要避免空词:
禁改:瓶身轮廓、瓶盖高度、泵头方向、标签版式、色号区、套装数量、商品底部接触阴影。
标签、规格、数量、孔位和接触阴影,是商品图返工里反复出现的高风险点。它们有一个共同特征:单张图看不一定丑,但会改变买家理解。禁改字段不是给模型看的装饰句,是给人类返检时画框用的索引。
图注:禁改字段要能画框,不能只写态度。
Step 5:用首轮样张反查参考包
首轮出图后,不要先挑“最好看”的一张。先做偏离表。
偏离表分四列:主商品偏离、材质偏离、信息偏离、场景偏离。主商品偏离看轮廓、比例、结构;材质偏离看金属、玻璃、布料、纸盒是否变质;信息偏离看标签、文字、数字、数量;场景偏离看光线、透视、背景是否符合需求。每一列只打三种状态:通过、需重跑、需补参考。
如果主商品偏离,多半是 ground truth 不够强,或提示词没有锁商品结构。如果材质偏离,多半是材质锚点缺失或被场景参考污染。如果信息偏离,通常不是靠继续出图解决,而是要遮挡、降清晰度、局部保留原图,或者让运营确认是否需要实拍补图。
这一步的价值在于反向修正参考包,而不是在 20 张候选里赌运气。我更愿意在第一轮就停下来补一张材质锚点,也不愿意拿一张“差不多”的图继续扩写详情页。前者是成本,后者是债。
最后提醒一个常见坑:参考图越多,不一定越稳。图多但职责不清,模型会把信号互相平均;图少但职责明确,反而更容易返检。先分层,再生成。先写禁改字段,再谈氛围。这个顺序别反过来。
相关文章
AI 场景生图上线前返检 FAQ:主体、材质、比例和安全区别漏
AI 场景生图好看不等于能上线。本文把商品主体、材质、比例、文字标签和多尺寸安全区拆成 6 个返检问题,帮电商团队判断该修、该重生还是该退回原图。
AI 出图候选稿怎么选:别让最好看的一张破坏整套 SKU 一致性
AI 生图常见的返工,不是没有好图,而是团队把单张最好看的稿子放进了一组不一致的 SKU。本文给一套候选稿 review SOP,帮运营、修图和外包先守住商品证据,再决定哪张图能进详情页。
AI 商品图参考图越多越好吗:先定主参考、禁改区和回滚图
AI 商品图不是参考图越多越稳。本文从工时、返工和证据链三条线,判断什么时候多给参考,什么时候先定主参考、禁改区和回滚图。
AI 模型版本切换迁移 SOP:旧 prompt 适配新模型的 6 步检查
新模型一上线,老 prompt 第二天就失灵。本文按能力对照、prompt 兼容测试、参数翻译、风格关键词映射、批量回归、客户告知 6 步,给图叮AI 工作室一份 1-2 天可跑完的迁移清单。
推荐阅读
人像肤质精修交付实战:客户验收标准下的磨皮与去瑕
面向商业修图师,从客户验收标准倒推磨皮策略选择,含不同场景的磨皮程度把控和常见翻车修复方法。
母婴保温杯从白底图到户外场景:涂抹控图出图实战
用涂抹控图功能为母婴保温杯生成自然户外使用场景,从产品白底图到小朋友草地实拍风格的完整流程,适合母婴电商主图和种草图制作。
万物迁移快手教程:水晶杯与护肤品的场景替换实操
用图叮PS插件万物迁移功能处理透明水晶杯和护肤品瓶的场景替换,演示不同材质产品的迁移操作要点。
摩托车头盔镜片图怎么拆:防雾片、卡扣和认证标别被 AI 修假
摩托车头盔镜片商品图不能只追求通透。本文按 5 步拆开防雾片边线、镜片卡扣、密封胶条、认证标和包装配件,帮户外装备团队把 AI 修图边界讲清楚。