AI 生图参考图包交付 SOP:主商品、材质锚点和禁改字段怎么写清楚
这篇解决一个很具体的问题:给 AI 生图前,参考图包到底怎么交,才能让生成图既有场景感,又不把商品改成另一件货。做完这 5 步,你会得到一份能给运营、修图师和审核人共用的参考包:一张主商品基准图,几张材质锚点,若干场景参考,一份禁改字段表,再加一张首轮返检样张。
近期团队已经反复讨论过“AI 生图场景图 vs 原图精修”和“场景图品牌一致性返检”。这篇不再讨论要不要生图,也不再重复品牌色检查,而是往前移一步:出图前,参考图包怎么准备。
图注:参考图包先分层,后面返检才有基准。
Step 1:先选一张主商品 ground truth
先别急着收集十几张“好看的参考”。第一步只做一件事:选出一张主商品 ground truth。
这张图不一定最漂亮,但要最可信。它要能回答四个问题:商品真实外轮廓是什么,主色是什么,关键结构在哪,比例关系能不能量。比如护肤品套装要看瓶身高度、瓶盖比例、泵头方向和外盒关系;手机配件要看孔位、按键、边缘厚度和摄像头圈;服装配件要看织纹、吊牌、边线和尺码信息。
很多返工都不是“模型不懂美学”,而是没有 ground truth。运营给了 5 张图,每张都承担一点信息,模型最后只能做平均。平均出来的图很顺,但商品身份被稀释。我的做法是把基准图文件名写得很硬:sku-032-ground-truth-main.jpg。后面任何图,只要和它在形状、比例、颜色、结构上冲突,就先判为需复核。
举个假设场景,不计入真实项目数据:一款护手霜有管身正面、瓶盖特写、礼盒图、生活场景图和模特手持图。ground truth 应该选管身正面或 45 度实拍,不要选生活场景图。生活场景图可以管光线,但不该管管身比例。
图注:基准图不求漂亮,求能量、能对、能追溯。
Step 2:补齐材质锚点和细节裁片
主商品图锁大形,材质锚点锁“它到底是什么材料”。这两类图不能混用。
材质锚点最好是局部裁片,而不是另一张完整海报。金属要给高光边缘,透明塑料要给折射边,纸盒要给纸纹和压痕,布料要给织纹和缝线,玻璃要给厚度和边缘反光。每个锚点只承担一个任务,不要让一张图同时负责材质、构图和氛围。
团队实际经验里,材质漂移最常出现在“高级感”这个词后面。模型会把金属磨成镜面,把布料磨成塑料,把纸盒磨成无纹理卡片。参考图包里如果没有材质锚点,提示词写“保留真实材质”作用有限,因为模型不知道真实材质的参照物是哪一张。
我建议按材料命名:material-metal-brushed.jpg、material-paper-box-grain.jpg、material-clear-plastic-edge.jpg。命名不用花哨,但要让接手的人一眼知道这张图的职责。团队可以把这类图叫做“不可争论图”:如果生成图和材质锚点冲突,就不靠主观审美投票,直接回到锚点判断。
图注:材质锚点越窄,模型越不容易乱学。
Step 3:把场景参考和商品参考分开
场景参考只能管场景。它可以告诉模型:桌面是什么材质,光从哪里来,背景是厨房、浴室、露营地还是直播间,画面是 3:4、1:1 还是 16:9。它不能告诉模型商品长什么样。
这个边界很关键。很多团队会把一张竞品海报、一张客户原图、一张小红书截图和一张包装照片放进同一个文件夹,统称“参考”。模型看不到你脑子里的分工。它可能从竞品海报学到了场景,也顺手学走了竞品的瓶型;可能从小红书截图学到了光线,也学走了人物手势和不该出现的文字贴纸。
参考包里建议分三个文件夹:01-product-ground-truth、02-material-anchors、03-scene-mood-only。第三个文件夹的每张图都要在提示词里声明:只参考空间、光线、构图,不参考商品结构、logo、包装文字和数量关系。
这一步和前面写过的品牌一致性返检不同。品牌一致性是出图后检查有没有偏;这里是出图前把职责切开,减少偏离发生。两者顺序不能反。
Step 4:写出禁改字段而不是形容词
“保持真实”“不要乱改”“产品一致”这些话太软。真正有用的是禁改字段。
禁改字段要写成可核对对象:logo 位置、包装标签、容量数字、色号、批次号、孔位数量、按键形状、套装数量、吊牌、证书编号、瓶口方向、透明件厚度、配件相对大小。能写名词就不要写形容词,能写位置就不要写感觉。
一个可用的写法是:
do not change: product silhouette, bottle cap height, pump direction, label layout, color code area, package quantity, shadow contact under product
中文项目也可以写中文,但要避免空词:
禁改:瓶身轮廓、瓶盖高度、泵头方向、标签版式、色号区、套装数量、商品底部接触阴影。
标签、规格、数量、孔位和接触阴影,是商品图返工里反复出现的高风险点。它们有一个共同特征:单张图看不一定丑,但会改变买家理解。禁改字段不是给模型看的装饰句,是给人类返检时画框用的索引。
图注:禁改字段要能画框,不能只写态度。
Step 5:用首轮样张反查参考包
首轮出图后,不要先挑“最好看”的一张。先做偏离表。
偏离表分四列:主商品偏离、材质偏离、信息偏离、场景偏离。主商品偏离看轮廓、比例、结构;材质偏离看金属、玻璃、布料、纸盒是否变质;信息偏离看标签、文字、数字、数量;场景偏离看光线、透视、背景是否符合需求。每一列只打三种状态:通过、需重跑、需补参考。
如果主商品偏离,多半是 ground truth 不够强,或提示词没有锁商品结构。如果材质偏离,多半是材质锚点缺失或被场景参考污染。如果信息偏离,通常不是靠继续出图解决,而是要遮挡、降清晰度、局部保留原图,或者让运营确认是否需要实拍补图。
这一步的价值在于反向修正参考包,而不是在 20 张候选里赌运气。我更愿意在第一轮就停下来补一张材质锚点,也不愿意拿一张“差不多”的图继续扩写详情页。前者是成本,后者是债。
最后提醒一个常见坑:参考图越多,不一定越稳。图多但职责不清,模型会把信号互相平均;图少但职责明确,反而更容易返检。先分层,再生成。先写禁改字段,再谈氛围。这个顺序别反过来。
相关文章
给老人做金婚纪念照:老照片修复与AI写真怎么落地
给父母做金婚纪念照,常见的难题是老照片泛黄破损、缺一张像样的合影。本文讲清楚老照片修复、上色、AI写真的真实做法,以及用图叮AI相关功能时要注意的边界。
珠宝光影怎么修?AI 配合 PS 处理高反光首饰的实操
钻石、黄金、翡翠高反光又难修,光影没处理好就显廉价。本文讲清珠宝光影修复的难点、AI 辅助加 PS 的实操流程、多角度光影一致性怎么保,以及哪些步骤必须人工把关,帮珠宝电商提升详情页质感。
免费AI生图工具评测:美妆电商如何搞定玻璃瓶身反光与材质失真
评测主流免费AI生图工具在美妆电商场景的表现,讲清如何用局部重绘解决玻璃瓶身反光杂乱与材质失真问题,附提示词、参数参考、工作流与避坑指南。
AI 商品图提示词批量前冒烟测试:旧图、新图和异常图怎么跑
提示词改好后别马上放量。本文给电商团队一套冒烟测试流程,用旧图、新图和异常图先跑小样,判断提示词该上线、局部修正还是回滚。
推荐阅读
电商服装详情页去水印实战:保留面料纹理的高效批量做法
服装详情页素材常带原厂水印,手工去除慢又容易破坏面料纹理?本文讲清去水印时保留蕾丝、针织等复杂纹理的实战做法和版权边界,并说明图叮AI在批量去水印场景下的用法。
自驾游风景照消除路人:用局部重绘还原干净的旅途大片
自驾摄影常被观景台或停车场的路人干扰?本文讲清局部重绘的原理与操作,教你用图叮AI 自然消除画面中的人物和车辆,并给出选图、涂抹、复核技巧,还原纯净自然风光。
SKU 变体图给外包怎么标注:颜色、规格、库存卡和包装面先锁住
SKU 变体图交给外包前,先把颜色、规格、库存卡、包装面和禁止修动区域标清楚。本文给一套可直接执行的标注 SOP,减少返工和误修。
除湿机图为什么被客服退回:水箱、滤网和排水口谁先看
除湿机商品图修得太新,客服可能更难解释水箱水位线、滤网、排水口和铭牌。本文从返检复盘出发,给小家电团队拆清可修区和证据区。