AI 生图参考图包交付 SOP:主商品、材质锚点和禁改字段怎么写清楚
这篇解决一个很具体的问题:给 AI 生图前,参考图包到底怎么交,才能让生成图既有场景感,又不把商品改成另一件货。做完这 5 步,你会得到一份能给运营、修图师和审核人共用的参考包:一张主商品基准图,几张材质锚点,若干场景参考,一份禁改字段表,再加一张首轮返检样张。
近期团队已经反复讨论过“AI 生图场景图 vs 原图精修”和“场景图品牌一致性返检”。这篇不再讨论要不要生图,也不再重复品牌色检查,而是往前移一步:出图前,参考图包怎么准备。
图注:参考图包先分层,后面返检才有基准。
Step 1:先选一张主商品 ground truth
先别急着收集十几张“好看的参考”。第一步只做一件事:选出一张主商品 ground truth。
这张图不一定最漂亮,但要最可信。它要能回答四个问题:商品真实外轮廓是什么,主色是什么,关键结构在哪,比例关系能不能量。比如护肤品套装要看瓶身高度、瓶盖比例、泵头方向和外盒关系;手机配件要看孔位、按键、边缘厚度和摄像头圈;服装配件要看织纹、吊牌、边线和尺码信息。
很多返工都不是“模型不懂美学”,而是没有 ground truth。运营给了 5 张图,每张都承担一点信息,模型最后只能做平均。平均出来的图很顺,但商品身份被稀释。我的做法是把基准图文件名写得很硬:sku-032-ground-truth-main.jpg。后面任何图,只要和它在形状、比例、颜色、结构上冲突,就先判为需复核。
举个假设场景,不计入真实项目数据:一款护手霜有管身正面、瓶盖特写、礼盒图、生活场景图和模特手持图。ground truth 应该选管身正面或 45 度实拍,不要选生活场景图。生活场景图可以管光线,但不该管管身比例。
图注:基准图不求漂亮,求能量、能对、能追溯。
Step 2:补齐材质锚点和细节裁片
主商品图锁大形,材质锚点锁“它到底是什么材料”。这两类图不能混用。
材质锚点最好是局部裁片,而不是另一张完整海报。金属要给高光边缘,透明塑料要给折射边,纸盒要给纸纹和压痕,布料要给织纹和缝线,玻璃要给厚度和边缘反光。每个锚点只承担一个任务,不要让一张图同时负责材质、构图和氛围。
团队实际经验里,材质漂移最常出现在“高级感”这个词后面。模型会把金属磨成镜面,把布料磨成塑料,把纸盒磨成无纹理卡片。参考图包里如果没有材质锚点,提示词写“保留真实材质”作用有限,因为模型不知道真实材质的参照物是哪一张。
我建议按材料命名:material-metal-brushed.jpg、material-paper-box-grain.jpg、material-clear-plastic-edge.jpg。命名不用花哨,但要让接手的人一眼知道这张图的职责。团队可以把这类图叫做“不可争论图”:如果生成图和材质锚点冲突,就不靠主观审美投票,直接回到锚点判断。
图注:材质锚点越窄,模型越不容易乱学。
Step 3:把场景参考和商品参考分开
场景参考只能管场景。它可以告诉模型:桌面是什么材质,光从哪里来,背景是厨房、浴室、露营地还是直播间,画面是 3:4、1:1 还是 16:9。它不能告诉模型商品长什么样。
这个边界很关键。很多团队会把一张竞品海报、一张客户原图、一张小红书截图和一张包装照片放进同一个文件夹,统称“参考”。模型看不到你脑子里的分工。它可能从竞品海报学到了场景,也顺手学走了竞品的瓶型;可能从小红书截图学到了光线,也学走了人物手势和不该出现的文字贴纸。
参考包里建议分三个文件夹:01-product-ground-truth、02-material-anchors、03-scene-mood-only。第三个文件夹的每张图都要在提示词里声明:只参考空间、光线、构图,不参考商品结构、logo、包装文字和数量关系。
这一步和前面写过的品牌一致性返检不同。品牌一致性是出图后检查有没有偏;这里是出图前把职责切开,减少偏离发生。两者顺序不能反。
Step 4:写出禁改字段而不是形容词
“保持真实”“不要乱改”“产品一致”这些话太软。真正有用的是禁改字段。
禁改字段要写成可核对对象:logo 位置、包装标签、容量数字、色号、批次号、孔位数量、按键形状、套装数量、吊牌、证书编号、瓶口方向、透明件厚度、配件相对大小。能写名词就不要写形容词,能写位置就不要写感觉。
一个可用的写法是:
do not change: product silhouette, bottle cap height, pump direction, label layout, color code area, package quantity, shadow contact under product
中文项目也可以写中文,但要避免空词:
禁改:瓶身轮廓、瓶盖高度、泵头方向、标签版式、色号区、套装数量、商品底部接触阴影。
标签、规格、数量、孔位和接触阴影,是商品图返工里反复出现的高风险点。它们有一个共同特征:单张图看不一定丑,但会改变买家理解。禁改字段不是给模型看的装饰句,是给人类返检时画框用的索引。
图注:禁改字段要能画框,不能只写态度。
Step 5:用首轮样张反查参考包
首轮出图后,不要先挑“最好看”的一张。先做偏离表。
偏离表分四列:主商品偏离、材质偏离、信息偏离、场景偏离。主商品偏离看轮廓、比例、结构;材质偏离看金属、玻璃、布料、纸盒是否变质;信息偏离看标签、文字、数字、数量;场景偏离看光线、透视、背景是否符合需求。每一列只打三种状态:通过、需重跑、需补参考。
如果主商品偏离,多半是 ground truth 不够强,或提示词没有锁商品结构。如果材质偏离,多半是材质锚点缺失或被场景参考污染。如果信息偏离,通常不是靠继续出图解决,而是要遮挡、降清晰度、局部保留原图,或者让运营确认是否需要实拍补图。
这一步的价值在于反向修正参考包,而不是在 20 张候选里赌运气。我更愿意在第一轮就停下来补一张材质锚点,也不愿意拿一张“差不多”的图继续扩写详情页。前者是成本,后者是债。
最后提醒一个常见坑:参考图越多,不一定越稳。图多但职责不清,模型会把信号互相平均;图少但职责明确,反而更容易返检。先分层,再生成。先写禁改字段,再谈氛围。这个顺序别反过来。
相关文章
AI 模型版本切换迁移 SOP:旧 prompt 适配新模型的 6 步检查
新模型一上线,老 prompt 第二天就失灵。本文按能力对照、prompt 兼容测试、参数翻译、风格关键词映射、批量回归、客户告知 6 步,给图叮AI 工作室一份 1-2 天可跑完的迁移清单。
GPT Image 2 的 2K / 4K 高清图到底用在哪:4 类场景的真实需求拆解
GPT Image 2 上线 2K / 4K 之后,最常见的疑问不是能不能出,而是我这种活到底要不要出 4K。把电商详情页、印刷海报、4K 展示屏、桌面壁纸 4 类真实需求摊开,给出尺寸、档位、参考图组合、prompt 要点和成本,决策一目了然。
GPT Image 2 高清出图 5 大常见翻车与修复:细节失真 / 噪点 / 色彩断层 / 文字识别 / 边缘伪影
升档到 2K / 4K 之后,原本 1254 看着没事的小毛病会被放大成翻车——手部走形、暗部噪点、渐变出现色带、图内文字乱码、商品边缘光环。这篇按 5 类高清专属翻车展开,给诊断方法、重生成 prompt 修复点,以及该接 PS 精修时的取舍判断。
从 1254 升到 2K / 4K,GPT Image 2 的 prompt 要改的 5 件事
1254 档凑合够用的 prompt,搬到 2K / 4K 后常常露馅:瓶身像塑料、背景空、风格词互打架。本文按细节密度、构图精度、材质纹理、背景层次、风格词数量 5 个调整点,给 1254 与 4K 对照示例和电商场景使用建议。
推荐阅读
红肿痘印一键修复:图叮AI人像修图告别复杂工作流
用图叮AI人像修图功能一键修复红肿痘印和雀斑瑕疵,无需复杂AI工作流或专业修图技能,PS插件内直接完成精修。
万物迁移入门:沙发与洁面乳两类产品的场景替换演示
用图叮PS插件万物迁移功能,分别演示家居沙发和洁面乳产品的场景替换操作,讲解选区覆盖范围的注意事项。
汽车产品图智能转角度:SUV从正前方到侧面的光影联动
用图叮智能转角度功能将SUV汽车从正面视角生成侧面视角,实测车身光影同步联动和细节还原效果。
酒店民宿早餐区图片:AI 美化氛围 vs 保留真实餐台,房源页该怎么取舍
酒店民宿早餐区图片不能只追求丰盛和明亮。本文从房源页承诺、餐台供给、自然光和细节证据拆清 AI 美化与真实餐台之间的取舍。