AI 商品图提示词批量前冒烟测试:旧图、新图和异常图怎么跑
做完这 5 步,你会得到一张很朴素的提示词冒烟测试表:旧图有没有退步,新图能不能稳定,异常图是否触发兜底。它不负责把图变得更惊艳,只负责在 30 张、80 张、200 张商品图进队列前,先拦住会破坏 brand consistency 的提示词。
我更愿意把这件事叫上线前 QA,而不是写 prompt。提示词一旦进入批量流程,就不再是灵感句子,它是品牌资产的一部分。素材是资产不是消耗品,改一句话也要知道它会不会伤到 visual equity。
Step 1:先固定三类测试图
图注:旧图新图异常图三组样本池
不要从“这条提示词看起来更好”开始。先定测试样本。
三类图就够:
- 旧图:上一版已经稳定通过的商品图,用来检查有没有退步。
- 新图:这次真正要处理的新 SKU,用来看提示词能不能接住当前任务。
- 异常图:反光、透明、中文标签、低像素边缘、复杂阴影这类容易挂的图,用来验证兜底。
团队实际经验里,2026 年 5 月中旬我们复盘过一组深圳南山跨境小家电素材,运营小赵准备把“白底更干净、阴影更高级”加进主提示词。旧图 2 张,新图 2 张,异常图 2 张,合计只跑 6 张。结果旧图里的容量标签被压浅,异常图的透明水箱边缘被补成实心塑料。这个问题如果放到 96 张批量图里才发现,返工就不只是修图时间,而是整套详情页的信任损耗。
选图时别只挑最顺眼的样张。旧图要挑上一版确认过的结果,新图要覆盖真实上架 SKU,异常图要故意难一点。比如亮面电饭煲、透明榨汁杯、带中文警示贴的小家电,都比普通白盒更能暴露提示词问题。
这一段可以和首批 20 张图为什么不能直接当正式批量连起来看。20 张是放量前的小批量,6 张冒烟测试更早,发生在提示词刚改完的那一刻。
Step 2:把提示词改动拆成一次一个变量
提示词最怕“顺手改”。把背景、材质、光线、构图、禁改区一起改,出图变好时你不知道是哪条生效,出图变差时也不知道该回滚哪一段。
我的做法很笨:一次只改一个变量。
- 只改背景:例如把“浅灰棚拍背景”改成“纯白电商白底背景”。
- 只改光线:例如把“柔和顶光”改成“左前 45 度柔光箱”。
- 只改禁改条件:例如新增“不要重绘容量标、Logo、按钮图标和警示贴”。
- 只改输出约束:例如要求 4:3 主图留白,不改变商品比例。
内部复盘里我们会把每轮写成 prompt-v07-light-only 这种名字。名字土一点没关系,关键是别人一眼能看懂。2026 年 5 月 18 日的一次真实项目脱敏记录里,杭州滨江一组香薰机图只改了“蒸汽更明显”这一条,结果图叮 AI 生成的雾气很好,但机身出风口数量被误补。因为变量单一,团队很快定位到“蒸汽描述越界”,而不是重写整条提示词。
如果你的团队已经在做提示词归档,可以参考AI 修图提示词版本管理 SOP。版本管理负责找回上一版,冒烟测试负责判断这一版能不能进批量。
Step 3:跑 6 张冒烟图并记录失败类型
6 张不是行业标准,只是一个容易执行的起点。旧图 2 张、新图 2 张、异常图 2 张,先跑一遍。每张图不看“喜欢不喜欢”,只看 5 类失败。
第一类,主体结构漂移。商品比例、按钮位置、接口数量、透明件边缘有没有变化。
第二类,品牌色漂移。奶白、雾蓝、银灰、品牌红这些颜色有没有被统一成模型喜欢的安全色。
第三类,材质误判。磨砂变亮面,透明变半透明,金属被修成塑料,布纹被磨平。
第四类,文字和标识变形。中文标签、容量、警示贴、Logo、型号区有没有被补字或淡化。
第五类,光影不可信。接触阴影、反光方向、背景白度是否让商品看起来悬浮。
这里要用 QA 口径写记录,不要写“这张挺好”。例如:“异常图 A2,透明水箱右下角边缘被补实,属于材质误判,阻断放量”。这句话能驱动下一步修正。写“质感一般”只会让下一位设计师猜。
如果你还在调中文提示词基础结构,GPT Image 2 的提示词写法适合先看;但进入批量前,模板写得顺不顺已经不是核心,核心是回到主张:这套素材要证明什么,哪些信息不能被 AI 改写。
Step 4:只修失败来源,不顺手重写整段提示词
冒烟测试发现问题后,别把整段提示词推倒重来。整段重写看起来更积极,实际会把已经通过的部分也变成未知变量。
按失败类型局部修:
- 主体结构漂移:补“保持原商品比例、接口数量、按钮位置,不新增部件”。
- 品牌色漂移:补色彩边界,例如“保持原图奶白机身,不改成冷白或银灰”。
- 材质误判:补材质词和禁用词,例如“透明水箱保留透明边缘,不生成实心塑料感”。
- 文字标识变形:补“文字区域只调明暗,不重绘可读文字”。
- 光影不可信:补“保留接触阴影方向,背景清理不改变落地关系”。
这一步可能挂在人的手上。品牌经理、运营、修图师会同时觉得自己有道理。我的建议是把争论压回测试表:失败类型是什么,影响的是点击、信任,还是售后解释?如果只是审美分歧,先不改主提示词;如果伤到商品证据或 brand consistency,才进入修正。
真实项目脱敏里,上海静安一个新锐国货品牌在一组 18 张香氛扩香石图上踩过这个坑。设计师为了“更有温度”加了暖调描述,缩略图确实更柔,但包装上的香型贴纸变浅。团队最后没有继续调暖,而是把暖调限定在背景和道具层,商品贴纸回原图明暗。这个取舍很小,却保住了 visual equity。
Step 5:用回归表决定放量还是回滚
图注:回归验收板决定放量修正或回滚
放量判断写得越短越好。建议用四列:
| 检查项 | 通过标准 | 结果 | 动作 |
|---|---|---|---|
| 旧图回归 | 2 张旧图不比上一版差 | 通过 / 失败 | 失败则回滚 |
| 新图适配 | 2 张新 SKU 主体、颜色、材质可交付 | 通过 / 失败 | 失败则局部修正 |
| 异常兜底 | 2 张异常图没有结构或标识事故 | 通过 / 失败 | 失败则不放量 |
| 记录完整 | 版本名、失败类型、修正动作齐全 | 通过 / 失败 | 失败则补记录 |
当旧图不退步,新图能过线,异常图有兜底,再进入 20 张小批量。20 张也不是正式放飞,它只是下一层验证。兜底情况是:如果旧图失败,直接回滚;如果新图失败,局部修正后重跑 6 张;如果异常图失败,把异常条件写进禁改段,再重跑。
验证是否做对很简单:打开回归表,任意挑一张图,能在 1 分钟内说清它属于旧图、新图还是异常图,失败类型是什么,当前提示词为什么能上线或为什么要回滚。说不清,就不要进批量。提示词不是越长越稳,能被回归验证的提示词才稳。
相关文章
AI 生成样张首轮 QC SOP:通过、重跑、局部回滚和弃用怎么判
AI 生成样张不能只按好不好看挑。本文给运营和修图团队一套首轮 QC SOP,把样张分成通过、重跑、局部回滚和弃用四类,减少反复返工。
AI 生图参考图包怎么交接:白底、材质、场景和禁改区先锁住
AI 生图不是只写一条 prompt。电商团队要先把商品白底、材质特写、场景样张和禁改区做成参考图包,才能让图叮批量出图时少跑偏、可复核、能交接。
触屏手套商品图工作流 FAQ:指尖导电区、防滑胶点和腕口怎么分流
触屏手套商品图不能只按普通针织配件修顺。本文用 FAQ 方式拆开指尖导电区、防滑胶点、尺码标和腕口弹力,说明图叮 AI 该清哪里、锁哪里、何时退回补拍。
火漆印章套装交给外包前,先把印章头、蜡粒和勺炉标清楚
火漆印章套装图不能只修得复古好看。交给外包前,先把印章头纹样、蜡粒颜色、勺炉结构、手柄接口和成品封蜡边缘标成禁改区,减少 AI 精修后的错版返工。
推荐阅读
眼镜试戴图和镜片反光:5 个高频搜索问题一次讲清
眼镜配饰出图常被搜索的问题集中在试戴、镜片反光、脸型匹配和细节展示。本文按搜索意图回答5个问题,并和图叮AI眼镜配饰场景联动。
瑜伽轮商品图被退回:内圈接缝、直径标和承重纹谁先看
瑜伽轮商品图不能只把圆环修得干净。本文从一次脱敏退回链条复盘,拆清内圈接缝、直径参照、承重纹和包装标签该怎么先锁住,再交给图叮 AI 做局部清理。
产品材质修复与细节增强实战:破损/反光/纹理的诊断处理
面向产品修图师,系统梳理产品拍摄后常见的材质瑕疵类型,给出按材质分类的诊断和修复方案。
健腹轮商品图交给外包前:轮面纹路、握把、轴心螺帽和承重标先锁住
健腹轮商品图不是把背景修干净就够了。外包接单前要先锁住轮面纹路、握把海绵、轴心螺帽和承重标,避免 AI 把安全证据修没。