跳转到主内容
·

AI 商品图提示词批量前冒烟测试:旧图、新图和异常图怎么跑

做完这 5 步,你会得到一张很朴素的提示词冒烟测试表:旧图有没有退步,新图能不能稳定,异常图是否触发兜底。它不负责把图变得更惊艳,只负责在 30 张、80 张、200 张商品图进队列前,先拦住会破坏 brand consistency 的提示词。

我更愿意把这件事叫上线前 QA,而不是写 prompt。提示词一旦进入批量流程,就不再是灵感句子,它是品牌资产的一部分。素材是资产不是消耗品,改一句话也要知道它会不会伤到 visual equity。

Step 1:先固定三类测试图

AI 商品图提示词冒烟测试工作台上分成旧图新图和异常图三组样本 图注:旧图新图异常图三组样本池

不要从“这条提示词看起来更好”开始。先定测试样本。

三类图就够:

  • 旧图:上一版已经稳定通过的商品图,用来检查有没有退步。
  • 新图:这次真正要处理的新 SKU,用来看提示词能不能接住当前任务。
  • 异常图:反光、透明、中文标签、低像素边缘、复杂阴影这类容易挂的图,用来验证兜底。

团队实际经验里,2026 年 5 月中旬我们复盘过一组深圳南山跨境小家电素材,运营小赵准备把“白底更干净、阴影更高级”加进主提示词。旧图 2 张,新图 2 张,异常图 2 张,合计只跑 6 张。结果旧图里的容量标签被压浅,异常图的透明水箱边缘被补成实心塑料。这个问题如果放到 96 张批量图里才发现,返工就不只是修图时间,而是整套详情页的信任损耗。

选图时别只挑最顺眼的样张。旧图要挑上一版确认过的结果,新图要覆盖真实上架 SKU,异常图要故意难一点。比如亮面电饭煲、透明榨汁杯、带中文警示贴的小家电,都比普通白盒更能暴露提示词问题。

这一段可以和首批 20 张图为什么不能直接当正式批量连起来看。20 张是放量前的小批量,6 张冒烟测试更早,发生在提示词刚改完的那一刻。

Step 2:把提示词改动拆成一次一个变量

提示词最怕“顺手改”。把背景、材质、光线、构图、禁改区一起改,出图变好时你不知道是哪条生效,出图变差时也不知道该回滚哪一段。

我的做法很笨:一次只改一个变量。

  • 只改背景:例如把“浅灰棚拍背景”改成“纯白电商白底背景”。
  • 只改光线:例如把“柔和顶光”改成“左前 45 度柔光箱”。
  • 只改禁改条件:例如新增“不要重绘容量标、Logo、按钮图标和警示贴”。
  • 只改输出约束:例如要求 4:3 主图留白,不改变商品比例。

内部复盘里我们会把每轮写成 prompt-v07-light-only 这种名字。名字土一点没关系,关键是别人一眼能看懂。2026 年 5 月 18 日的一次真实项目脱敏记录里,杭州滨江一组香薰机图只改了“蒸汽更明显”这一条,结果图叮 AI 生成的雾气很好,但机身出风口数量被误补。因为变量单一,团队很快定位到“蒸汽描述越界”,而不是重写整条提示词。

如果你的团队已经在做提示词归档,可以参考AI 修图提示词版本管理 SOP。版本管理负责找回上一版,冒烟测试负责判断这一版能不能进批量。

Step 3:跑 6 张冒烟图并记录失败类型

6 张不是行业标准,只是一个容易执行的起点。旧图 2 张、新图 2 张、异常图 2 张,先跑一遍。每张图不看“喜欢不喜欢”,只看 5 类失败。

第一类,主体结构漂移。商品比例、按钮位置、接口数量、透明件边缘有没有变化。

第二类,品牌色漂移。奶白、雾蓝、银灰、品牌红这些颜色有没有被统一成模型喜欢的安全色。

第三类,材质误判。磨砂变亮面,透明变半透明,金属被修成塑料,布纹被磨平。

第四类,文字和标识变形。中文标签、容量、警示贴、Logo、型号区有没有被补字或淡化。

第五类,光影不可信。接触阴影、反光方向、背景白度是否让商品看起来悬浮。

这里要用 QA 口径写记录,不要写“这张挺好”。例如:“异常图 A2,透明水箱右下角边缘被补实,属于材质误判,阻断放量”。这句话能驱动下一步修正。写“质感一般”只会让下一位设计师猜。

如果你还在调中文提示词基础结构,GPT Image 2 的提示词写法适合先看;但进入批量前,模板写得顺不顺已经不是核心,核心是回到主张:这套素材要证明什么,哪些信息不能被 AI 改写。

Step 4:只修失败来源,不顺手重写整段提示词

冒烟测试发现问题后,别把整段提示词推倒重来。整段重写看起来更积极,实际会把已经通过的部分也变成未知变量。

按失败类型局部修:

  • 主体结构漂移:补“保持原商品比例、接口数量、按钮位置,不新增部件”。
  • 品牌色漂移:补色彩边界,例如“保持原图奶白机身,不改成冷白或银灰”。
  • 材质误判:补材质词和禁用词,例如“透明水箱保留透明边缘,不生成实心塑料感”。
  • 文字标识变形:补“文字区域只调明暗,不重绘可读文字”。
  • 光影不可信:补“保留接触阴影方向,背景清理不改变落地关系”。

这一步可能挂在人的手上。品牌经理、运营、修图师会同时觉得自己有道理。我的建议是把争论压回测试表:失败类型是什么,影响的是点击、信任,还是售后解释?如果只是审美分歧,先不改主提示词;如果伤到商品证据或 brand consistency,才进入修正。

真实项目脱敏里,上海静安一个新锐国货品牌在一组 18 张香氛扩香石图上踩过这个坑。设计师为了“更有温度”加了暖调描述,缩略图确实更柔,但包装上的香型贴纸变浅。团队最后没有继续调暖,而是把暖调限定在背景和道具层,商品贴纸回原图明暗。这个取舍很小,却保住了 visual equity。

Step 5:用回归表决定放量还是回滚

提示词回归测试验收板展示通过局部修正和回滚三种状态 图注:回归验收板决定放量修正或回滚

放量判断写得越短越好。建议用四列:

检查项通过标准结果动作
旧图回归2 张旧图不比上一版差通过 / 失败失败则回滚
新图适配2 张新 SKU 主体、颜色、材质可交付通过 / 失败失败则局部修正
异常兜底2 张异常图没有结构或标识事故通过 / 失败失败则不放量
记录完整版本名、失败类型、修正动作齐全通过 / 失败失败则补记录

当旧图不退步,新图能过线,异常图有兜底,再进入 20 张小批量。20 张也不是正式放飞,它只是下一层验证。兜底情况是:如果旧图失败,直接回滚;如果新图失败,局部修正后重跑 6 张;如果异常图失败,把异常条件写进禁改段,再重跑。

验证是否做对很简单:打开回归表,任意挑一张图,能在 1 分钟内说清它属于旧图、新图还是异常图,失败类型是什么,当前提示词为什么能上线或为什么要回滚。说不清,就不要进批量。提示词不是越长越稳,能被回归验证的提示词才稳。

相关文章

推荐阅读