跳转到主内容
· 图叮AI团队

AI 修图踩过的 100 张图坑:6 大类失败模式归因(真实复盘合集)

把过去几个月里被退回、重做、延期或客户质疑过的图整理出来,凑了 100 张,按”造成返工的第一原因”重新分了一遍类。结果不是工具好不好用的问题,而是失败发生在哪一环的问题——参数、参考、质检、需求、版本、交付,6 类各有各的坏法。这篇不是失败率统计,是把 100 张图摊开来看清楚每一坑长什么样。

AI 修图 100 张失败图复盘 · 桌面打印缩略与红圈批注情绪图

这 100 张图是怎么来的:不是统计报告,是一次脱敏复盘

先把口径讲清楚,免得这篇被当成”行业失败率”。

样本是过去几个月内部和合作工作室真实出过问题的图——有客户要求重做的、有交付前自查必须返工的、有上架后被客户在售后里点出来的、还有几张是被砍了尾款拿回来复盘的。这次复盘先截取了 100 张有明确返工记录的图。

需要提前说清的是:这是一次项目复盘,不是抽样调查。不同工作室、不同客户结构、不同价位段的失败分布会差很多——做高客单价品牌图踩的坑跟做白牌主图的完全不一样。故事都做了脱敏处理(行业、品类、客户名都换过),保留的是冲突结构和数字量级。

100 张里有一半以上同时踩了不止一个坑。归类时只挑”如果这一步没出问题就不至于返工”的最早原因。这种归类法注定有主观性,但比把每张算两次更接近实际。

如果你之前没看过我们对失败原因做过的根因框架,可以先翻一下这篇 4 个反复出现的根因总结——那篇是宏观视角,这篇是微观的 100 张账。

先看分布:约 25/20/18/15/12/10,不是精确科学

100 张按主因归到 6 类后,分布大致是:

100 张失败图按 6 大类的分布饼图:参数选错约25 / 参考图问题约20 / 人为漏检约18 / 客户沟通约15 / 工具版本约12 / 交付环节约10

提醒一句:这些数字是约略归类,不要拿去当 KPI 基线。换客户结构、换品类组合,数字会重排——做奢侈品调性的活”客户沟通”那块会顶到第一,因为客群对”高级感”的描述天然模糊。我们产品精修接得多,所以”参数”和”参考图”两类突出。

真正有价值的不是这 6 个数字,是每类失败长什么样。下面按规模展开。

第 1 类:约 25 张 · 参数选错(prompt / 比例 / denoise)

这是单类里最多的,但也最容易事后总结清楚——参数都留有记录,回去翻历史就能复原是哪一步砸的。

2026 年 2 月,“干净背景”被理解成了”完全抹平”

那是一组 36 张某家居小品牌电商主图的批量任务。客户原话两个字:“干净”。执行同事的 prompt 里加了 clean studio background, pure white, minimal noise。前 6 张客户点头。等剩下 30 张一起交付,客户晚上回了一句:“我说要干净,没说要把阴影也吃掉。”

放大一看:prompt 里 “minimal” 那个词权重过重,模型把产品和地面之间应有的接地阴影几乎清干净了,从视觉上看产品都”飘”在白底上。36 张里 9 张被退回重做,延误了半天交期。同事自己复盘的话是:“我以为’干净’就是越干净越好,没想到客户的’干净’是有底线的。”

这个坑的麻烦不在于错——错很容易看出来。麻烦在于参数往一个方向走过头时,单张图自查很难发现是哪个词压过头了。要把这一批和上一批客户认可的图并排看,才能看出”哎这次没阴影”。

比例错一次,整套详情页都要重排

3 月有一次更隐蔽:约定尺寸是 1:1 主图,执行端默认走的 4:5。出图时单图都对——产品居中、构图正常。结果客户运营把图放进电商详情页模板的瞬间——主视觉位置明显不对。详情页主图槽位是 1:1,4:5 强塞要么裁掉一截、要么留白难看。12 张整体重导,设计同事帮着重排又花了快两小时。

根因不是出图本身,是生成参数和落地容器没对齐。后来开工前先确认一句”主图比例是 1:1 还是 4:5、最后塞到哪个模板”,写工单第一行。一句话的事,之前确实没有。

denoise 不是越高越干净

第三个故事更微妙。一批皮革材质产品图,执行同事觉得”细节噪点多”,把 denoise 拉到 0.7。图肉眼顺眼了——客户反馈一句:“看着像塑料假货。”

皮革、绒面、磨砂玻璃这类材质,denoise 拉过头会把材质本身的纹理一起抹掉。模型拿不准是噪点还是质感,一刀切下去,视觉上从”高级”直接掉到”廉价”。客户不一定能精确指出”哪里不对”,但会拒收。这一档我们后来对着 GPT Image 2 的常见参数问题清单逐条更新过执行规范才稳住。

100 张里这一类大约 25 张——参数走过头、比例选错、denoise 过头各占一部分,每处单独看都不致命,发生了客户基本能一眼挑出。

第 2 类:约 20 张 · 参考图本身出了问题

参数选错是”操作者表达能力的问题”,参考图问题是”喂进去的素材就有毛病”。后者更隐蔽,因为责任很容易甩到模型上。

1 月那个 14 张参考图的客户

某品牌市场负责人开年后给了一份新品上架任务,附了 14 张参考图。14 张里有日系干净棚拍、欧美高对比硬光、几张明显从小红书截的低清图、还有 2 张是淘宝同行的成品图。负责人备注一句:“就照这个调来。”

修图同事老老实实把 14 张全塞进去做混合参考。结果 8 张出图风格漂移——产品看着像是同时在三个国家拍的,光线方向、色调饱和度、背景调性都对不上。客户看完反过来问:“为什么风格不统一?”

这不是模型的问题,是参考图本身就是冲突的。模型同时拟合 14 个互相矛盾的目标,每一张都是 14 张参考图的某种妥协,每一张都”沾点像但不完全像”。后来处理变成:拿到 14 张参考图先做一轮主参考精选,留 3 张能互相印证调性的当核心,其余 11 张作氛围补充权重压低。出图风格立刻收回来。参考图不是越多越好——密度过一定阈值,模型反而失去主方向。

低清截图带来的不是参考,是噪声

另一个故事更微妙。一组 6 张参考图全是从社交平台截的图——有压缩痕迹、平台水印淡淡印在角落、有的截图本身阴影就压暗失真。模型把这些”非产品本身”的视觉特征也学了进去,出图里有几张能看到隐约的”水印感氛围”——不是真有水印,是图里有种说不清的”被截过”的浑浊。

这一组 4 张返修。后来工作流加了一条硬规则:参考图最长边不低于 1500px、不带平台水印、不带加滤镜痕迹——达不到这条直接不用,宁可参考图少几张。

100 张失败图缩略合集情绪图:6×4 网格,6 大类失败模式分布在不同色调的产品缩略图里

参考图这一类大约 20 张,分两半:一半是数量过多导致冲突,一半是单张参考图本身质量太差。

第 3 类:约 18 张 · 人为漏检不是低级错误,是流程没有兜住

这一类最让人不甘心——图本身没问题、参考图也对、参数也调好了,最直接的失败原因是自查没看到。但这种”看不到”几乎总是因为流程里没有专门的检查动作,不是修图同事不上心。

阴影没接地,客户一眼看出”飘”

3 月有一组 15 张图,主体精修都很漂亮,光照、产品高光、抠图边缘全过关。客户反馈一句:“为什么产品都飘着?“我们才发现 15 张里 5 张的接地阴影方向和图里光源对不上——光源从左上来,但产品下方的阴影却是从正下方往左拖出去的。单张图自查看不出问题,符合一般”产品下面应该有阴影”的直觉;并排几张一起看才发现阴影方向不一致。

这一类失误归因不是水平问题,是自查 SOP 里没有”对照光源方向画箭头”这一项。我们之前在客户能一眼看出的 10 个肉眼盲区里把光源一致性单列过,但执行环节没把那条转化成开工后必查项。

logo 和文字,是最不该交给侥幸的部分

另一个故事更扎心。某次做包装类产品图,瓶身上有一行品牌 logo 字母。修图同事自己看了一眼”差不多”就交付了。客户法务那边直接打回:“logo 字母 G 的弧度不对,这是品牌注册商标,不能动。”

模型重绘瓶身时把 logo 当成一般花纹处理,字母 G 上的小钩被改成了圆弧。3 张图被退回,客户表达了对合规风险的强烈不安。处理改成:含品牌 logo 或法定标识文字(警示语、配料表、剂量说明)的图,交付前要用人眼对照原图局部放大检查——不是抽查,是逐张过。大多数时候 AI 处理过的字符没问题,但只要少数出错,交出去就是事故。

人为漏检这一类大约 18 张——接地阴影、光源一致性、logo 文字、产品边缘伪影占大头。每项单独不复杂,但自查工作流如果不专门设计,新手和老手都会反复漏

中场:前三类发生在出图前,后三类发生在协作后

写到这里可以停一下。前三类——参数、参考、自查——属于”修图这一环自己能控制”的失败:工艺、流程、判断力问题。一个有经验的工作室把工艺打磨到位,前三类发生率能压到很低。

后三类不一样——需求标准、工具版本、交付环节——是协作链路上的失败。哪怕修图工艺已经很稳,只要客户标准在变、工具能力在升级、交付规则在调整,返工依然会发生

不一样的地方是”修图水平再高也兜不住”——补救方法不是练手艺,是搭流程。

第 4 类:约 15 张 · 需求标准漂移

需求漂移是一种很隐蔽的失败——它不是客户错、也不是修图同事错,是双方对同一个词的理解不一样。

客户说”高级一点”,但团队听成了”更暗一点”

2 月某化妆品品牌视觉负责人,看完第一稿 10 张图说了一句:“风格能不能再高级一点。“对接同事点头记下,回去把背景压暗了一档、加重了反光对比。

第二稿交回去,客户脸更难看:“你这是把我打灯打掉了,我说的是高级,不是黑。”

这一组 10 张里 6 张方向偏掉。事后复盘:“高级感”在客户心里是”哑光质感、克制饱和、留白多、字体细”,在执行同事心里是”低光、高对比、反光强”——两边对同一个词的理解差了一整个风格。光看 prompt、看参考图都看不出来,只能在第一稿出来后用一两张样图作为锚定再确认。

后来流程加了一条:接到”高级感 / 高质感 / 调性更好”这种抽象词时,先要客户挑 1-2 张已上线图作为锚定样张。这一条把这类发生率压下来一大截。

中途换标准,比一开始没标准更伤

另一个故事更头疼。30 张图的批量任务,执行到第 20 张时客户那边负责人换了。新负责人一上来:“之前那个风格不太对,换成 B 风格。”

前 20 张已经按 A 风格交了部分初稿。改成 B 风格意味着前 20 张里 7 张要重做、剩下没出的 10 张全部按新方向。整体交付延期 1 天。

这种事工艺上无解,更多要靠变更单、样张确认和批次冻结来约束:交付批次内的方向变更超过一定比例需要走变更单。这是项目管理范畴,不是修图技巧。但要先承认这种事会发生,不能假设客户的标准从开工到交付一直一致。第一次接单的同行可以参考新手交付前的 5 个自检项,里面把”开工前要锁定的标准项”列得比较细。

需求标准这一类大约 15 张——一半是”语义错位”,一半是”中途换标准”。

第 5 类:约 12 张 · 工具版本切换的隐性返工

这一类在我们 2026 年前后的项目里突然变多——AI 工具更新节奏加快,“同一个 prompt 在新模型上跑出来不一样”成了反复出现的返工源。

4 月那次比较典型。前一周用旧模型跑通了一个皮革包的工作流,prompt 调到位、参数也定死。一周后产品方追加 12 张同系列同 prompt 的需求,执行同事直接复用历史 prompt——但模型那边已经升级到新版本。

新版本细节增强能力更强,旧 prompt 里 “sharp leather texture” 那一段在新模型上变成过锐——皮革表面像被打磨过一样的塑料感。12 张里 4 张需要重新调参

归因不是模型升级本身的错,是版本变化没有被纳入工作流,团队还在用旧 SOP 判断新模型的输出。修复的办法不是停在旧版本,是每次升级后跑一组 5-10 张的”基准比对”——同样的 prompt 在新旧模型上各跑一次,看差异在哪、哪些参数要重新校准。

2026-04 GPT Image 2 的 2K/4K 上线那次也是同样的逻辑——能力升级了,旧的”低分辨率思路”在新档位上反而暴露问题。截至 2026-04 那次上线后,我们已经把”升级后第一周做基准比对”写进 SOP。

工具版本这一类大约 12 张——多数集中在升级后的最初几天和第一批项目里。一旦校准过基准,发生率会自然降下来。

第 6 类:约 10 张 · 最后交付环节也会毁掉一张好图

这一类最冤——图本身是对的,毁在最后两步。

文件名让客户找不到图

3 月一次交付 30 张图,执行同事按内部习惯命名为 产品图001.jpg ~ 030.jpg。客户那边运营是按 SKU 编号管理产品资料的,收到这堆”产品图XXX”完全对不上 SKU。运营花了一下午一张张点开比对——中间还有 6 张被她误判为”图叮没按需求做”,因为把另一组 SKU 的图错配进来对照了。实际上那 6 张图本身是对的

损失不是返工,是信任——客户运营在沟通群里写”这次的图怎么这么乱”。图没问题,但她已经形成了”乱”的印象。后来流程改了:交付前必须确认客户的命名规范,按客户规范命名、不按内部习惯。多 5-10 分钟,但不会让客户觉得”图是乱的”。

平台规格和颜色空间

另一类是平台规格——同一张图发不同平台尺寸不一样、对压缩比的容忍度也不一样。某次小红书首图按 3:4 做的,客户运营要的是 1:1 详情页主图(同一组活动两个落地端),交付时只交了一种。客户回:“另一种还有吗?“——临时再做一遍。

颜色空间是更冷门的坑。RGB 出图直接交付印刷时,如果没有做色彩配置和打样确认,转 CMYK 后可能偏色。这事一年遇不到几次,遇到一次客户的印刷物料就废一批。这一类大约 10 张里有 1 张是颜色空间出过问题。

这些坑最后留下了什么

写到第 100 张时,最深的感受不是”AI 修图失败率有多高”——这数字没意义,100 张是从已发生返工的样本里抽的,不代表整体。

真正留下来的是另一种东西:每张图在哪一环最容易失控,是有规律的

客户提”高级感”时,失控点几乎一定在需求理解;客户给一堆参考图时,失控点在参考图内部一致性;模型刚升级那一周,失控点在旧 prompt 在新模型上的偏差;交付前最后 10 分钟,失控点在文件命名和平台规格。

我们后来再接产品精修单时的开工前心法不是死 SOP,是哪一类活先看哪一环——品牌客户先看需求有没有抽象词、批量需求先看落地平台规格、沿用旧 prompt 先看模型版本变没变、给了一堆参考图先看参考图本身一致性。

“先问什么”比”怎么修图”更值钱。100 张图教会我们的不是 AI 怎么用,是人怎么和 AI、客户、工具版本一起把一张图安全送到终点。下次再遇到被退回的图,先别急着改——问一句:失败发生在哪一环?方向就有了。

相关文章

推荐阅读