GPT Image 2 做详情页长图:分段出图 + 图叮精修 + 拼接的完整工作流
详情页长图通常 800×3000 像素起步,整页做到 800×6000 不算少见。让 gpt-image-2 一张直出,主体位置、版式预留位、色调在纵向上都会漂;原生输出只到 ~1254×1254 量级,强行拉伸也是糊的。截至 2026-04,图叮AI 沉淀下来的做法是”拆成 5-8 段、分段出图、PS 精修统一、最后拼接”。这篇把这套流程走一遍。
图注:详情页长图的视觉单位是”段”,不是”整张”,工作流从这里开始分叉
为什么长图不能一张出
开始讲工作流之前,先把”为什么不能一张出”说透,不然后面拆段的必要性读起来像凑字数。
gpt-image-2 截至 2026-04 在图叮AI 接入的输出档位为方形约 1254×1254 量级(以图叮AI 官方公告口径为准,后续可能扩展其他档位),跟 800×3000 的详情页长图纵向比例差了 2 倍以上。模型扩展大比例画布时会出两类问题:主体位置在纵向均匀复制,每段长得差不多;色调飘移,上段米白下段偏灰,拼回店铺跟平台其他图色差肉眼可见。
再加一层工程现实:详情页的版式本来就是”段化”的——封面段放钩子、卖点段摆 USP、细节段展示材质、使用场景段拉氛围、规格段放数据。每段构图逻辑、留白位置、主体比例都不同。让一个模型一次性扛,prompt 会写得又长又矛盾,结果”哪段都不像哪段”。
所以正确拆法是:按段的语义把长图切成 5-8 个独立画面,每段按自己的构图规则出图,再用 PS 做统一性收口,最后拼接。跟服装、美妆、3C 这些品类里积累的单段出图规律通用,只是段间多一层”色调一致性”脚手架。回顾 gpt-image-2 本身能力边界见《GPT Image 2 的能力边界总结》,上线背景和套餐价格见《GPT Image 2 在图叮AI 正式上线》——单张最低 0.06 元/张起,一整页 6 段算下来模型侧成本在 0.5 元左右,比外包一整页详情页的精修报价低两个量级。
第一步:先做布局规划,不是先写 prompt
很多人第一反应是打开图叮AI 就开始写 prompt,这是最常见的返工原因。长图工作流的第一步是铺一张”段位图”,把每段的角色定死再动笔。
图注:封面段的构图目标是”一眼抓住人”,留白位要预留给后期加标题
一张标准化的详情页长图通常拆成这几段,顺序按用户浏览决策走:
- 封面段(1:1 或 3:2):产品主体 + 品牌感背景 + 预留标题位,承担”3 秒决定要不要滑下去”的钩子职责。
- 卖点段(3:2,可能 2-3 屏):单一 USP 一屏,比如”容量大""续航久""一体成型”。视觉上要有强对比区让眼睛聚焦。
- 细节段(1:1 或 4:3):材质特写、缝线、纹理、切面。这段最考验 AI 出图的精细度,也最容易翻车。
- 使用场景段(3:2 或 16:9):把产品放进真实使用环境——厨房、办公室、户外、浴室等。
- 规格段(3:2):尺寸示意或结构图,通常背景素净,主体要正、要平。
- 买家秀段(4:3)(可选):真实用户视角,光线要比商业摄影”松”一点。
- 配送服务段(16:9)(可选):物流、售后、包装承诺相关视觉。
5 段是下限,8 段是上限。超过 8 段读者滑到底的概率会明显下降(这个是运营侧的经验观察,不同类目阈值略有差异,服装类目普遍能撑到 10-12 段、3C 类目 6-8 段就够)。先画一张简单的纸稿、甚至 Excel 表格,列三列:段名 / 比例 / 主体要素。把这张表填完再打开图叮AI 才是对的顺序。
第二步:每段用 gpt-image-2 出图
段位图敲定后,每段单独进图叮AI 的生图界面走一次。这一步的关键是每段都当成独立任务来处理,不要妄图用”同一组参考图 + 同一份 prompt 骨架”横扫所有段——因为每段的构图规则不一样。
图注:卖点段典型构图——主体靠左、留白靠右,给版式预留接口
不同段用的 prompt 骨架不同,但有几个跨段通用的变量要从第一段就锁定:
- 产品主体的关键材质描述:金属/玻璃/棉纺/木纹等,全段复用同一句。
- 统一的灯光语言:比如”柔光顶光 + 左侧 30° 补光”。每段都附带这句。
- 色调基线:给一个色卡描述(如”米白背景 #F4EFE6、单一品牌色 #3D5A4A 点缀”)。
封面段的骨架示例(服饰或护肤通用):
product centered slightly below midline, product type: [your product],
material: [固定材质描述],
background: warm off-white gradient (#F4EFE6),
top 25% empty space reserved for title layout,
lighting: soft top light with subtle left fill,
photography style: commercial studio, clean composition,
aspect ratio: 1:1
卖点段骨架:
product close-up on the left third of the frame,
material: [固定材质描述], focus on [某个具体卖点特征],
right 40% empty space for copy block,
background: neutral light gray (#EDEDED), no scene distraction,
lighting: soft top light with subtle left fill,
aspect ratio: 3:2
细节段骨架:
extreme close-up of [某个材质点],
texture visible at macro level,
minimal background blur in solid color,
lighting: soft top light with subtle left fill,
aspect ratio: 1:1
共性是锁材质、锁灯光、锁色调,留白给版式、留构图给语义。结构细节见《GPT Image 2 prompt 写法总结》,这里强调一点:长图的 prompt 不是”越详细越好”,而是”通用约束一字不差,具体画面描述精简有力”。
参考图每段放 1-3 张就够:一张纯白主体图对准造型,一张氛围图对准色调,必要时加一张局部特写。5 张参考图的组合方式在《GPT Image 2 的 5 张参考图用法》里有拆解,详情页场景建议 3 张上限——每多一张参考图,模型”犹豫”的成本就多一层,同 SKU 批量出图时容易出现段间主体外观跳变。
每段出 2-4 张备选。别省这步时间——下一步 PS 精修只能改版式和色调,改不了主体形变、手指数量、logo 扭曲这些”出发点”问题。宁可这里多花 10 分钟挑备选,也别等后期发现主体不对返工。
第三步:图叮 PS 内精修——统一色调与版式
单段出图拿到手,问题还没解决。六段图直接拼起来会马上暴露三类毛病:每段的白平衡不一致(冷暖漂移)、主体比例在纵向上跳跃、产品的品牌色点缀时多时少。这一步要在图叮AI 的 PS 插件里把这几件事收口。
把 6-8 张段图逐一拖到 PS 里开一个详情页 PSD 模板(宽度统一 800 或 750,高度按段自定),每段单独建一个图层组。然后用图叮AI PS 插件走三件事:
色调统一:挑一张定调段(通常是封面或第一屏卖点),用图叮AI 的”色调同步”把其余段向这段靠。比自己逐段拉曲线快——图叮AI 把阴影、中间调、高光三段分别匹配,比整体色相映射精细。色差敏感的服装类目同步后再人眼核对 1 遍。
局部精修:AI 出图通病——logo 扭曲、接缝错位、瓶口光影不对、材质细节模糊——用图叮AI 的”选区消除 + 局部重绘”逐段清理。细节段这步耗时最多,因为这类问题在细节段里最容易被用户放大看到。
版式留白对齐:出图时每段已经预留了版式位,但六段之间的留白位置必须在纵向上对齐——所有标题位靠左、所有副标题位居中,靠 PS 标尺和参考线拉死,不能眼估。
精修完每段再单独检查:主体位置(“视觉中心点”落在段的上 1/3 处最稳)、留白占比、色温色相跟定调段的偏差是否在可接受范围。跳过这一步的结果就是拼图后段间视觉”咔哒”一下跳。电商整体精修流程见《产品图精修工作流》,长图精修只是在那套流程上多加”跨段一致性”这一层。
第四步:拼接——PSD 模板 or 专用工具
最后一步是把 6-8 张段图拼成一张 800×N 的长图,并输出成平台要求的格式。
图注:拼接完的详情页长图缩略预览,段间过渡是否自然是最后一关
拼接有两条路线,按团队人手和量级选:
路线 A · PSD 模板(推荐给日单量 <10 页的团队)。开一个 800×6000 的空白 PSD,预先摆好每段的起始 Y 坐标(比如段 1 在 0、段 2 在 1000、段 3 在 2000…),每段导入时直接吸附到参考线。段与段之间留 24-48 像素的过渡条(可以是纯色隔断、也可以是当前段的背景色向下半透明虚化 60 像素过渡到下一段)。存成 PSD 模板复用,下次换 SKU 只要替换图层组里的段图。
路线 B · 专用拼接工具(适合日单量 >10 页或多店铺的团队)。批量拼接、带智能对齐、段间过渡预设都走脚本。这条路线的前置条件是命名规范——每段图存成 sku-001_段名_段序号.png,工具按文件名排序拼。这个对团队的协作成本会高一些,但一旦跑起来 10 页/小时不是问题。
拼接时的 3 个硬性检查:
- 段间过渡要自然。如果段 A 背景深灰、段 B 背景亮米白,硬拼中间那条缝会很刺眼。解决办法:要么在 PS 里对段 B 的顶部 30 像素拉一个向深灰过渡的渐变、要么在两段之间插一条独立的纯白分隔条。
- 纵向总高不要超平台上限。主流电商平台对详情页长边都有上限(各平台具体阈值不同,且经常调整,截至 2026-04 以各平台官方最新规则为准)。控制整体文件大小——经验上移动端单张 2MB 以内加载体验较稳,超过会影响转化。
- 导出切片要合规。过长的单张图建议按平台切片建议纵向切成 2-3 段上传(具体阈值各平台不同),否则部分机型会降质显示。切片位置要落在”段与段之间的过渡条”上,不要切穿段内的产品主体。
想看详情页整体优化思路(不局限于 AI 生图)的可以翻《电商详情页图片优化实战》那篇;服装类目的详情页视觉体系建设见《服装详情页视觉体系实战》,把段位图的设计方法讲得比本文更系统。
几个容易翻车的点
上手做第一单详情页长图时,大多数团队会在下面几个点卡住一次。把这些坑提前亮出来,能少绕很多路。
第一个坑:第一段就把色调定太极端。比如封面段用了高饱和度的品牌色背景,后面的细节段、规格段就被迫跟上,但这些段其实需要素净背景衬托主体。结果要么整页花哨得像广告牌,要么后面段硬着头皮跟色、失去功能性。解法:封面段的色调故意留点余地,品牌色点缀不要铺满。
第二个坑:每段单独出图时比例混用。有的团队段 1 出 3:2、段 2 出 1:1、段 3 又 16:9,拼起来一会胖一会瘦。除非是有意制造节奏感(比如封面 1:1、卖点 3:2 交替),否则大部分段建议统一用 3:2 或 1:1,拼接时视觉会更稳。
第三个坑:精修时只改明显瑕疵,不做跨段一致性。每段单独看都没问题,但拼起来整体”脏”。根因是跨段色调、主体尺寸、留白位置没有做统一基线。解法:在第三步精修环节,先把一张”定调段”做完整,再让其他段向它靠拢,不要 6 段并行修。
第四个坑:拼接完没在移动端实机看一遍。PSD 里完美的长图,手机屏上分辨率、色温都不一样。拼完后把成图发到微信或用手机打开本地图片至少看 1 遍——文字位能不能看清、段间过渡是否刺眼、主体细节是否糊。服装类目可以借鉴《电商产品图换主体工作流》里”换主体后移动端复检”的节奏。
一套可复用的资产清单
做到这里,一个团队应该已经有了这套可复用资产,下次新 SKU 进来直接套:
- 一张段位图模板(Excel 或纸稿都行),列出段名、比例、主体要素、prompt 骨架引用
- 一套跨段通用 prompt 变量(材质、灯光、色调基线),每个 SKU 只改”主体”字段
- 一个详情页 PSD 拼接模板(800×N,预设段的起始 Y 坐标和参考线)
- 一份精修一致性清单(色温色相偏差阈值、主体视觉中心位置、留白占比)
- 一张移动端复检截图清单(文字位、段间过渡、细节锐度)
这套东西搭起来后,下次换 SKU 重做一整页长图的时间会从第一次 3-4 小时压到 40 分钟以内——因为真正耗时的是”流程决策”,不是每段的出图和精修本身。
gpt-image-2 在长图场景的价值定位是:不是”一键出长图”的银弹,而是把”单段图”这步的出图成本从外包的几十元压到 0.06 元起。流程前半段(规划、拆稿)和后半段(精修、拼接、复检)仍然要人判断——这也是电商视觉团队在 AI 浪潮里锚定价值的位置。外包精修的定价模型和分档报价在《AI 修图定价模型对比》里有完整拆解,可以对照着算自己团队的流水上限。
截至 2026-04,这套”分段出图 + 图叮精修 + 拼接”工作流已经在图叮AI 几十单真实订单里跑过。后续平台详情页规范、gpt-image-2 的输出档位都可能调整,具体阈值以平台和图叮AI 的最新规则为准。
相关文章
AI 购物智能体开始下单:商品图要从好看变成可被机器读懂
AI 购物正在从搜索推荐走向站内下单。商品图不能只追求氛围感,还要让购物智能体读懂规格、材质、颜色、尺寸和证据细节,减少误判。
同一款香薰机 AI 场景图,给 1 张、3 张、5 张参考图会差在哪?
AI 场景图不是参考图越多越稳。本文用一款香薰机做单案例复盘,拆解 1 张、3 张、5 张参考图分别会带来哪些商品证据、材质和场景偏差。
AI 图像标识变成常态,商品图修图要不要留证据链?
AI 生成内容标识和 Content Credentials 正在进入默认化阶段。本文比较只交成图与带证据链交付两种商品图修图流程,帮电商团队提前改掉不可追溯的交付习惯。
图叮 AI vs 通义万相:电商场景图生成和 SKU 证据修图怎么分工
通义万相适合做创意场景图,图叮更适合商品证据保真和批量交付。本文从意图、证据、批量、团队协作四个维度拆解两类工具怎么分工。
推荐阅读
玻璃杯融入客厅场景:产品融图打光处理透明产品合成
透明玻璃杯放进场景图总是看起来不自然?图叮AI产品融图打光功能自动处理玻璃折射和投影,一步完成透明产品场景合成。
3C 充电器接口图:修得干净,还是保留真实触点更重要
3C 充电器、数据线和转接头的接口图,不能只追求干净。金属触点、插头方向、认证标识和磨损边界,决定买家能不能判断规格与可信度。
一张宠物自动喂食器图怎么拆:粮仓、出粮口和电源线的 6 个证据点
宠物自动喂食器商品图不能只修干净。本文把主图拆成 6 个证据区,说明粮仓刻度、出粮口、防咬线和电源接口该怎么保留,并给外包复审一套标注口径。
二手商品图怎么拍才有人买:8个高频问题与信任清单
二手商品图既要真实又要有成交吸引力,两者缺一不可。8个高频问题讲清楚成色展示、瑕疵处理、背景选择和平台规格的边界,附上架前实用检查清单。