GPT Image 2 做详情页长图:分段出图 + 图叮精修 + 拼接的完整工作流
详情页长图通常 800×3000 像素起步,整页做到 800×6000 不算少见。让 gpt-image-2 一张直出,主体位置、版式预留位、色调在纵向上都会漂;原生输出只到 ~1254×1254 量级,强行拉伸也是糊的。截至 2026-04,图叮AI 沉淀下来的做法是”拆成 5-8 段、分段出图、PS 精修统一、最后拼接”。这篇把这套流程走一遍。
图注:详情页长图的视觉单位是”段”,不是”整张”,工作流从这里开始分叉
为什么长图不能一张出
开始讲工作流之前,先把”为什么不能一张出”说透,不然后面拆段的必要性读起来像凑字数。
gpt-image-2 截至 2026-04 在图叮AI 接入的输出档位为方形约 1254×1254 量级(以图叮AI 官方公告口径为准,后续可能扩展其他档位),跟 800×3000 的详情页长图纵向比例差了 2 倍以上。模型扩展大比例画布时会出两类问题:主体位置在纵向均匀复制,每段长得差不多;色调飘移,上段米白下段偏灰,拼回店铺跟平台其他图色差肉眼可见。
再加一层工程现实:详情页的版式本来就是”段化”的——封面段放钩子、卖点段摆 USP、细节段展示材质、使用场景段拉氛围、规格段放数据。每段构图逻辑、留白位置、主体比例都不同。让一个模型一次性扛,prompt 会写得又长又矛盾,结果”哪段都不像哪段”。
所以正确拆法是:按段的语义把长图切成 5-8 个独立画面,每段按自己的构图规则出图,再用 PS 做统一性收口,最后拼接。跟服装、美妆、3C 这些品类里积累的单段出图规律通用,只是段间多一层”色调一致性”脚手架。回顾 gpt-image-2 本身能力边界见《GPT Image 2 的能力边界总结》,上线背景和套餐价格见《GPT Image 2 在图叮AI 正式上线》——单张最低 0.06 元/张起,一整页 6 段算下来模型侧成本在 0.5 元左右,比外包一整页详情页的精修报价低两个量级。
第一步:先做布局规划,不是先写 prompt
很多人第一反应是打开图叮AI 就开始写 prompt,这是最常见的返工原因。长图工作流的第一步是铺一张”段位图”,把每段的角色定死再动笔。
图注:封面段的构图目标是”一眼抓住人”,留白位要预留给后期加标题
一张标准化的详情页长图通常拆成这几段,顺序按用户浏览决策走:
- 封面段(1:1 或 3:2):产品主体 + 品牌感背景 + 预留标题位,承担”3 秒决定要不要滑下去”的钩子职责。
- 卖点段(3:2,可能 2-3 屏):单一 USP 一屏,比如”容量大""续航久""一体成型”。视觉上要有强对比区让眼睛聚焦。
- 细节段(1:1 或 4:3):材质特写、缝线、纹理、切面。这段最考验 AI 出图的精细度,也最容易翻车。
- 使用场景段(3:2 或 16:9):把产品放进真实使用环境——厨房、办公室、户外、浴室等。
- 规格段(3:2):尺寸示意或结构图,通常背景素净,主体要正、要平。
- 买家秀段(4:3)(可选):真实用户视角,光线要比商业摄影”松”一点。
- 配送服务段(16:9)(可选):物流、售后、包装承诺相关视觉。
5 段是下限,8 段是上限。超过 8 段读者滑到底的概率会明显下降(这个是运营侧的经验观察,不同类目阈值略有差异,服装类目普遍能撑到 10-12 段、3C 类目 6-8 段就够)。先画一张简单的纸稿、甚至 Excel 表格,列三列:段名 / 比例 / 主体要素。把这张表填完再打开图叮AI 才是对的顺序。
第二步:每段用 gpt-image-2 出图
段位图敲定后,每段单独进图叮AI 的生图界面走一次。这一步的关键是每段都当成独立任务来处理,不要妄图用”同一组参考图 + 同一份 prompt 骨架”横扫所有段——因为每段的构图规则不一样。
图注:卖点段典型构图——主体靠左、留白靠右,给版式预留接口
不同段用的 prompt 骨架不同,但有几个跨段通用的变量要从第一段就锁定:
- 产品主体的关键材质描述:金属/玻璃/棉纺/木纹等,全段复用同一句。
- 统一的灯光语言:比如”柔光顶光 + 左侧 30° 补光”。每段都附带这句。
- 色调基线:给一个色卡描述(如”米白背景 #F4EFE6、单一品牌色 #3D5A4A 点缀”)。
封面段的骨架示例(服饰或护肤通用):
product centered slightly below midline, product type: [your product],
material: [固定材质描述],
background: warm off-white gradient (#F4EFE6),
top 25% empty space reserved for title layout,
lighting: soft top light with subtle left fill,
photography style: commercial studio, clean composition,
aspect ratio: 1:1
卖点段骨架:
product close-up on the left third of the frame,
material: [固定材质描述], focus on [某个具体卖点特征],
right 40% empty space for copy block,
background: neutral light gray (#EDEDED), no scene distraction,
lighting: soft top light with subtle left fill,
aspect ratio: 3:2
细节段骨架:
extreme close-up of [某个材质点],
texture visible at macro level,
minimal background blur in solid color,
lighting: soft top light with subtle left fill,
aspect ratio: 1:1
共性是锁材质、锁灯光、锁色调,留白给版式、留构图给语义。结构细节见《GPT Image 2 prompt 写法总结》,这里强调一点:长图的 prompt 不是”越详细越好”,而是”通用约束一字不差,具体画面描述精简有力”。
参考图每段放 1-3 张就够:一张纯白主体图对准造型,一张氛围图对准色调,必要时加一张局部特写。5 张参考图的组合方式在《GPT Image 2 的 5 张参考图用法》里有拆解,详情页场景建议 3 张上限——每多一张参考图,模型”犹豫”的成本就多一层,同 SKU 批量出图时容易出现段间主体外观跳变。
每段出 2-4 张备选。别省这步时间——下一步 PS 精修只能改版式和色调,改不了主体形变、手指数量、logo 扭曲这些”出发点”问题。宁可这里多花 10 分钟挑备选,也别等后期发现主体不对返工。
第三步:图叮 PS 内精修——统一色调与版式
单段出图拿到手,问题还没解决。六段图直接拼起来会马上暴露三类毛病:每段的白平衡不一致(冷暖漂移)、主体比例在纵向上跳跃、产品的品牌色点缀时多时少。这一步要在图叮AI 的 PS 插件里把这几件事收口。
把 6-8 张段图逐一拖到 PS 里开一个详情页 PSD 模板(宽度统一 800 或 750,高度按段自定),每段单独建一个图层组。然后用图叮AI PS 插件走三件事:
色调统一:挑一张定调段(通常是封面或第一屏卖点),用图叮AI 的”色调同步”把其余段向这段靠。比自己逐段拉曲线快——图叮AI 把阴影、中间调、高光三段分别匹配,比整体色相映射精细。色差敏感的服装类目同步后再人眼核对 1 遍。
局部精修:AI 出图通病——logo 扭曲、接缝错位、瓶口光影不对、材质细节模糊——用图叮AI 的”选区消除 + 局部重绘”逐段清理。细节段这步耗时最多,因为这类问题在细节段里最容易被用户放大看到。
版式留白对齐:出图时每段已经预留了版式位,但六段之间的留白位置必须在纵向上对齐——所有标题位靠左、所有副标题位居中,靠 PS 标尺和参考线拉死,不能眼估。
精修完每段再单独检查:主体位置(“视觉中心点”落在段的上 1/3 处最稳)、留白占比、色温色相跟定调段的偏差是否在可接受范围。跳过这一步的结果就是拼图后段间视觉”咔哒”一下跳。电商整体精修流程见《产品图精修工作流》,长图精修只是在那套流程上多加”跨段一致性”这一层。
第四步:拼接——PSD 模板 or 专用工具
最后一步是把 6-8 张段图拼成一张 800×N 的长图,并输出成平台要求的格式。
图注:拼接完的详情页长图缩略预览,段间过渡是否自然是最后一关
拼接有两条路线,按团队人手和量级选:
路线 A · PSD 模板(推荐给日单量 <10 页的团队)。开一个 800×6000 的空白 PSD,预先摆好每段的起始 Y 坐标(比如段 1 在 0、段 2 在 1000、段 3 在 2000…),每段导入时直接吸附到参考线。段与段之间留 24-48 像素的过渡条(可以是纯色隔断、也可以是当前段的背景色向下半透明虚化 60 像素过渡到下一段)。存成 PSD 模板复用,下次换 SKU 只要替换图层组里的段图。
路线 B · 专用拼接工具(适合日单量 >10 页或多店铺的团队)。批量拼接、带智能对齐、段间过渡预设都走脚本。这条路线的前置条件是命名规范——每段图存成 sku-001_段名_段序号.png,工具按文件名排序拼。这个对团队的协作成本会高一些,但一旦跑起来 10 页/小时不是问题。
拼接时的 3 个硬性检查:
- 段间过渡要自然。如果段 A 背景深灰、段 B 背景亮米白,硬拼中间那条缝会很刺眼。解决办法:要么在 PS 里对段 B 的顶部 30 像素拉一个向深灰过渡的渐变、要么在两段之间插一条独立的纯白分隔条。
- 纵向总高不要超平台上限。主流电商平台对详情页长边都有上限(各平台具体阈值不同,且经常调整,截至 2026-04 以各平台官方最新规则为准)。控制整体文件大小——经验上移动端单张 2MB 以内加载体验较稳,超过会影响转化。
- 导出切片要合规。过长的单张图建议按平台切片建议纵向切成 2-3 段上传(具体阈值各平台不同),否则部分机型会降质显示。切片位置要落在”段与段之间的过渡条”上,不要切穿段内的产品主体。
想看详情页整体优化思路(不局限于 AI 生图)的可以翻《电商详情页图片优化实战》那篇;服装类目的详情页视觉体系建设见《服装详情页视觉体系实战》,把段位图的设计方法讲得比本文更系统。
几个容易翻车的点
上手做第一单详情页长图时,大多数团队会在下面几个点卡住一次。把这些坑提前亮出来,能少绕很多路。
第一个坑:第一段就把色调定太极端。比如封面段用了高饱和度的品牌色背景,后面的细节段、规格段就被迫跟上,但这些段其实需要素净背景衬托主体。结果要么整页花哨得像广告牌,要么后面段硬着头皮跟色、失去功能性。解法:封面段的色调故意留点余地,品牌色点缀不要铺满。
第二个坑:每段单独出图时比例混用。有的团队段 1 出 3:2、段 2 出 1:1、段 3 又 16:9,拼起来一会胖一会瘦。除非是有意制造节奏感(比如封面 1:1、卖点 3:2 交替),否则大部分段建议统一用 3:2 或 1:1,拼接时视觉会更稳。
第三个坑:精修时只改明显瑕疵,不做跨段一致性。每段单独看都没问题,但拼起来整体”脏”。根因是跨段色调、主体尺寸、留白位置没有做统一基线。解法:在第三步精修环节,先把一张”定调段”做完整,再让其他段向它靠拢,不要 6 段并行修。
第四个坑:拼接完没在移动端实机看一遍。PSD 里完美的长图,手机屏上分辨率、色温都不一样。拼完后把成图发到微信或用手机打开本地图片至少看 1 遍——文字位能不能看清、段间过渡是否刺眼、主体细节是否糊。服装类目可以借鉴《电商产品图换主体工作流》里”换主体后移动端复检”的节奏。
一套可复用的资产清单
做到这里,一个团队应该已经有了这套可复用资产,下次新 SKU 进来直接套:
- 一张段位图模板(Excel 或纸稿都行),列出段名、比例、主体要素、prompt 骨架引用
- 一套跨段通用 prompt 变量(材质、灯光、色调基线),每个 SKU 只改”主体”字段
- 一个详情页 PSD 拼接模板(800×N,预设段的起始 Y 坐标和参考线)
- 一份精修一致性清单(色温色相偏差阈值、主体视觉中心位置、留白占比)
- 一张移动端复检截图清单(文字位、段间过渡、细节锐度)
这套东西搭起来后,下次换 SKU 重做一整页长图的时间会从第一次 3-4 小时压到 40 分钟以内——因为真正耗时的是”流程决策”,不是每段的出图和精修本身。
gpt-image-2 在长图场景的价值定位是:不是”一键出长图”的银弹,而是把”单段图”这步的出图成本从外包的几十元压到 0.06 元起。流程前半段(规划、拆稿)和后半段(精修、拼接、复检)仍然要人判断——这也是电商视觉团队在 AI 浪潮里锚定价值的位置。外包精修的定价模型和分档报价在《AI 修图定价模型对比》里有完整拆解,可以对照着算自己团队的流水上限。
截至 2026-04,这套”分段出图 + 图叮精修 + 拼接”工作流已经在图叮AI 几十单真实订单里跑过。后续平台详情页规范、gpt-image-2 的输出档位都可能调整,具体阈值以平台和图叮AI 的最新规则为准。
相关文章
瓷砖地板房间铺装效果图:6 种铺贴方案的 AI 合成 SOP
佛山瓷砖厂 200 个花色 SKU 但只有 8 个样板间,电商详情页 80% 是棚拍单片。本文给出从单片砖到房间效果的 4 步流程,覆盖 6 种铺贴方案与 5 项质检。
GPT Image 2 一张商品图适配 4 平台:淘宝 / 抖音 / 小红书 / 拼多多 的比例与风格差异(截至 2026-04)
同一款产品铺淘宝、抖音、小红书、拼多多 4 个平台,比例和风格完全不同。这篇讲清 GPT Image 2 一次出图、多平台衍生的完整做法:参考图怎么锁主体、prompt 怎么按平台切、各平台可用率和翻车点。
图叮AI vs 即梦AI:中文商品 prompt、白底主图和 SKU 一致性,谁更适合电商团队?
即梦AI中文理解强、创意图质量高,图叮AI在PS内原生集成、批量商品工作流成熟。本文从中文商品prompt、白底主图精修、SKU批量一致性三个电商核心场景出发,给出分场景选型建议。
图叮AI vs Midjourney:电商商品场景图,哪种流程更省返工
同一批白底商品图,分别走 Midjourney 和图叮 AI 生成可投放详情页场景图,耗时、返工次数、中文 SKU 一致性都不同。这篇文章把两条路的差异逐段拆开,给出场景决策规则。
推荐阅读
AI转身功能:让模特照片一键变换身体朝向和姿态
用图叮AI的转身功能调整模特照片中的身体朝向,适用于电商服装展示需要多角度模特图的场景,一张照片生成多个姿态。
电饭煲厨房场景融合:透明部件也能与背景完美衔接
图叮AI产品溶图打光处理含透明锅盖的电饭煲产品图,AI自动识别透明部位并与背景融合,解决透明材质产品的场景融合难题。
香水产品光影融合三步搞定:从白底图到质感效果图
通过三步操作将香水瓶白底图融入奢华场景,图叮AI产品溶图打光自动处理光影不自然的问题,生成符合品牌调性的电商主图。
费尔岛毛衣花纹提取:小熊提花的纹样线条精准还原
图叮花纹提取功能从费尔岛风格小熊提花毛衣上提取纹样,修正褶皱变形并精准捕捉复杂编织线条走向。