跳转到主内容
·

GPT Image 2 合成家居场景图:客厅 / 卧室 / 书房 3 种场景的 prompt 与翻车规避

家居电商的场景图比其他品类更难做——消费者不仅看好不好看,还会下意识评估尺寸感、光影合不合常理、材质是不是”塑料味”。GPT Image 2 在图叮AI 上线后(截至 2026-04),我们用客厅、卧室、书房三种典型场景各跑了上百轮,把每种场景里真正能稳定出图的 prompt 写法和最常见的翻车规避动作整理在这里。

现代客厅全景俯斜视角,米色三人沙发配实木茶几,灰麻地毯覆盖沙发区,侧面落地窗透进自然光 图注:客厅场景图的三要素——沙发与茶几比例、地毯覆盖范围、窗帘材质

为什么家居场景图比其他品类更吃 prompt 功夫

先把结论放前面:家居类目的场景图翻车,绝大多数不是模型能力问题,而是 prompt 没给到关键的比例锚点和材质描述。

这一点和美妆、3C、服饰不一样。美妆品类的场景图消费者更看重色彩和质感,比例失真影响没那么大;3C 品类白底图就能解决大部分问题;服饰有模特就自带比例参照。家居不同——用户看完图的下一步动作往往是量自己客厅有多大、床头柜能不能塞下当前空位。尺寸错半米,整张图的信任就塌了。

截至 2026-04,我们在图叮AI 上每天跑家居场景图的量级不小,翻出的翻车主要集中在三类:

  • 比例失真:沙发看起来 1.5 米实际该有 2.2 米,或者床头柜高度超过床沿一大截
  • 光影不自然:窗户在左边但影子朝左倒,或者吊灯发光但地上没对应亮斑
  • 材质过 AI:皮革沙发变塑料,棉麻窗帘变橡胶,实木家具变无纹理塑料板

后面三节分别按客厅、卧室、书房拆,每节按”典型产品组合 / 参考图怎么搭 / prompt 要点 / 翻车规避”的顺序说。想先看 GPT Image 2 的 5 张参考图怎么组合更稳定,可以回头读GPT Image 2 的 5 张参考图怎么用才不乱;想看中文 prompt 的通用写法,参考GPT Image 2 的提示词写法

客厅场景:比例是信任的底线

客厅是家居场景图里做得最多的场景,也是最容易翻车的一个。原因很简单——客厅里的家具件数多,沙发、茶几、地毯、落地灯、窗帘、抱枕、挂画,每一件都有自己的比例和材质,任何一件跑偏就会拉低整张图的可信度。

典型产品组合

客厅场景下我们最常接到的是这几类:三人沙发 + 茶几 + 地毯的组合、单体沙发 + 落地灯的氛围图、窗帘单品融入客厅背景的场景图。组合越多,模型越容易在比例上出问题,所以一次不要试图把客厅里所有家具都合进去——挑 2-3 件主角,其他作为背景存在即可。

参考图组合(建议 4-5 张)

参考图推荐按”主体 + 同风格参照”的结构组合:

  • 参考图 1(主体产品图):沙发或茶几的白底或轻背景产品图,用来锁尺寸比例和材质细节
  • 参考图 2(风格基准场景):已经拍过、氛围符合品牌调性的老客厅场景图,锁光比和色调
  • 参考图 3(材质细节近摄):沙发面料或茶几木纹的特写,让模型抓住织物纹理和木纹深度
  • 参考图 4(比例参照物):客厅里的身高参照——比如有人坐在沙发上的真实场景图,或者一把标准书椅放在茶几旁
  • 参考图 5(可选,窗帘或软装):如果需要特定窗帘材质或色调,单独附一张

参考图 4 这张比例参照物很多人忽略,但对客厅场景图特别重要。模型看过”沙发旁边坐了个真人”的图之后,再生成同一张沙发时,比例稳定度明显提升。

Prompt 要点

客厅场景的 prompt 核心是把”比例锚点 + 光源方向 + 材质类别”写清楚。参考写法:

现代客厅,三人米色布艺沙发居中偏左,沙发长度约 2.2 米(与身高 1.7 米成年人坐下后肩高比例一致),实木茶几置于沙发前方 50-60 厘米,地毯覆盖沙发和茶几下方整个区域延展至沙发外 30 厘米,侧面落地窗透入柔和自然光,窗帘为米白色亚麻材质半拉开,整体色调温暖但不浓烈,商业摄影风格,自然光主导

几个值得抽出来说的要点:

  • 比例用具体数字:不要写”大沙发 + 小茶几”,写”沙发长度约 2.2 米 / 茶几高度约 40 厘米”,数字越具体模型越容易对齐
  • 地毯覆盖范围要写清楚:地毯是客厅比例感的隐形锚点,只盖住沙发下方的 1/3 会显得空间局促,覆盖到沙发外 30 厘米就显得空间舒展
  • 窗帘材质明确到材料:“亚麻 / 纯棉 / 天鹅绒”这些写清楚,不要只写”窗帘”——GPT Image 2 对材质类别敏感,但对模糊描述容易默认走塑料感
  • 光源方向:写”侧面落地窗”比写”自然光”更能让模型锁定光影方向

翻车规避

比例失真:沙发出来像 1.5 米的单人沙发,实际应该是 2.2 米的三人款。对策:在 prompt 里明确”三人沙发 / 沙发长度 2.2 米左右 / 能坐下 3 个成年人”,并在参考图里加一张带真人坐姿的对比图。

光影不自然:吊灯打光但地板没对应高光,或者窗户在左侧但沙发右侧有反光。对策:prompt 主光源只写一处,避免同时写”吊灯 + 落地灯 + 窗户自然光”导致模型无法决定主光方向。如果确实需要多光源氛围,把其中一个降级为”点缀灯源,不作为主光”。

材质过 AI:棉麻沙发出来像塑料皮革感。对策:参考图里必须有一张面料特写,prompt 里材质要写到具体材料(“米色棉麻布艺,有明显织物纹理,非皮革非塑料”),负面描述可以直接加”避免塑料感 / 高光亮面”。

比例失真对比:左图沙发偏小像单人款尺寸错位,右图沙发比例正常与茶几地毯形成合理空间关系 图注:左图是常见的比例失真翻车,右图是正常的客厅比例

卧室场景:床是最硬的比例基准

卧室场景图有个和客厅不一样的特点——消费者对床的尺寸有很强的心理预期。1.5 米双人床、1.8 米大床、2 米超大床,这些尺寸在用户脑子里有清晰的画面,稍微错一点就会被识破。

典型产品组合

卧室场景下最常做的组合:床 + 床头柜 + 床头灯、床 + 床品四件套、床 + 落地灯 + 飘窗氛围图、独立床头柜产品融入卧室环境图。床在大多数组合里都是主角,少数情况床品或床头柜是主角,床作为背景存在。

参考图组合(建议 3-5 张)

  • 参考图 1(床或床头柜主体图):产品白底图或轻背景图
  • 参考图 2(完整卧室氛围图):同风格的已拍卧室图,锁光比和空间感
  • 参考图 3(床品面料或床头柜木纹特写):材质锚点
  • 参考图 4(床尺寸参照):带人物的卧室图或者床边放标准枕头(50×70cm)作为尺寸参照
  • 参考图 5(可选,床头灯或装饰画):补充软装细节

Prompt 要点

卧室 prompt 的核心是把床的尺寸、床头柜的高度、床头灯的比例这三个关键比例关系写明确。参考写法:

现代卧室,1.8 米双人床居中靠墙,床头背景墙面为浅灰色乳胶漆,床头柜高度约 55 厘米(与床垫上表面齐平或略低 5 厘米),床头柜上放一盏落地灯,灯高约 150 厘米(从床头柜顶算起约 95 厘米),床品为纯棉米白色四件套有轻微褶皱,地面为浅色原木地板,侧面窗户透入柔和晨光,商业摄影,自然光为主

要点说明:

  • 床头柜高度和床沿齐平是黄金比例:不写清楚模型经常生成高度比床还高一截的床头柜,看起来像餐桌
  • 落地灯比例用”从底算”的绝对高度:别写”高落地灯”,写”灯高 150 厘米”更稳
  • 床品褶皱要写但不过度:不写就是塑料感的平板;写”轻微褶皱 / 自然垂坠感”能出真实布料质感;写”大量褶皱”会出凌乱床
  • 窗户方向:写明”侧面 / 床尾方向 / 床头方向”哪一侧有窗,避免光影冲突

翻车规避

床尺寸错误:1.8 米床出来像 1.5 米,或者反过来。对策:prompt 里明确”1.8 米 × 2.0 米双人床”,参考图里放一张带标准枕头(50×70cm,两只并排的宽度恰好 1 米)的真实卧室图作为比例锚点。

床头柜比床沿高一截:看起来像把餐桌放床边。对策:明确写”床头柜顶面与床垫上表面齐平或略低 5 厘米”,这句是关键。

落地灯比例异常:灯比床还高,或者矮得像台灯。对策:写绝对高度(“灯高 150 厘米”)比写相对描述(“高 / 矮 / 适中”)稳得多。

床品过 AI:棉麻床品出来像塑料膜。对策:参考图里必须有一张床品面料特写,prompt 材质写到具体(“纯棉 100% / 棉麻混纺 60% 棉 40% 麻 / 天丝质感”),加一句”保留自然织物纹理”。

卧室场景:1.8 米双人床配床头柜和落地灯,床品米白色纯棉带轻微褶皱,侧窗透入柔和光线 图注:床 + 床头柜 + 落地灯的三件套比例关系是卧室场景图的核心锚点

书房场景:纵深感比宽度更重要

书房场景和客厅、卧室不一样的地方在于——书房是一个强功能性场景,用户看图时下意识评估”能不能好好工作”。书桌高度能不能舒服放手、椅子能不能靠进桌子底下、书架纵深够不够放大部头,这些决定书房场景图的可信度。

典型产品组合

书房场景下最常做的组合:书桌 + 办公椅、独立书架产品图融入书房环境、书桌 + 台灯 + 书架完整工作区、人体工学椅融入书房氛围图。

参考图组合(建议 3-4 张)

书房的参考图可以比客厅/卧室少一张,因为场景元素相对简单:

  • 参考图 1(书桌或椅子主体图):产品白底图
  • 参考图 2(完整书房氛围):同风格已拍的书房照
  • 参考图 3(木纹或面料特写):书桌材质或椅子面料锚点
  • 参考图 4(可选,书架陈列参考):如果涉及书架,加一张包含书脊深度的参照图

Prompt 要点

书房 prompt 的核心是把书桌高度、椅子坐高、书架纵深这三个功能性尺寸写清楚。参考写法:

现代书房,实木书桌居中靠墙,桌面高度约 75 厘米(标准办公高度),人体工学椅坐高约 45 厘米可完整滑进桌下(桌下净空约 65 厘米),书桌右侧墙面为深色实木书架高约 210 厘米,书架每格纵深 30 厘米可容纳大部头书籍,书桌上放一盏现代台灯,侧面窗户透入晨光,整体色调温暖偏中性,商业摄影,自然光主导

要点:

  • 桌面高度 75 厘米是标准:这个数字几乎是办公家具的通用标准,写清楚模型能更稳生成合理比例
  • 桌下净空至少 65 厘米:否则椅子滑不进去,画面看起来椅子是浮在桌外的
  • 书架纵深是关键:只写”书架”经常出来贴墙薄架(15 厘米以内),放不下大书看起来就假。写”每格纵深 30 厘米”更稳
  • 椅子要能滑进桌下:prompt 里明确”椅子可完整滑入桌下”,避免出那种椅子横在桌前的奇怪构图

翻车规避

桌面高度异常:出来的书桌看起来像小学生课桌(60 厘米)或者吧台(95 厘米)。对策:prompt 明确”标准办公高度 75 厘米”。

椅子滑不进桌下:看起来椅子是摆在桌子旁边的,不是配套的。对策:明确”椅子可完整滑入桌下 / 桌下净空约 65 厘米 / 椅子与桌面呈标准办公坐姿关系”。

书架纵深过浅:书架贴墙像装饰板,放不下厚书。对策:写明”每格纵深 30 厘米 / 可容纳大部头书籍 / 非装饰性薄架”。

台灯比例失调:台灯高过整个书桌高度。对策:写绝对高度(“台灯整体高约 40-50 厘米”)或相对描述(“台灯高约为书桌厚度的 1.5 倍”)。

书房场景:实木书桌配人体工学椅,右侧深色木书架纵深充足可容大部头书籍,侧窗自然光 图注:书房场景图的功能性比例比美观更重要

三种场景共通的 5 个翻车规避原则

前面拆完三种场景后,回过头看有些规避动作是通用的。下面这 5 条是不管做哪种家居场景图都应该在 prompt 里刻意处理的。

第一:比例锚点优先用数字。写”大沙发”不如写”2.2 米三人沙发”,写”高床头柜”不如写”55 厘米床头柜”。模型对模糊描述的默认值经常和你想的不一样,数字是最可靠的锚点。

第二:主光源只写一处。客厅写”侧面落地窗”就够了,不要同时写”吊灯 + 落地灯 + 窗户”;卧室写”床头方向窗户晨光”就够了,不要同时加”吊顶筒灯 + 床头阅读灯”。多光源模型会混,结果是哪个光影都不对。

第三:材质写到具体材料。不要写”沙发”,写”棉麻布艺沙发”;不要写”木质茶几”,写”实木茶几 / 橡木 / 胡桃木”;不要写”窗帘”,写”亚麻窗帘 / 纯棉窗帘 / 天鹅绒窗帘”。材质类别越明确,出 AI 塑料感的概率越低。

第四:参考图要有材质特写。5 张参考图里至少留一张给材质特写——沙发面料的微观纹理、木纹的深浅、床品的织物走向。这张图对规避材质过 AI 的作用比任何 prompt 描述都有效。

第五:避免图内文字。家居场景图不要让模型画海报文字、品牌 logo、价格标签。GPT Image 2 截至 2026-04 中文渲染稳定度还有限,文字类需求单独用其他工具处理,不要挤在场景图 prompt 里。

图叮AI 上跑这套流程的实际成本

上面这套 prompt 逻辑在图叮AI 上跑的成本挺低——GPT Image 2 单张0.06 元/张起,家居场景图从第一轮试错到定稿通常 3-5 轮,也就是几毛钱出一张能用的图。

实操流程是这样的:

  1. 先跑第一轮最简 prompt:不加复杂参考图,只写最基础的”客厅 / 卧室 / 书房 + 主要家具 + 光线方向”。看模型默认能出到什么水平。
  2. 根据第一轮结果补参考图:哪块比例不对补比例参照图,哪块材质不对补材质特写图,有针对性地加。
  3. 第三轮以后开始精调数字:比例数字、材质类别、光源方向逐条细化。
  4. 最终定稿前检查 5 个通用原则:数字锚点、主光源、材质具体、参考图材质特写、避免图内文字。

按这套流程走,单张图的平均试错轮数通常能压到 3-4 轮,成本大概 0.2-0.3 元。对比传统拍摄(家居场景租棚一天几千元、外请模特布景几万元),成本差了三个数量级。

关于家居电商场景图合成的更底层策略,可以参考家居场景图合成实战:软装搭配与空间感营造策略;关于家具场景图里最容易踩的比例陷阱,参考家具场景图最大的坑不是假,而是尺寸感错了

把 prompt 逻辑从”试错”沉淀成”模板”

做了几百张之后回头看,家居场景图的 prompt 逻辑其实可以结构化——每种场景都是”核心主体 + 配套家具 + 空间元素 + 光源 + 材质锚点”五段式。把这个结构记下来,每次写新 prompt 时按顺序填进去,比凭感觉写稳定得多。

截至 2026-04,我们把这套 prompt 逻辑也在积累团队内部的模板库——每新做一个细分场景(比如日式卧室、美式客厅、北欧书房),就把对应的 prompt 模板沉淀下来,下次遇到同类需求直接套。这是家居电商团队效率最大化的关键:不是每张图都从零写,而是把稳定出图的 prompt 结构固化成可复用的资产。

GPT Image 2 单张起步 0.06 元的定价让这种”多轮试错 + 模板沉淀”的工作方式变得经济可行。以前传统拍摄时代,一个风格拍错就是几千块损失,没人敢大批量试;现在单张几毛钱,多跑几轮把 prompt 跑稳才是真正省钱的做法。

相关文章

推荐阅读