6.1 KiB
Raw Permalink Blame History

七、声音设计(前置到 Prompt 层级)

Seedance 2.0 原生支持音频生成——对白口型同步、程序化音效是同一生成事件的产物,不是后期工序。声音设计必须前置到 Prompt 层面。

7.1 对白口型同步

对白文本必须逐字出现在对应镜头的Prompt中用双引号包裹并标明类型

  • VO画外音/旁白):标注为「角色名(VO):原文」。无空间混响的叙述声音,不驱动任何画面内角色的口型。
  • OS内心独白/心理活动):标注为「角色名(OS):原文」。非空间化声音——没有房间混响,仿佛直接从角色内部传来。画面内对应角色的面部微表情应有配合(嘴唇不一定动,但眼神、眉心、呼吸应有配合)。
  • 现场声:标注为「角色名:原文」。驱动对应角色的口型同步,声音带有场景的空间混响特征。

禁止使用「画外音」「心中所想」「旁白」等文字标签替代VO/OS——必须使用标准标注。

7.2 环境音的三层结构

每段指定2~3层环境音

  • 背景层(始终在响但不应被注意):如「中央空调的低频嗡鸣」「远处高速路的隐约胎噪」
  • 中景层(偶尔被注意,制造空间感):如「隔壁房间的电视声音闷在墙后」「窗外偶尔经过的电动车」
  • 前景层(直接参与叙事):如「炉灶上的水烧开了,持续尖锐的鸣叫」「她的鞋跟在水泥地上每一步都敲出空旷的回声」

7.3 主观音效的叙事功能

主观音效(耳鸣、心跳放大、呼吸强调、声音失真)出现在情绪临界点。至少每段一处。

心跳放大的使用约束: 必须有一个具体的生理触发——看到某个人、听到某个名字、意识到某件事——不能用「因为紧张所以心跳加速」空洞因果。

耳鸣的叙事精确性: 描述时至少涵盖两个维度——频率(高频尖锐/低频轰鸣)和起止方式(突然侵入/缓慢逼近/一直在但刚被注意到)。

呼吸强调: 描述呼吸的具体物理质感——「每一次呼气都带着轻微的颤音」「吸气时空气在喉咙里摩擦的声音被放大了」。

静默作为叙事工具:静默定格切

情绪高潮处点头确认、真相被说出口、第一次眼神对接在下一个镜头切进来之前将当前镜头的最后一秒完全静音——环境音、呼吸声、衣料摩擦声全部撤走——然后在这片静默中切到下一个镜头。静默时长0.5~1秒。每集最多1次。静默切不能与主观音效在同一镜头上叠加。

呼吸式静默: 在连续58秒环境音+对白后插入11.5秒环境音几乎消失的段落——不是绝对静默保留极低背景层声而是声音突然「撤离」。每集可用1~2次不占用沉默镜头配额。

7.4 禁止背景音乐与字幕抑制

本剧不使用任何背景音乐。每个Prompt末尾统一追加

[无背景音乐,仅环境音与对白] [无字幕]

允许的声音环境音三层结构、角色对白VO/OS/现场声)、程序化音效、主观音效、非视觉触发的关键音效补充。 禁止的声音:任何背景音乐/配乐/旋律/节奏性器乐、屏幕字幕/唱词/任何屏幕文字叠加。

7.5 声学空间与混响

同一声音在不同空间里的听感天差地别。

声学空间三要素:

要素 描述 Prompt写法示例
混响时间 声音发出后回声多久消散。长混响(>1秒=空旷/疏离;短混响(<0.3秒)=私密/被包裹 「她的脚步声在空走廊里弹了三下才消失——每一下都比前一下闷一点」
空间材质 墙壁/地板/天花板的材质决定声音反射特性 「木地板让她的鞋跟声比水泥地上闷了半度——不是叩响,是敲在木头上的钝响」
声源距离感 声音从多远传来、经过什么阻隔 「走廊尽头有人在哭——哭声经过了至少三道墙,传到她这里时只剩一个模糊的调子」

常用场景混响速查:

场景 混响 材质 Prompt速写
医院走廊/手术室 1.2~2.0秒 瓷砖+不锈钢+玻璃 「走廊的瓷砖墙面和地砖把所有声音都弹回来——脚步、推车滚轮、监护仪滴声,每一个都在墙壁之间来回弹了至少三下」
出租屋/小公寓 0.2~0.4秒 复合地板+粉刷墙壁+布艺沙发 「房间里的声音一出口就被沙发和窗帘吃掉了」
办公室 0.4~0.8秒 地毯+石膏板隔断+玻璃窗 「地毯把大多数脚步声吞成了一片模糊的沙沙响」
餐厅/后厨 0.5~1.0秒 瓷砖+不锈钢台面 「锅铲碰锅的声音、水槽流水声、厨师喊单声,混响太短没尾巴但反射太密,每一声都叠在上一声的半途上」
卧室(深夜) 0.1~0.3秒 木地板+地毯+棉质床品 「她的呼吸声被四面墙壁上的软装吸走了所有回音——每一次呼气都像被吞进了棉花里」
户外街道 无封闭混响 沥青+混凝土 「她的高跟鞋敲在沥青路面上,敲一下,半秒后对面的楼把敲击声弹回来,比原声闷了半度」
楼道/电梯间 1.0~1.8秒 水泥+金属栏杆 「水泥墙把脚步声拉长成了一声接一声的闷雷——每一步都拖着一条半秒以上的低频尾巴」

在环境音描述之后追加声学空间特征。

7.6 声音节奏与画面剪辑的咬合

密集动作段的音效管理: 如果一个镜头中同时描述了3个以上动作Seedance会将所有对应音效在极短时间内堆叠触发。解决方案给关键动作加0.3~0.5秒"听觉空拍"。写法:「她推开门——门合页的金属声在走廊里弹了一下——然后她站了两秒,才慢慢走到桌边」。

前景音重置注意力: 在连续低频环境音超过8秒后用一个突然的中高频前景音杯子放在桌上的一声清脆碰撞、角色突然倒吸一口气瞬间重置观众的听觉注意力。