6.1 KiB
七、声音设计(前置到 Prompt 层级)
Seedance 2.0 原生支持音频生成——对白口型同步、程序化音效是同一生成事件的产物,不是后期工序。声音设计必须前置到 Prompt 层面。
7.1 对白口型同步
对白文本必须逐字出现在对应镜头的Prompt中,用双引号包裹,并标明类型:
- VO(画外音/旁白):标注为
「角色名(VO):原文」。无空间混响的叙述声音,不驱动任何画面内角色的口型。 - OS(内心独白/心理活动):标注为
「角色名(OS):原文」。非空间化声音——没有房间混响,仿佛直接从角色内部传来。画面内对应角色的面部微表情应有配合(嘴唇不一定动,但眼神、眉心、呼吸应有配合)。 - 现场声:标注为
「角色名:原文」。驱动对应角色的口型同步,声音带有场景的空间混响特征。
禁止使用「画外音」「心中所想」「旁白」等文字标签替代VO/OS——必须使用标准标注。
7.2 环境音的三层结构
每段指定2~3层环境音:
- 背景层(始终在响但不应被注意):如「中央空调的低频嗡鸣」「远处高速路的隐约胎噪」
- 中景层(偶尔被注意,制造空间感):如「隔壁房间的电视声音闷在墙后」「窗外偶尔经过的电动车」
- 前景层(直接参与叙事):如「炉灶上的水烧开了,持续尖锐的鸣叫」「她的鞋跟在水泥地上每一步都敲出空旷的回声」
7.3 主观音效的叙事功能
主观音效(耳鸣、心跳放大、呼吸强调、声音失真)出现在情绪临界点。至少每段一处。
心跳放大的使用约束: 必须有一个具体的生理触发——看到某个人、听到某个名字、意识到某件事——不能用「因为紧张所以心跳加速」空洞因果。
耳鸣的叙事精确性: 描述时至少涵盖两个维度——频率(高频尖锐/低频轰鸣)和起止方式(突然侵入/缓慢逼近/一直在但刚被注意到)。
呼吸强调: 描述呼吸的具体物理质感——「每一次呼气都带着轻微的颤音」「吸气时空气在喉咙里摩擦的声音被放大了」。
静默作为叙事工具:静默定格切
情绪高潮处(点头确认、真相被说出口、第一次眼神对接),在下一个镜头切进来之前,将当前镜头的最后一秒完全静音——环境音、呼吸声、衣料摩擦声全部撤走——然后在这片静默中切到下一个镜头。静默时长0.5~1秒。每集最多1次。静默切不能与主观音效在同一镜头上叠加。
呼吸式静默: 在连续58秒环境音+对白后,插入11.5秒环境音几乎消失的段落——不是绝对静默(保留极低背景层声),而是声音突然「撤离」。每集可用1~2次,不占用沉默镜头配额。
7.4 禁止背景音乐与字幕抑制
本剧不使用任何背景音乐。每个Prompt末尾统一追加:
[无背景音乐,仅环境音与对白] [无字幕]
允许的声音:环境音(三层结构)、角色对白(VO/OS/现场声)、程序化音效、主观音效、非视觉触发的关键音效补充。 禁止的声音:任何背景音乐/配乐/旋律/节奏性器乐、屏幕字幕/唱词/任何屏幕文字叠加。
7.5 声学空间与混响
同一声音在不同空间里的听感天差地别。
声学空间三要素:
| 要素 | 描述 | Prompt写法示例 |
|---|---|---|
| 混响时间 | 声音发出后回声多久消散。长混响(>1秒)=空旷/疏离;短混响(<0.3秒)=私密/被包裹 | 「她的脚步声在空走廊里弹了三下才消失——每一下都比前一下闷一点」 |
| 空间材质 | 墙壁/地板/天花板的材质决定声音反射特性 | 「木地板让她的鞋跟声比水泥地上闷了半度——不是叩响,是敲在木头上的钝响」 |
| 声源距离感 | 声音从多远传来、经过什么阻隔 | 「走廊尽头有人在哭——哭声经过了至少三道墙,传到她这里时只剩一个模糊的调子」 |
常用场景混响速查:
| 场景 | 混响 | 材质 | Prompt速写 |
|---|---|---|---|
| 医院走廊/手术室 | 1.2~2.0秒 | 瓷砖+不锈钢+玻璃 | 「走廊的瓷砖墙面和地砖把所有声音都弹回来——脚步、推车滚轮、监护仪滴声,每一个都在墙壁之间来回弹了至少三下」 |
| 出租屋/小公寓 | 0.2~0.4秒 | 复合地板+粉刷墙壁+布艺沙发 | 「房间里的声音一出口就被沙发和窗帘吃掉了」 |
| 办公室 | 0.4~0.8秒 | 地毯+石膏板隔断+玻璃窗 | 「地毯把大多数脚步声吞成了一片模糊的沙沙响」 |
| 餐厅/后厨 | 0.5~1.0秒 | 瓷砖+不锈钢台面 | 「锅铲碰锅的声音、水槽流水声、厨师喊单声,混响太短没尾巴但反射太密,每一声都叠在上一声的半途上」 |
| 卧室(深夜) | 0.1~0.3秒 | 木地板+地毯+棉质床品 | 「她的呼吸声被四面墙壁上的软装吸走了所有回音——每一次呼气都像被吞进了棉花里」 |
| 户外街道 | 无封闭混响 | 沥青+混凝土 | 「她的高跟鞋敲在沥青路面上,敲一下,半秒后对面的楼把敲击声弹回来,比原声闷了半度」 |
| 楼道/电梯间 | 1.0~1.8秒 | 水泥+金属栏杆 | 「水泥墙把脚步声拉长成了一声接一声的闷雷——每一步都拖着一条半秒以上的低频尾巴」 |
在环境音描述之后追加声学空间特征。
7.6 声音节奏与画面剪辑的咬合
密集动作段的音效管理: 如果一个镜头中同时描述了3个以上动作,Seedance会将所有对应音效在极短时间内堆叠触发。解决方案:给关键动作加0.3~0.5秒"听觉空拍"。写法:「她推开门——门合页的金属声在走廊里弹了一下——然后她站了两秒,才慢慢走到桌边」。
前景音重置注意力: 在连续低频环境音超过8秒后,用一个突然的中高频前景音(杯子放在桌上的一声清脆碰撞、角色突然倒吸一口气)瞬间重置观众的听觉注意力。