Netflix Sound Mix Specifications & Best Practices|Netflix 混音规范和最佳实践 v1.5

本规范文件适用于 Netflix 品牌内容。如需许可,请参阅完整的非品牌交付规范 v9.3


1、混音设施的近场音频先决条件

平均响度必须为 -27 LKFS +/- 2 LU 对话门控。峰值不得超过 -2db 真实峰值。应根据 ITU-R BS.1770-1 指南对整个节目的音频进行测量。 

需要离散音频,但以下情况除外:

  • 当混合音频是源固有的时,例如 IMF、Quicktime 或 Atmos® BWAV ADM 容器中的音频。
  • 交错辅助音频 .wav 传输。 

采样率和位深度:

48k/24 位用于原始语言混合或 M&E 混合 – 适用于 Stems 和 Mix Master。

48k/16 位或 24 位用于第二语言或音频描述。

绝不允许有损或无损音频压缩。音频必须是标准或 RF64 离散 LPCM .wav 或 .bwav 文件。 

音频必须以本机项目帧速率与图像同步录制。所有音频交付内容应与相机和图片后期制作帧速率相匹配。所有音频必须与最终的 IMF/Prores 图像同步。替代/配音语言和音频描述混音不得包含额外的引导符。印刷大师、M&E 和主干可能包括标准 8 秒学院领袖和 2-pop。 

Content Hub 交付的内容可能是单独的音频文件,也可能是文件夹内的音频文件,也可能是包含会话的 Pro Tools 会话文件夹内的音频文件。如果提供 Pro Tools 以外的项目文件,还应包括 AAF/OMF,或者所有通道必须渲染为连续的 PCM 音频。 

对于所有游戏,5.1 音频是必需的,2.0 音频是可选的。

如果节目的原始源是单声道且不存在立体声和/或 5.1 混音,则单声道音频是可接受的。单声道音频必须在通道 1 和 2 上复制并作为 2 通道传送。

以长播放(而非卷轴)的形式提供所有近场音频资源。


2.1、NEAR FIELD ATMOS ® MIX – 母带处理和存档 – 原始语言版本

杜比全景声 (Dolby Atmos) 原始语言家庭混音必须满足以下要求:

  • 至少必须在 7.1.4 房间内混合。
  • Home Atmos® 混音室不需要杜比认证。
  • Atmos® 以 IMF (IAB) 形式提供,支持每秒 23.976、24、25 和 30 帧。
  • 这是近场混音。最常见的近场监控级别是 79db 或 82db。
  • 必须符合 Netflix 响度规范(-27db LKFS +/- 2 LU 1770-1 对话门控)。
  • 峰值通常不应超过 -2dBFS 真实峰值。为了实现这一目标,我们建议将所有床和对象的真实峰值限制器设置为 -2.3 或更低。响度和峰值应通过 5.1 重新渲染来测量。
  • 对于 Atmos® 混音,需要提供 5.1 音频,并且可选提供 2.0 音频。 5.1 和 2.0 重新渲染输出必须符合 Netflix 响度规范。仅当 5.1 和 2.0 交付用于流媒体时,才必须符合 Netflix 峰值规范。我们建议通过限制渲染器的输出来实现这一点,而不是降低床和物体。
    • Atmos® – 交付到图像处理设备以进行 IMF 创建和流式传输。
    • 5.1 – 传送至内容中心以供配音参考。可选择传送流式传输。
    • 2.0 – 可选。
  • 所有床和物体都经过编码并且始终可以听到。印刷大师可以使用所有床材料或多个床的复合材料,但不能同时使用两者。
  • 对于所有系列/文档/无脚本/喜剧内容,床和对象必须用对话、音乐和效果分隔,并且只能标记为“对话”、“音乐”、“效果”或“旁白”。对于胶片内容,应尽可能保持 DME 分离。
  • 如果创建 85 db 参考戏剧混音,则需要两套完整的交付成果。一种用于戏剧,一种用于近场。
  • Leader 和 sync pop 是首选,但不是必需的。 IMF 供应商将在 IMF 中同步 Atmos®。
  • 最终家庭影院打印大师:
    • 杜比全景声® BWAV ADM 文件。
      • 所有床通道配置均可接受。
      • 48 kHz 采样率,24 位。

2.2、近场 5.1 环绕声混音 – 母带制作和存档 – 原始语言版本

  • 使用 79dB spl 或 82dB spl 作为混音的标准参考电平。
  • 使用 ITU-R BS.1770-1 在整个节目中测得的对话响度达到 -27 LKFS (+/- 2 LU)。
  • 不要超过 -20 dBFS 参考值的 +18db (-2 dBFS) 最大电平(真实峰值),这是通过峰值限制而不降低混音电平实现的。
  • 对于原始版本:提供 5.1 对话、音乐和效果,组合后相当于 5.1 混音。

2.3、近场 2.0 立体声混音 – 母带处理和存档 – 原始语言版本

  • 使用 79dB spl 或 82dB spl 作为混音的标准参考电平。
  • 使用在整个节目中测量的 ITU-R BS.1770-1 提供具有 -27 LKFS (+/- 2 LU) 对话响度的 Lo/Ro 或 LT/RT 混音。
    • Lo/Ro 混合是首选。
  • Lo/Ro 或 LT/RT 混音可兼容单声道。
  • 不要超过 -20 dBFS 参考值的 +18db (-2 dBFS) 最大电平(真实峰值),这是通过峰值限制而不降低混音电平实现的。
  • 当从 5.1 向下混音以创建 Lo/Ro 或 LT/RT 2.0 混音时:
    • 将中心频道内容降低-3db。
    • 中央声道内容应包含在左声道和右声道中。
    • 将环绕声道内容降低至少 -3db。
    • 将左环绕声和右环绕声内容折叠到相应的左通道和右通道中。
    • 可选择包括 -8db 和 -12db 之间的低频效果 (LFE) 通道。
      • 将低频效果 (LFE) 折叠到左声道和右声道中。
      • 低通滤波器 LFE 为 200Hz 或更低。
  • 在向下折叠之前,必须对各个 5.1 通道进行所有调整。

注意:生成的 2.0 混音必须在交付前进行检查,以确保不存在任何音频伪影,如有必要(经 Netflix 确定),应进行进一步调整以防止出现此类情况。任何 2.0 交付都必须符合本节规定的规范。


2.4、近场 ATMOS ® MIX – 母带处理和存档 – 配音语言和音频描述

Dolby Atmos® Dubbed Language Home Mix 必须满足以下要求。

  • 至少必须在 7.1.4 房间内混合。
  • Home Atmos® 混音室不需要杜比认证。
  • 这是近场混音。最常见的近场监控级别是 79db 或 82db。
  • 必须符合 Netflix 响度规范(-27db LKFS +/- 2 LU 1770-1 对话响度)。
  • 峰值通常不应超过 -2dbfs 真实峰值。为了实现这一目标,我们建议将所有床和对象上的 True Peak 限制器设置为 -2.3 或更低。响度和峰值应通过 5.1 重新渲染来测量。
  • 对于原生 Atmos® 混音,5.1 和 2.0 重新渲染必须符合 Netflix 响度和峰值规范。
  • 所有床和物体都经过编码并且始终可以听到。印刷大师可以使用所有床材料或多个床的复合材料,但不能同时使用两者。
  • 对于所有系列/文档/无脚本/喜剧内容,床和对象必须用对话、音乐和效果分隔。对于胶片内容,应尽可能保持 DME 分离。
  • 如果创建 85 db 参考戏剧混音,则需要两套完整的交付成果。一种用于戏剧,一种用于近场。
  • 配音语言 Atmos® 文件应与最终 IMF 图像长度完全匹配,就像长播放而不是单独的卷轴一样。领导者和同步流行音乐应被删除。
  • FFOA 必须保留为默认值 – 不选中“添加 FFOA”框。对于 3.0 之前的渲染器软件,请在 FFOA 值中保留红色破折号。
  • 最终家庭影院打印大师:
    • 杜比全景声® BWAV ADM 文件。
      • 所有床通道配置均可接受。
      • 48 kHz,24 位。

2.5、近场 5.1 环绕声混音 – 母带处理和存档 – 配音语言和音频描述

  • 使用 79dB spl 或 82dB spl 作为混音的标准参考电平。
  • 满足使用 ITU-R BS.1770-1 在整个节目中测量的 -27 LKFS (+/- 2 LU) 对话门控。
  • 不要超过 -20 dBFS 参考值的 +18db (-2 dBFS) 最大电平(真实峰值),这是通过峰值限制而不降低混音电平实现的。
  • 对于原始版本:提供 5.1 对话、音乐和效果,组合后相当于 5.1 混音。
  • 对于配音版本:提供 5.1 对话主干,与 M&E 组合时相当于 5.1 混音。

2.6 近场 2.0 立体声混音 – 母带处理和存档 – 配音语言和音频描述

  • 使用 79dB spl 或 82dB spl 作为混音的标准参考电平。
  • 使用在整个节目中测量的 ITU-R BS.1770-1 提供单独的 Lo/Ro 或 LT/RT 混音,对话响度为 -27 LKFS (+/- 2 LU)。
    • Lo/Ro 混合是首选。
  • Lo/Ro 或 LT/RT 混音可兼容单声道。
  • 不要超过 -20 dBFS 参考值的 +18db (-2 dBFS) 最大电平(真实峰值),这是通过峰值限制而不降低混音电平实现的。
  • 当从 5.1 向下混音以创建 Lo/Ro 或 LT/RT 2.0 混音时:
  • 将中心频道内容降低-3db。
  • 中央声道内容应包含在左声道和右声道中。
  • 将环绕声道内容降低至少 -3db。
  • 将左环绕声和右环绕声内容折叠到相应的左通道和右通道中。
  • 可选择包括 -8db 和 -12db 之间的低频效果 (LFE) 通道。
    • 将低频效果 (LFE) 折叠到左声道和右声道中。
    • 低通滤波器 LFE 为 200Hz 或更低。
  • 在向下折叠之前,必须对各个 5.1 通道进行所有调整。

注意:生成的 2.0 混音必须在交付前进行检查,以确保不存在任何音频伪影,如有必要(经 Netflix 确定),应进行进一步调整以防止出现此类情况。任何 2.0 交付都必须符合本节规定的规范。


2.7、 音乐与效果 (M&E) 混音


2.7.1、近场 ATMOS ® M&E 组合

杜比全景声 (Dolby Atmos) Home M&E Mix 必须满足以下要求:

  • 至少必须在 7.1.4 房间内混合。
  • Home Atmos® 混音室不需要杜比认证。
  • 这是近场混音。最常见的近场监控级别是 79db 或 82db。
  • 峰值通常不应超过 -2dBFS 真实峰值。为了实现这一目标,我们建议将所有床和对象的真实峰值限制器设置为 -2.3 或更低。应通过 5.1 重新渲染来测量峰值。
  • 5.1 M&E 重新渲染是必需的,并且必须符合 Netflix Peak 规范。
  • 必要时,除了 Atmos® M&E 之外,还需要可选轨道。
  • 所有床和物体都经过编码并且始终可以听到。印刷大师可以使用所有床材料或多个床的复合材料,但不能同时使用两者。
  • M&E 床和物体配置应与 Atmos® printmaster 相匹配。对话床和对象应该只包含制作效果,而不包含可辨别的语言。
  • 如果创建 85db 参考戏剧混音,则需要两套完整的交付成果。一种用于戏剧,一种用于近场。
  • Leader 和 sync pop 是首选,但不是必需的。
  • 机电组合
    • Dolby Atmos® BWAV ADM 文件或 Pro Tools 录音器会话。
      • 所有床通道配置均可接受。
      • 48 kHz,24 位。
      • 单个或多个 M&E 选项作为单独的 WAV 文件或在 Pro Tools 会话中明确标记为可选或 OPT,以及任何其他内容特定的标签。
        • 通道格式应由重新录制混音器确定,以匹配原始混音的意图。

2.7.2、近场 5.1 环绕机电混音

  • 提供完全填充的 5.1 环绕声子混音,仅包含音乐和效果(无对话)。
  • 应包括氛围和拟音填充以正确匹配原始混音。主混音中存在的任何非对话声音也必须在 M&E 混音中体现。
  • 所有级别都应反映最终母带制作和存档所使用的内容,以便以后可以轻松混合任何新添加的配音对话。
  • 必要时,除了 5.1 M&E 之外,还需要可选轨道。
  • 对于 Dolby Atmos® 混音,5.1 M&E 应从 Dolby Atmos® M&E 渲染。
  • M&E 创建指南文件:

 


3、戏剧混音 – 母带制作和存档

  • 戏剧混音应遵循上面列出的近场规范,但以下情况除外:
  • 使用 85db spl 作为混音的标准参考电平
  • 戏剧混音没有 LKFS 响度要求,峰值可能为 0db True Peak
  • 提供戏剧规格的对话、音乐和效果
  • 以卷轴形式交付(非长效)

4、最佳实践

注意:以下不是技术规格。以下是帮助实现最佳客户体验的指南。 Netflix 不要求遵循以下准则,但建议您遵循以下准则。


4.1、对话门控响度和响度范围

Netflix 致力于保护创作意图 – 我们不会压缩、限制或修改音频混合。然而,不太动态的内容可以为会员提供更好的体验。请确保混音中的对话始终清晰易懂,除非有意不清楚的地方。

我们标准化所有音频传输,以确保所有音频在服务中以相同水平播放。我们提高或降低整体混音级别,以确保标题之间播放的一致性。

以下计量产品经过测试并已知可有效确保符合我们的音频规范: 

插件                                                    企业解决方案

杜比媒体计杜比 DPLM

NuGEN Vis-LM Interra 系统接力棒

Waves WLM 情感系统 Eff

Signum Bute NuGEN AMB

Izotope Insight Minnetonka 音频 AudioTools 服务器

Youlean 响度计

以下响度范围 (LRA) 值将在服务中发挥最佳效果:

  • 5.1 对 4 至 18 LU 之间的 LRA 进行编程
  • 2.0 编程 4 至 18 LU 之间的 LRA
  • 10 LU 或更少的对话 LRA

当近场 Atmos 或 5.1 混音测量低于 15% 对话时,将使用节目目标测量(-24db LKFS +/- 2 LU – ITU BS 1770-3 或 -4)

对于 LoRo 向下折叠或向下混音,ITU-R BS.775-1 – 5.1 到 LFE 静音的立体声是国际标准。


4.2、峰值

我们建议将所有音频交付的真实峰值限制器设置为 -2.3。对于 5.1 / 2.0,这有助于防止计量中的微小差异导致误报。对于 Atmos 床和对象,此设置将减少由于 Atmos 渲染器内的求和因素而导致的过度峰值。


4.3、房间设置

我们建议在与客厅大小相近的房间中进行近场混音。如果房间建造良好且对齐,更大或更小的房间也可以使用。在混音位置附近使用多个麦克风,平均对齐房间。 Atmos 房间至少应为 7.1.4,但 9.1.6 是最佳值。我们建议近场使用中等或轻微的 X 曲线,而不是标准的电影曲线。杜比工程师可以协助调整需要的设施。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注