Video Codec|视频编解码器|理论|历史|发展|版本

Video Codec 视频编解码器

Video Codec视频编解码器是压缩和解压缩数字视频的软件或硬件。 在视频压缩的背景下,编解码器是编码器和解码器的合成词,仅压缩的设备通常称为编码器,仅解压缩的设备称为解码器。

压缩数据格式通常符合标准视频编码格式。 压缩通常是有损的,这意味着压缩视频缺少原始视频中存在的一些信息。 其结果是,解压缩视频的质量低于原始未压缩视频,因为没有足够的信息来准确地重建原始视频。

视频质量、用于表示视频的数据量(由比特率决定)、编码和解码算法的复杂性、对数据丢失和错误的敏感性、编辑的难易程度、随机访问和 端到端延迟(延迟)。

历史History

历史上,视频作为模拟信号存储在磁带上。 当光盘作为模拟音频的数字格式替代品进入市场时,以数字形式存储和传输视频也变得可行。 由于记录和传输原始视频需要大量存储和带宽,因此需要一种方法来减少用于表示原始视频的数据量。 从那时起,工程师和数学家开发了许多解决方案来实现这一目标,其中包括压缩数字视频数据。

1974 年,Nasir Ahmed、T. Natarajan 和 K. R. Rao 引入了离散余弦变换 (DCT) 压缩。 在 20 世纪 80 年代末,许多公司开始尝试使用 DCT 有损压缩进行视频编码,从而促成了 H.261 标准的发展。 H.261 是第一个实用的视频编码标准,由 Hitachi、PictureTel、NTT、BT 和 Toshiba 等多家公司开发。 自 H.261 以来,DCT 压缩已被随后的所有主要视频编码标准所采用。

用于编解码器的最流行的视频编码标准是 MPEG 标准。 MPEG-1 由电影专家组 (MPEG) 于 1991 年开发,旨在压缩 VHS 质量的视频。 1994 年,MPEG-2/H.262 取代了它,该标准由多家公司(主要是 Sony、Thomson 和 Mitsubishi Electric)开发。 MPEG-2 成为 DVD 和 SD 数字电视的标准视频格式。 1999年,MPEG-4/H.263紧随其后,这是视频压缩技术的一次重大飞跃。 它由多家公司开发,主要是三菱电机、日立和松下。

截至 2016 年,使用最广泛的视频编码格式是 H.264/MPEG-4 AVC。 它于 2003 年由多家组织开发,主要是 Panasonic、Godo Kaisha IP Bridge 和 LG Electronics。 H.264 是蓝光光盘的主要视频编码标准,广泛应用于 YouTube、Netflix、Vimeo 和 iTunes Store 等流媒体互联网服务、Adobe Flash Player 和 Microsoft Silverlight 等 Web 软件以及各种 HDTV 广播 通过地面和卫星电视。

AVC 的后继者是 2013 年开发的 HEVC (H.265)。它拥有大量专利,大部分专利属于三星电子、GE、NTT 和 JVC Kenwood。 HEVC 的采用因其复杂的许可结构而受到阻碍。 HEVC 又被通用视频编码 (VVC) 所继承。

应用领域Applications

视频编解码器用于 DVD 播放器、互联网视频、视频点播、数字有线、数字地面电视、可视电话和各种其他应用。 特别是,它们广泛用于记录或传输视频的应用中,这对于未压缩视频的高数据量和带宽来说可能不可行。 例如,它们用于手术室记录外科手术、安全系统中的 IP 摄像机以及远程操作的水下航行器和无人机。 任何视频流或文件都可以使用多种实时视频格式选项进行编码。 以下是流式传输到 HTML5 视频播放器时需要设置的一些 H.264 编码器设置。

视频编解码器设计Video codec design

视频编解码器寻求以数字格式表示基本模拟数据集。 由于模拟视频信号的设计分别表示亮度(亮度)和颜色信息(色度、色度),编解码器设计中图像压缩的常见第一步是将图像表示并存储在 YCbCr 颜色空间中。 转换为 YCbCr 有两个好处:首先,它通过提供颜色信号的去相关来提高可压缩性; 其次,它将亮度信号(在感知上更重要)与色度信号分开,色度信号在感知上不太重要,并且可以使用色度子采样以较低的分辨率表示,以实现更有效的数据压缩。 通常用以下方式表示这些不同通道中存储的信息的比率:Y:Cb:Cr。 不同的编解码器根据其压缩需求使用不同的色度子采样率。 Web 和 DVD 的视频压缩方案使用 4:2:1 颜色采样模式,DV 标准使用 4:1:1 采样比。 专业视频编解码器旨在以更高的比特率运行,并以 4:2:2 和 4:4:4 的比例记录更多的颜色信息,以便后期制作操作样本。 这些编解码器的示例包括 Panasonic 的 DVCPRO50 和 DVCPROHD 编解码器 (4:2:2)、Sony 的 HDCAM-SR (4:4:4)、Panasonic 的 HDD5 (4:2:2)、Apple 的 Prores HQ 422 (4:2:2) )。

还值得注意的是,视频编解码器也可以在 RGB 空间中运行。 这些编解码器往往不会以不同的比例对红色、绿色和蓝色通道进行采样,因为这样做的感知动机较少——只有蓝色通道可能采样不足。

在基本编码过程之前,还可以使用一定量的空间和时间下采样来降低原始数据速率。 最流行的编码变换是 8×8 DCT。 利用小波变换的编解码器也正在进入市场,特别是在涉及处理运动序列中的 RAW 图像格式的相机工作流程中。 该过程涉及将视频图像表示为一组宏块。 有关视频编解码器设计的这一关键方面的更多信息,请参阅 B 帧。

首先对变换的输出进行量化,然后对量化值应用熵编码。 当使用 DCT 时,通常使用锯齿形扫描顺序来扫描系数,并且熵编码通常将多个连续的零值量化系数与下一个非零量化系数的值组合成单个符号 ,并且还具有指示所有剩余量化系数值何时等于零的特殊方式。 熵编码方法通常使用可变长度编码表。 一些编码器通过称为 n 遍编码(例如 2 遍)的多步骤过程来压缩视频,该过程执行速度较慢但可能更高质量的压缩。

解码过程包括尽可能执行编码过程每个阶段的反转。 无法完全反转的一个阶段是量化阶段。 在那里,执行最大努力的反演近似。 尽管量化本质上是不可逆的过程,但这部分过程通常称为逆量化或反量化。

视频编解码器设计通常是标准化的或最终成为标准化的,即在已发布的文档中精确指定。 然而,只需要标准化解码过程即可实现互操作性。 标准中通常根本没有指定编码过程,并且实施者可以自由地设计他们想要的编码器,只要视频可以以指定的方式解码即可。 因此,通过对使用相同视频编解码器标准的不同编码器的结果进行解码而产生的视频质量在不同编码器实现之间可能存在巨大差异。

常用的视频编解码器Commonly used video codecs

可以在个人电脑和消费电子设备上实现多种视频压缩格式。 因此,同一产品中可以使用多个编解码器,从而减少选择单一主要视频压缩格式来实现互操作性的需要。

来自多个源的多个编码器和解码器实现可以支持标准视频压缩格式。 例如,使用标准 MPEG-4 Part 2 编解码器(如 Xvid)编码的视频可以使用任何其他标准 MPEG-4 Part 2 编解码器(如 FFmpeg MPEG-4 或 DivX Pro Codec)进行解码,因为它们都使用相同的视频格式。

编解码器有其优点和缺点。 比较经常被发表。 压缩功率、速度和保真度(包括伪影)之间的权衡通常被认为是最重要的技术优点。

编解码器包Codec packs

在线视频材料由多种编解码器编码,这导致了编解码器包的出现——一组预组装的常用编解码器与可作为 PC 软件包提供的安装程序相结合,例如 K-Lite Codec Pack 、Perian 和组合社区编解码器包。


延伸阅读Further Reading(更新中)

操作系统

电影理论

多媒体理论

媒体格式理论

NLE非线性编辑软件

Final Cut Pro 生态系统工具

音频音效相关-制作音乐 Production Music

音频音效相关-预告片音乐 Trailer Music


发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注