Opus：为网络而生的音频编码|音频编码

　　Opus编码详解　　Opus的内核包含两种编码方式，分别是CELT和SILK，它会根据不同的信号类型（语音、音乐）来采用不同的音频压缩方式。CELT与MP3功能类似，负责音乐存储，而SILK会在编码之前优化语音信号。
　　音乐和语音
　　CELT编码可以实时压缩音乐。为了达到该目标，它将数据打包为小的音频帧，从而保证只有2.5ms的延迟。
　　SILK编码首先降低采用频率到16kHz，然后才开始真正的编码过程。
　　语音编码
　　语音信号在正式编码之前，首先要经过SILK编码器的详细分解。
　　语音识别将语音与周围环境噪音分隔开。
　　音高分析降低语音帧的采样率。
　　噪声分析优化噪声到相应的比特率。
　　预过滤器调整信号，然后将其转移到编码区。
　　音高预测通过目前的音频帧计算未来的音频帧变化。
　　频率量化使传输的音高变得平稳。
　　失真优化确保在可接受的语音失真内采用最低比特率。
　　噪音量化调整预过滤的噪声与已编码的语音帧。
　　区域编码处理每一个已编码的音频帧信号。
　　音频编码对比
　　与其他的音频编码方式相比，Opus在低延迟情况下覆盖了所有的比特率。手机的语音编码相对是快的，但是很难达到较高的通话质量，而传统的音频编码则在实时性上有欠缺。
　　新的音频编码标准Opus比传统的MP3和AAC编码更高效，尤其适用于网络音频传输。更重要的是，它是一个完全开放的标准。
　　包括VoIP、在线音乐、有声读物和播客（Podcasts）等在内，网络流量中相当大的一部分贡献给了音频传输。上面提到的这几项操作，在快速的DSL线路上可以流畅地进行。但如果使用的是蜂窝数据连接，VoIP通话就难免会产生令人不爽的延迟，在线音乐也会变得时断时续。不过，现在已经有一种名为Opus的音频编码会解决这些问题。它的最大优势是可以利用更小的带宽带来更高质量的音频，而且可以实时进行。除此之外，Opus本身的编码是完全开源的，开发者不需要担心任何专利授权的问题。
　　从一开始，Opus编码就是为交互式音频传输而开发的。这意味着Opus编码不仅适用于音乐，而且支持双向音频传输，例如为视频电话和VoIP通话做了充分的优化。2012年9月初，IETF（互联网工程任务组）将其提升为正式的官方标准，也就是说它事实上已经成为了HTML标准的一部分。Opus音频编码是由非盈利的Xiph.org基金会、Skype和Mozilla等共同主导开发的。像MP3一样，Opus也是一种有损音频编码，这意味着在传输过程中内容会被压缩。低延迟是它的最大特色，也就是说，它的信号延迟非常小，数据包会在20ms之内被处理。相比之下， MP3文件的延迟是它的10倍。
　　高度的灵活性
　　Opus的开发者在灵活性上付出了很大的心血，从而保证了Opus的比特率可以从6Kb/s到510Kb/s，采样率可以在8kHz到48kHz之间摇摆，音频信号帧可以从2.5ms到60ms。从内部结构来看，Opus是开发者利用已经存在的音频编码进行优化后组合而成的所谓混合编码。Opus联合了CELT（Constrained Energy Lapped Transform）和SILK编码，并且对两者进行了改良。CELT编码由于“实时”的特性，已经被作为OGG家族的一部分。最初来自Skype的SILK编码，从Skype 4.0开始已经作为语音编码的方式被引入。
　　大体上，Opus编码器的结构和功能都非常简单。首先，输入信号被以最高达48kHz的采样率进行采样。因为人的耳朵已经很难分辨更高采样率音频的更多细节了。然后，根据频率的不同，使数据流通过CELT或者SILK编码器。如果最终需要的是高品质的音乐，那么CELT编码器是首选。而利用SILK，人们可以使用最优化的带宽来传输音频。为了这个目标，SILK编码必须做一些与之前的编码不一样的事情。
　　对话中的语音分析
　　SILK编码适合采样率不超过16kHz的低频信号，一个典型的场景就是语音通话。因此，在Opus编码中，所有低于16kHz采样率的音频内容都由SILK编码。SILK编码器包含一系列组件，在这里将它们总结为4个部分：分析、预过滤、编码和输出。其中，音频分析的背后其实是语音识别。首先，将音频信号分为语音和环境噪音两部分。将语音帧根据频率分解为更小的音频碎片，SILK编码器过滤掉延迟信息，识别出有效语音信号的特点。第二项优化是噪声分析，它将周围环境中重复的噪音打包为越小越好的音频子帧（sub-frames），使其占用更小的带宽。利用分析阶段获得的信息，SILK编码器就可以进行音高预测和频率量化。例如，如果在一段对话中，音高（pitch）没有大的变化，那么只需要传输变化部分的信息就可以了。这一步的目标是让数据流在保证质量的同时，越少越好。噪声的量化是另一种达成目标的方法。在这个例子中，SILK编码可以确保不进行不必要的优化，而且不可避免的噪声没有消耗过多的比特率。
　　所有的高频信号，也就是频率最高达20kHz的信号，都采用CELT编码器处理。与MP3和AAC编码一样，它通过修改后的离散余弦变换（DCF）将频率转换为系数，从而消减在随后的量化中难以覆盖或者人耳很难感知的频率。开发者为Opus定义了3个模式，使得SILK和CELT也能够同时工作：纯SILK模式负责低带宽下的语音传输；混合模式负责高质量的语音传输；纯CELT模式负责音乐传输。Firefox用户从第15版开始可以在不安装插件的情况下，直接播放Opus文件。视频播放器VLC Media Player也将集成Opus编解码。现在打开opus-codec.org/examples网站就可以立即试听采用Opus编码的音频文件样例。

推荐访问:而生编码音频网络

Opus：为网络而生的音频编码|音频编码

也许您还喜欢:

最新范文