使用H.264、H.265编码技术压缩手机拍摄的视频文件

视频转码技术

使用H.264、H.265编码技术压缩手机拍摄的视频可以节约多少文件体积。

超采样

手机拍摄视频的时候,可以选择4K分辨率拍摄,采用更高的分辨率拍摄,以确保拍摄的清晰度。

利用较高的分辨率实现较好的拍摄效率,4K分辨率=800w像素的照片,1080p=200w像素照片。

然后,拍摄完成后,把视频导入电脑,使用x264或者x265软件编码压缩,输出1080p分辨率,以达到高清小体积保存视频的效果。
x264转码后,大约可以实现10:1的压缩比例,仅需源文件10%的体积做到极高的视频清晰度,优势明显。通过电脑软件转码视频,可以有效避免手机储存空间不足,删除珍贵的视频文件的问题。

4K分辨率拍摄,转码成1080p分辨率储存,专业术语称之为超采样1200w像素手机直接录像1080p可能只使用200w像素传感器采集数据,摄像头CMOS并没有充分发挥其最大效能,所以直接拍1080p效果不是很好。
如果选择4k分辨率拍摄,则CMOS工作时为800w像素采样(多余的像素点实际上用于了电子防抖),如此最大化发挥了CMOS各个像素点的信号优势。
拍摄的原始视频文件会更大,但是经过x264转码压缩以后,体积会小于直接录制1080p视频,且清晰度会还更好。

H.264标准

H.264是一种视频压缩标准,其只规定了符合标准的码流的格式,以及码流中各个语法元素的解析方法。H.264标准并未规定编码器的实现或流程,这给了不同的厂商或组织在编码实现方面极大的自由度,并产生了一些比较著名的开源H.264编解码器工程。其中H.264编码器中最著名的两个当属JM和X264,这二者都属于H.264编码标准的一种实现形式。

X264:

X264是著名的H.264开源视频编码器,由开源组织VideoLan开发制定。X264是目前企业界应用最为广泛的开源编码器,主要因为X264相对于JM进行了大量的优化与简化,使其运行效率大幅提高。VideoLan对H.264标准文件编码代价计算方法进行大量简化,以及添加了MMX、SSE等SIMD的汇编优化,虽然编码的质量在某些情况下相对于标准JM可能略有下降,但是已无法掩盖其在可应用性,尤其是实时编码方面无可比拟的优势。

JM:

JM是常见H.264视频编解码器,主要用于学术研究中的参考软件JM。相比于X264,JM编码器灵活性较差,稳定性较高,编码耗时较长。

JM是H.264标准制定团队所认可的官方参考软件,基本实现了H.264标准的全部特征。JM在运行时的运算过程较为复杂,而且没有采用汇编优化等加速方法,因此运行速度较慢,很难达到实时编解码。通常主要用于编解码技术的科学研究领域,目前(2016.7)最新版本为JM 19。

x265

作为H.264的继任者,H.265被报以巨大的期望。网络视频编码界,一般认为H265/HEVC和H264/AVC编码相比,主要优势在于低码率情况下的视频编码、高分辨率上的编码。所以,主要是极低码率的网络视频、4K以上的高分辨率视频,压缩时采用HEVC更具有优势。

按照X265.org官网的信息,x265(74%码率)相对于x264(100%),优化减少约1/4储存空间(2020年2月28日)x265.org官网数据,Moscow State大学 编码大赛)。

相当于2G的x264视频,压缩成x265视频只需1.5G储存空间,节约空间1/4。

PS,经验中x264压缩速度约1-2倍(转码/播放时长比),x265为0.1-0.2或以下(需要5-10时间完成转码),@i3-6100@1080p。现在大多数新电脑算力远远高于六代i3转码速度会快很多。

峰值信噪比

峰值信噪比是常用的评价转码效果的方法,英语为Peak signal-to-noise ratio,缩写为PSNR。PSNR是一个表示信号最大可能功率和影响它的表示精度的破坏性噪声功率的比值的工程术语。由于许多信号都有非常宽的动态范围,峰值信噪比常用对数分贝单位来表示。

PSNR高于40dB说明图像质量极好(即非常接近原始图像),一般将转码后的视频PSNR控制在41-43之间即可。

30—40dB通常表示图像质量是好的(即失真可以察觉但可以接受),对于某些原清晰度不太好的视频可以考虑转码后PSNR控制在35-40之间,避免码率浪费去编码马赛克。

20—30dB说明图像质量差,一般不建议转码后PSNR低至这个方面。如果确实有需要限制文件体积,那么可以考虑适当降低视频分辨率。

最后,PSNR低于20dB图像不可接受。

SSIM

structure similarity…
结构相似性,另一种评价视频质量的指标。