分享到: 分享到QQ  分享到Twitter

作者: BigLoser    访问次数: 1142 创建时间: 2020-03-20 00:43:43 更新时间: 2024-04-29 11:07:59

前段时间发布的小米10系列手机采用了一种新的图片格式:HEIF,能够在保持画质不变的前提下缩减至少50%的文件体积。HEIF格式照片的文件扩展名一般是.HEIC(也有其他的格式)。看到这个格式名,用iPhone的小伙伴一定很熟悉。

 

没错,苹果在2017年iOS 11系统上就已经开始支持这种图片格式,大家可以去翻翻之前的老文章。据汐元所知,苹果应该是最早在手机上广泛应用HEIF图片格式的了,不过当时很多小伙伴对这个图片格式不太了解,加上当年兼容性不好,给大家导图片带来诸多不便,所以,很多小伙伴对苹果当时的决定表示不屑,甚至不满。

 

包括汐元也是,因为做评测经常需要把图片导到自己的Windows电脑上,结果在电脑上打不开这个格式,还要转格式,任务着急的时候真心想给苹果寄刀片。不过,时间证明,苹果的决定是对的,我错了。后来,Windows 10系统和安卓9系统在2018年也开始支持HEIF图片格式。同年,三星Note9其实也已经支持.HEIC照片。小米10发布前,雷军甚至表示,等HEIF普及后,估计JPEG和GIF就可以淘汰了。汐元觉得,未来如果HEIF普及了,也许真的可以取代JPEG和GIF。写这句话的时候,汐元觉得脸上火辣辣得疼。

 

说到这里,相信大家都很好奇,HEIF究竟是怎么够做到保证画质不变而缩小文件体积的?汐元翻了一下网上的资料,大多没有明确针对这个问题进行说明。所以这篇文章打算聚焦这个问题来为大家介绍。为什么HEIF相比JPEG能够在画质不变的情况下将文件体积大幅缩小?

 

我们首先要明白JPEG的图片格式具体是怎么样的。

 

所谓JPEG格式的图片,其实说的是一种图像压缩的技术标准,使用这种标准压缩出来的图片,就叫“JPEG文件”。JPEG文件后缀名包括JPG、JPEG、JPE、JFIF以及JIF。都是我们熟悉的。那么JPEG标准是怎么压缩图片的呢?我们知道,一张图片放大后,就可以看到一个一个的像素点。

 

每个像素点,都包含了描述这个像素点颜色的一组数值,这个叫色彩空间,例如我们熟悉的RGB色彩空间,还有CMYK色彩空间等。

一般照片用的是RGB色彩空间,而JPEG标准采用的是一种叫做YCbCr的色彩空间。所以压缩之前,要先进行色彩空间转换。

 

YCbCr色彩空间中,Y表示的是亮度,Cb代表蓝色的彩度,Cr表示的是红色的彩度。换句话说,Y代表亮度,CbCr代表色彩。转换之后,每个像素背后变成了另一组数值。因为人眼对亮度敏感,对色彩不那么敏感,所以实际压缩的时候,JPEG标准不会对亮度信息做太多改变,主要对色彩信息做压缩。

 

压缩有两种,一种是有损压缩,一种是无损压缩。JPEG在压缩时,两种都会用,一般先进行有损压缩,然后进行无损压缩。有损压缩第一步是对Cb通道和Cr通道的色彩数据按照一定的比例进行取样。这个过程就损失了一部分数据。第二步,就是将一张图片中的像素分成无数个8×8像素的方块,每个方块里有64个像素,对应64组数据。

 

然后,将这64组数据进行一种叫离散余弦变换(DCT)的数学处理,处理后,这64组数据就变成了数据更简洁一些的系数矩阵。至于这个离散余弦变换怎么搞,就不用了解了,懂高数的IT之家小伙伴可以自行去学习。总之,在经过DCT变换后,64组像素数值变成了64个系数,这个过程又产生了数据损失。

 

接下来,对于这一组8×8的序数矩阵,还不能直接处理,要继续进行一步叫“量化”的处理过程。量化是怎么进行的大家不用知道,只需要知道,量化的目的是适当减小矩阵内各个像素点之间的差别。因为人眼对小范围内差别高的像素区域辨别能力不高,所以不如削减它们的差异。经过量化处理后,8×8的序数矩阵变成了一组更加简洁的数字矩阵,有大面积的0。很显然,这一步,又损失了一部分数据。好,走到这一步,接下来就是无损压缩了。

 

首先,我们把上一步量化后的8×8数字矩阵提取出来。提取的顺序是这样“Z”字型的。提取出来后,得到64个数据。这64个数据中,第一个数字叫DC系数编码,后面63个数字叫AC系数编码。我们要知道,一张图片里可以包含很多很多个8×8的小方块,都进行上述处理后,就有很多很多个DC系数。我们把这很多很多个DC系数抽出来,组成一个集体,然后对它们进行差分编码和哈夫曼编码。至于其他的AC系数,我们对他们进行行程编码。这样,JPEG标准的压缩步骤基本就走完了。这些步骤走完后,压缩成的.JPG文件体积就会比原图小很多,当然图片质量也会有所损失。

 

 

但我们要说的还没完。

 

上面三种无损压缩编码的操作过程大家不需要知道,但是他们的压缩思想,大家是有必要知道的。差分编码,就是对于一串数字,除了第一个数字,其他数字都表示为它和前一个数字的差。例如100、101、103、104、107这串数据,可以表示为100、1、2、1、3。这就起到了压缩作用。

 

哈夫曼编码,它的大体思想在一串数据里,用短字符表示出现频率多的数字,用稍长的字符表示出现频率少的数字。假如有下面这句话:“IT之家网友在IT之家讨论IT之家小编”,这句话里“IT之家”几个字反复出现,那我们就用“1”来表示“IT之家”,然后这句话就成了“1网友在1讨论1小编”,这样是不是就被压缩了?

 

注意,上面这个例子并不严谨,只是为了方便大家理解哈夫曼编码的思想,实际操作很复杂的,要考虑概率、做二叉树等步骤的。如果有IT之家小伙伴感兴趣可自行学习。

行程编码,这就很简单了,直接用例子说明。假如有一串字符“aaabbbccccdddddd”,它包括3个a,3个b,4个c,6个d,所以就把它编码为“3a3b4c6d”。

 

很明显,要想让这些无损编码最大限度发挥压缩作用,需要保证数据有一定特性,例如大面积相同的字符、有很多出现频率较高的字符或者有很多相似的字符等。讲到这,相信大家也就理解了为什么前面要大费周章做那么多有损的处理了,一部分原因就是为了得到适合进行无损压缩的数据。通常情况下,一张图片里面,其实是有很多相同或相近的像素点的,这意味着它们背后的数据有很大可以压缩的空间。JPEG目的就是要干这个事儿的,这么说相信大家能理解。

 

说了那么多JPEG,那HEIF呢?

 

别急,当我们掌握了JPEG图像压缩的方法,对于HEIF是怎样进一步压缩图片体积的,就好理解多了。其实HEIF做的工作和JPEG差不多,大体路径是相似的,但在一些一些细节上有改进。我们需要先做一个简单的说明。其实所谓的HEIF,是图片的封装格式,它主要采用的是一种叫HEVC的编码方式。

 

打个比方,一张图片的信息,它们其实是经过HEVC的编码方式进行编码,然后将编码后的信息用一个盒子(容器)装起来,这个盒子就叫HEIF。

 

HEIF是把盒子和编码方式分开了,而JPEG没有。HEIF的这种操作方式和很多视频格式很像,我们经常看到的MP4、MKV、AVI等视频格式,其实都是盒子的名字,盒子里面是编码的方式,例如MPEG-4、H.264、H.265等。影音软件播放视频文件的时候,都是先把盒子打开,然后再解码里面的编码文件。上面提到的H.265还有一个名字,就叫HEVC,没错,也就是HEIF格式主要采用的编码方式,所以说这个图片格式其实采用的也是视频的编码的方式。

除了HEVC,HEIF格式也可能采用其他的编码方式,但很少见。它的编码方式和对应的后缀名如下:

我们看到,小米10和iPhone用的都是HEVC的编码方式,后缀名都是.HEIC。所以问题就变成了,HEVC的编码方式是怎么将体积缩小的呢?

 

其实主要有两点。

 

首先,根据上文的介绍,JPEG是将图片划分成很多8×8的像素块来进行压缩编码的。而在HEVC编码方式中,这个像素块的划分方式更灵活,最大可以允许以64×64来划分,然后在64×64的像素块中,可以灵活的划分子像素块,可以划分成32×32、16×16、8×8的子块,这叫做四叉树单元划分。

这么做有什么好处呢?答案就是,在面对一张图片的时候,如果是信息量比较平缓的区域,我们可以用比较大的像素块来划分,如果是信息量比较密集的区域,就可以用比较小的像素块来划分。

 

这种根据实际情况来划分的编码单元,可以很大程度提高编码效率。特别是针对4K等高分辨率、像素量大的照片,优势更明显。HEIF照片的文件体积能够缩小,大部分要归结于此。其次是第二点。前面介绍JPEG时我们讲了它使用的几种无损编码方式,分别是差分编码、哈夫曼编码和行程编码。这其中从编码之后的数据量来说,其实最主要的是哈夫曼编码,它是可以改进的。在HEIF标准中,这种无损编码方式主要采用了自适应的二进制算术编码(下面简称“算术编码”)。

 

其实,随着JPEG跟随时代的发展,算术编码也被引入到了JPEG的编码方式中,但是主要还是哈夫曼编码。算术编码相比哈夫曼编码,可以进一步提高编码效率。其实算术编码的思想原理和哈夫曼编码是差不多的,都是考虑数据中不同字符出现的概率,然后给不同字符以不同的编码。算术编码具体的数学化思想很浓,难以三言两语讲清楚,这里也不方便展开说了。总之,算术编码最后得到的是一个很简洁,但是很长的小数。正是因为数学的思想很深刻,算术编码的编码效率要比哈夫曼编码更高,最后呈现在大家面前的,就是对于同一张照片可以压缩成更小的体积。以上,基本上就是HEIF能够在保证画质不变的前提下缩小图片体积的原因了。

 

最后,关于HEIF,还有一些比较基础的知识,大家可以比较轻松地了解到。IT之家之前也转了小米官方对HEIF格式介绍的文章。HEIF的全名是高效率图像格式(High Efficiency Image Format),是运动图像专家组(MPEG)在2013年推出的。它和前面的JPEG不是一个组织。

值得一提的是,HEIF的相关技术是诺基亚的技术人员制定的,在2015年基本定型,现在也是诺基亚在维护(HEIF官网:点此前往)。

 

有意思的是,HEIF的关键编码技术HEVC,华为正是主要推动者之一,手握大量专利,还在今年1月加入了HEVC Advance专利池。HEVC Advance专利池中的关键成员还有三星、联发科、皇家飞利浦等等。当然啦,小米10凭借自身的话题性,对HEIF图片格式的进一步普及确实也起到了推动作用。无论如何,汐元还是期待HEIF图片格式能够克服困难,尽快普及,毕竟现在智能手机摄像头像素已经能达到亿级了,JPG格式下手机的存储空间确实吃紧。毕竟,总不能只因为要存照片就非得买更大存储空间的手机吧。

年度最有价值文章

季度最有价值文章

月度最有价值文章