5068儿童新闻中心

为什么数字和图像可以被压缩

书之意 2015-06-24 09:56:09 手机版

  回忆是非常美好的,每个人都希望将自己最美好的东西永远的保存下来。随着科技的不断进步,人们保存的方式方法也逐渐变多了,人们可以通过视频和图像的方式保存,可是有时候感觉内存不够需要压缩文件,这对文件有什么影响吗?又为什么数字图像可以被压缩呢?下面就由小编来给大家解答一下疑惑吧。

  如果想要搞清楚这个问题,就要从图像是如何被数字化的谈起。先来看一张玩具鸭子的图片是怎么被数字化的。

  首先,要把这张图片分成若干小块,每个小块中的颜色用一个数字来表示。如果图像是纯黑纯白两色的,那每块只用1 或0 表示即可。如果图像是16 色的,那每块就要用4 位二进制数来表示,因为4 位二进制数有16 种组合,每种组合表示一种颜色,正好可以表示16 种颜色。而真彩色位图的每个小块,都是由不同等级的红、绿、蓝三种色彩组合的,表达起来就更复杂一些。如果每种颜色有28 个等级,那就可以有224 种颜色,这样一来,每小块就需要24 位二进制数来表示,才能囊括所有色彩。

  由此可见,数字图像色彩越绚丽,需要记录的二进制数就越多。小色块越多,分布得越密,则一幅图的总数据量就越大。

  回头来看这个玩具鸭子图片,如果像图中所示被分成了154 个色块(11×14),并按真彩色位图来计算,则总数据量就是154×24=3696比特。这些小格子显然是太大了,如果这样来切分图片,还原后的图片就不能表现图片的细节。在实际应用中切分的格子要密得多。这些格子其实就是我们常说的像素。格子分得越多表示像素越高,也就是分辨率越高,大家都熟悉的显示器分辨率就是1024×768。所谓数字化图片,就是将图片的画面信息用二进制数字来表示。

  压缩文件有很多种格式,你在自己的图片文件后看到的“.bmp”或“.jpg”就是文件格式的名称。bmp 格式是将图像的每个格子都独立记录的,因此数据量很大。如果按照前述的预测差值运算后,就变成了有损压缩式,jpg 格式就是其中之一。对于画质基本相同的两幅图像,jpg 格式的数据量要比bmp 小得多。不过,虽然jpg 是有损压缩的,但画质的损失非常小。因为它是很智能的,比如它可以自动对有大面积相似色彩的飞机图片给予较大的压缩率,而对人群图片给予较小的压缩率。

  相对于上述的静态的图像压缩,视频图像的压缩率就更大了。视频图像文件也有很多文件格式。一般情况下,一秒钟视频会切换成几十张画面,而这些画面的绝大部分都是相同的,可是采集是每幅独立采的,因此生成的avi格式的数据量是很大的。不仅每幅画面本身可以压缩,更重要的是幅与幅之间也可以压缩,这就形成了数据量小得多的mpeg 格式。当然,也可以采用压缩率更高的rm 格式。rm 格式的画质比mpeg 差得不多,但数据量却小了很多倍,更方便在网上传输。

  不同的视频,幅与幅之间的相似度是不同的,有些相似度很大的电视剧,也许在几分钟内,演员都坐在沙发上聊天,除了嘴巴动作外每幅画面都基本一样,对这种视频可以采用较大的压缩率,而对动感性很强的武打片,则需要采用较小的压缩率,这种格式就是rmvb。跟rm 格式不同的是,它的压缩率是可变的,vb 就是可变比特率的意思。rmvb 则比rm 更先进,相同数据量的rmvb 视频会比rm 视频清晰,而相同清晰度的视频,rmvb 格式的数据量会更小。

  根据先验信息我们知道,只有极少数的组合是经常出现的,绝大多数的组合是基本不会出现的,如果我们得到了一组模糊不清的组合,它跟经常出现的某个组合与基本不会出现的某个组合的相似度一样,那我们就毫不犹豫地认定它就是那个经常出现的组合。当然,它是那个基本不会出现的组合的可能性也是不能排除的。就好比那个民国美女如果真的涂了蓝嘴唇,那我们依靠先验信息做的判断就可能出错了。