|
|
发表于 2005-8-8 22:58:20
|
显示全部楼层
Post by gamedragon
8K的采样率如果再用MP3的算法压缩,在保证质量的情况下其压缩比很差。人耳已经可以分辨20K的频率,8K的采样率已经远低于这个频率了。语音处理中(采样率一般是8K或16K)一般用其他的方法压缩,具体算法我就搞不清楚了。
一般来说,语音(电话中)一般滤波器通带是300Hz-3400Hz,在这个范围外的声音信号就被过滤掉了,对于语音通信来说,这个没有什么影响。 根据抽样定理,采样率须大于最高的频率的两倍
即3400HzX2 ,所以国际长途电话的标准采样定在8KHz,每个抽样值用8bit表示。所以长途电话(现在都是数字交换的)的数据速率是64Kbps, 不过一般手机通信是不采用这种标准。
mp3的主要问题与上述没有关系。
一般CD音频抽样率为44.1KHz,DVD更高,好像是192K的。每个抽样值一般是16bit表示。用44.1KHz抽样得来音频数据一般不经过压缩就是CD光盘上的音乐了。
mp3采用的是有损压缩,也就是说压缩后再解压不能得到与原来一样的音频,但这对于音频数据来说,这个并没有多大的关系。
一般来说,有这样的一种方法可以用于压缩。先把一些的数据分块(段),然后对这些段作FFT(快速傅立叶变换)或离散余弦变换,主要作用是把时域(在这里可以简单地认为声音数据是以时间作为自变量x的函数)变到频域(频域即是以声音数据的频率f为自变量的声音函数),之后可以看看那一个频段的分量很小,可以忽略。一般来说很多时候,声音都是主要集中某一个频段的,所以其他频段的分量很小,可以略去不要(有损了)。一般来说,都是不要高频那一段,因为那一段的每个频率f上取值很小。这样保存好频域这些频段数据就可以达到压缩的目的。
播放时再反变换就可还原原声音了。
快速傅立叶变换(离散)有这样一个性质FFT(f(x,y))-- 快速傅立叶变换--> F(X,Y)
变换后的X,Y范围与原来的x,y是一样的,这样如果去掉另F(X,Y)中高频段的数据,就可以达到压缩的目的了。
数字图像压缩原理有些算法也是这样。实际中,转换后的图像也是一张图片(频域)一般只保留转换后图像的四分之一的面积,经还原后,也可以达到很好的显示效果。
说得如果不对各位议论 |
|