要将模拟信号在数字传输系统中进行传递,就必须用信源编码器对话音信号进行模数变换。语音信号模数变换的方法很多,如脉冲编码调制,增量调制和参数编码等,其中用得较为广泛的是脉冲编码调制。
话音信号(模拟信号)数字化的过程是:抽样—量化—编码。
1.抽样——信号在时间上的离散化
话音信号不仅在幅度取值上是连续的,而且在时间上也是连续的。抽样就是每隔一定的时间间隔(T),对在时间上连续的话音信号抽取瞬时幅值的过程,该过程简称为抽样。抽样后所得到的一串在时间上离散的信号序列被称为样值序列信号,或抽样信号,如图所示。
模拟信号的抽样
将话音信号抽样后,所得抽样信号在信道上占用的时间被压缩了,因而它为时分复用奠定了基础,同时也为数字化提供了条件。但抽样信号中必须含有原始话音信号的信息,并要求在接收端将抽样信号恢复成原始话音信号。为了达到上述要求,抽样的时间间隔T(抽样周期)不能太长,或者说抽样频率不能太低。
一般情况下,抽样频率(fs)应大于传输信号中最高频(fm)的两倍(奈奎斯特抽样定理),即fs>2fm。
在电话通信系统中,用3400Hz作为最高频率(fm)已能很好满足用户的要求。考虑到一定的冗余,目前 PCM 通信规定话音信号的抽样频率fs=8000Hz。抽样周期T=1/fs=1/8000=125μs。
2.量化——信号在幅值上的离散化
抽样所得到的抽样信号虽在时间上是离散的,但它在幅度取值上仍是连续的,即它可以是输入模拟信号幅值中的任意幅值,或者说可有无限多种取值,它不能用有限多个数字来表示,它仍属模拟信号。要想使它成为数字信号,还需把它的抽样值进行离散化处理,将幅值为无限多的连续信号,变换成幅值为有限数目的离散信号,这一幅值上离散化处理的过程称为量化。量化就是“分级”的意思,量化采用类似“四舍五入”的方法,使每一个抽样值用一个相近的幅值来近似。量化方法可分为线性量化和非线性量化。
(1)线性量化:线性量化也称为均匀量化,它把输入的抽样值的范围划分为若干等距离的小间隔,每个小间隔叫做一个量化级。当某一输入的抽样值落在某一间隔内时,就用这个间隔内的中间值来近似地表示这个抽样值的大小,并以此值输出。这样大信号和小信号的绝对误差相同,而对小信号来说,相对误差(噪声)很大,也就是说信噪比小,不能满足语音信号的传输要求(信噪比为输出的信号功率与噪声功率之比。信噪比越大,说明通信质量越好)。
(2)非线性量化:非线性量化(又称为非均匀量化)就是使用不等的量化级差(间隔),小信号分级密,量化级差小;大信号分级疏,量化级差大。或者说量化间隔随着信号幅值的减小而缩小,使信号幅值在较宽的动态范围内的信噪比都能达到指标规定的要求。
非线性量化是利用压缩和扩展的方法来实现的。不同幅值的信号经过具有压缩特性的放大器后对小信号的幅度有较大的放大作用,而对大信号的幅度则有压缩作用。这样在对经过放大后的抽样小信号进行量化时,就使小信号的量化误差相对减少,信噪比得到改善,如果放大作用大,则改善的程度也大;至于大信号经压缩、量化后,信噪比将降低,结果使话音信号在整个动态范围内的信噪比基本上相差不多,且都能满足规定的要求。
3.编码——信号在表现上的数字化
模拟信号经过抽样和量化以后,在时间上和幅度取值上都变成了离散的数字信号。如果量化级数为N,则信号幅度上有N个取值,形成有N个电平值的多电平码。但这种具有N个电平值的多电平码信号在传输过程中会受到各种干扰,并会产生畸变和衰减,接收端难以正确识别和接收。如果信号是二进制码,则只要接收端能识别出是“1”码还是“0”码即可。所以二进制码具有抗干扰能力强的优点,且容易产生。故在数字通信中,一般都采用二进制码。量化级为N时,则量化离散值共有N个。将每个离散值用一组二进制码表示。这一组二进制码的位数为L,则有2L=N。L为码字位数,如:23=8,将多电平码变成二进制码的过程称为编码,N为量化级数。
经过量化后,形成±128个数量级,用8位码表示,其中第一位码为极性码,第二、三、四位为段落码,最后四位为段内码,如图所示。
PCM码字的分配