什么是杜比AC-3
(Dolby Digital AC-3)是杜比公司開發的新一代家庭影院多聲道數字音頻系統。杜比定向邏輯系統是一個模擬系統。它的四個聲道是從編碼后的兩個聲道分解出來的,因此難免有分離度不佳、信噪比不高,對環繞聲缺乏立體感,并且環繞聲的頻帶窄等缺點。AC(Audio Coding)指的是數字音頻編碼,它拋棄了模擬技術,采用的是全新的數字技術。
杜比AC-3特點
杜比數字AC-3提供的環繞聲系統由五個全頻域聲道加一個超低音聲道組成,所以被稱作5.1個聲道。五個聲道包括前置的“左聲道”、“中置聲道”、“右聲道”、后置的“左環繞聲道”和“右環繞聲道”。這些聲道的頻率范圍均為全頻域響應3-20000Hz。第六個聲道也就是超低音聲道包含了一些額外的低音信息,使得一些場景如爆炸、撞擊聲等的效果更好。由于這個聲道的頻率響應為3-120Hz,所以稱“.1“聲道。
杜比數字AC-3是根據感覺來開發的編碼系統多聲道環繞聲。它將每一種聲音的頻率根據人耳的聽覺特性區分為許多窄小頻段,在編碼過程中再根據音響心理學的原理進行分析,保留有效的音頻,刪除多作的信號和各種噪聲頻率,使重現的聲音更加純凈,分離度極高。
杜比數字AC-3系統可用前置的左、右音箱,中置音箱產生極有深度感和定位明確的音場,用兩個后置或側置的環繞音箱和超低音箱表現寬廣壯闊的音場,而六個聲道的信息在制作和還原過程中全部數字化,信息損失的很少。全頻段的細節十分豐富,具有真正的立體聲。
杜比數字AC-3具有很好的兼容性,它除了可執行自身的解碼外,還可以為杜比定向邏輯解碼服務。因此,目前已生產的杜比定向邏輯影視軟件都可以使用杜比數字AC-3系統重現。由于杜比數字AC-3系統的編碼非常靈活,所以它的格式很多。目前它已被美國采用作為高清晰電視(HDTV)音頻系統,最新DVD機也包含杜比數字AC-3。因此杜比AC-3環繞聲系統可能是極有發展前途的技術。
數字音頻技術與杜比AC-3
隨著人們對多媒體圖像和聲音的要求越來越高,在高清晰數字電視(HDTV)和數字電影中不僅應有高質量的圖像,也應當具有CD質量的立體聲。因為用數字方法記錄聲音比用模擬方法記錄聲音具有更強的優勢,例如傳輸時抗噪聲能力強、增加音頻動態范圍、多次翻錄沒有信號衰減等。但是數字聲音最大的缺陷是記錄的數據量大,表現在兩個方面:其一是在傳輸過程中,傳輸數字聲音需要占用很寬的傳輸帶寬;其二是在存儲過程中,需要占用大量的存儲空間。所以在數字音頻中需要采用數字音頻壓縮技術,對音頻數據進行壓縮。
杜比AC-3提供的數字音頻壓縮編碼技術具有較高的編碼效率;而由5個全頻域聲道和1個超低音聲道組成的AC-3環繞聲系統能完美再現高質量的立體聲。
1 數字音頻編碼的原理
目前,高品質聲音的主流是CD音質,其采樣頻率為48kHz或44.1kHz,以每個采樣點16bit的精度進行編碼,其比特率將達到每個通道768kbps(48kHz采樣率)和705.6kbps(44.1kHz采樣率),雙聲道立體聲分別需要1.54Mbps和1.41Mbps的碼率。而如果采用新的音頻編碼技術,則可以在保持同等音質的前提下,實現64kbps~128kbps速率編碼。以44.1K樣本/秒計算,相當于每個采樣點1.5bit,以如此低的平均信息量能達到接近于CD的高音質,這就是高品質數字音頻編碼要達到的目的。
一般來說,數據壓縮有兩種方法。一種方法是利用信號的統計性質,完全不丟失信息的高效率編碼法,稱為平均信息量編碼或熵編碼(entropy coding)。第二種方法是利用接收信號人的感覺特性,省略不必要的信息,壓縮信息量,稱為感覺編碼(perceptual coding)。
音頻信號的感覺編碼是以心理聲學原理為基礎,利用聽覺心理特性,只記錄那些能被人的聽覺所感知的聲音信號,從而達到減少數據量而又降低音質的目的。一般而言,人耳的聽覺像20Hz~20kHz帶通濾波器,它對不同頻率的信號有不同的感知辨別率。相對于高頻而言,低頻的聲音更易新人耳感知,其中尤以對2kHz~4kHz的信號最為敏感,因而形成了圖1中的絕對可聞閾曲線。絕對可聞閾是指寂靜地聽覺可聽到的各頻段的最低音量。遮蔽效應對于聽覺特性有著很大的影響。遮蔽分為同時性的遮蔽和非同時性的遮蔽。前者是頻域下的一種現象,指在相近的頻率下,強度較大的信號會遮蔽較小的信號。后者也稱時間的遮蔽性,是指在短暫的時間間隔內,強度大的信號遮蔽較小的信號,它又分為前遮蔽和后遮蔽。前遮蔽是指強度大的信號遮蔽發生較早的小信號,后遮蔽則是強度大的信號遮蔽發生較晚的小信號。通常前遮蔽的持續時間為20ms,對再前的聲音的影響幾乎可以忽略;而后遮蔽所產生的效應相對大而且持久,一般可達100~200ms,所以應用更為廣泛。典型的聽覺心理特性如圖1所示的頻率特性(左)和時間特性(右)。
圖1中,噪聲A因在絕對可聞閾以上而可聞,但噪聲C因在絕對可聞閾以下,故聽不到。如左圖所示,當有黑線所示的某頻率信號存在時,靠近它的本來可以聽見的噪聲B就變得聽不見了,這種現象就是同時性遮蔽效應。而如右圖所示,當某時刻有黑線所示的信號存在時,位于其后面的比它小一些的本來可聽見的噪聲E也變得聽不見了,這種現場稱為非同時性遮蔽效應。兩種效應合成的結果形成了實際的可聞閾。
杜比AC-3就是一種感知型編碼方式,它把整個音頻頻帶分割成若干個較窄的頻段,因為人類的聽覺對不同頻率的聲音具有不同的靈敏度,各頻段的寬度并不完全一樣。由于有用的信號被劃分成狹窄的頻頻,編碼噪聲的濾降總是就比較容易。因為對于每個頻段來說,該頻率以外的所有信號可以全部被濾除掉而不會損傷有用信號。而頻段內,剩余噪聲信號的頻率與有用信號的頻率非常接近,這正是遮蔽效應發揮最大作用的區域。從這種意義上說,象AC-3這樣的感知型編碼系統是一種非常有效的減噪系數。這些被分割成狹窄頻段的多路數字音頻信號最終還需要被合成一路完整的全頻帶信號,但每一個頻段所占有的數據量并不是平均分配的,編碼器內部有一個“聽覺遮蔽模塊”,可以模擬人的聽覺遮蔽效應,它能根據信號的動態特性來決定在某一時刻的數據用量應當如何分配給各頻段才是最合適的。頻譜密集、音量大的聲音元素應該獲得較多的數據占有量,那些由于遮蔽效應而聽不到的聲音則少占用或不占用數據量。
2 AC-3的編解碼技術簡介
AC-3是在AC-1和AC-2基礎上發展起來的多通道編碼技術,保留了原AC-2中如窗函數處理、指數變換編碼、自適應比特分配等許多特點,還新增了運用立體聲多聲道的編碼技術策略的coupling和rematrix算法。一般而言,立體聲的左聲道和右聲道的信號在聽覺上十分相似,存在著許多重復的冗余信息,將這兩個聲道的信號聯合起來加以編碼,便可除去冗余的信號且不會影響原來的音質。這里AC-3陣低碼率的又一個有效的手法。
圖2為AC-3編碼器原理框圖。AC-3輸入PC聲音數據,輸出壓縮后的數碼流。編碼的第一步是,運用TDAC(Time Domain Aliasing Cancellation)濾波器把時域內的PC取樣數據變換成頻域內成塊的一系列變換系數,每個變換系數以二進制指數形式表示,即由一個指數和一個尾數構成。指數部分經編碼后構成了整個信號大致的頻譜,又被稱為頻譜包絡。用頻譜包括和遮蔽由線的相關性決定每個尾數的比特分配。由于比特分配中采用了前/后向混合自適應比特分配以及公共比特池等技術,因而可使有限的碼率在各聲道之間、不同的頻率分量之間獲得合理的分配;在對尾數的量化過程中,可對尾數進行抖晃處理,抖晃所使用的偽隨機數生器的可在不同的平臺上獲得相同的結果。最后由六個塊的頻譜包絡、粗量化的尾數及相應的參數組成AC-3數據幀格式,連續的幀匯成數碼流輸出。
由時域變換到頻域的塊長度的選擇是指數變換編碼的基礎。在AC-3中定義了兩種長度切換,一種是512個樣值點的長塊,一種是256個樣值點的短塊。在信號頻譜分析時,對要處理的聲道信號塊區截取得越長越好,這樣可以得到較好的頻率分辨力,同時也能得到較高的編碼效率。但是較長的數據塊可能包含了一些不同一些可能被識別的噪音,如pre-echo。也就是說人耳因時間和頻率上存在的遮蔽效應在進行指數變換編碼時是有矛質的,不能同時兼顧,必須統籌處理。對于穩態信號,其頻率隨時間變換緩慢,為提高編碼效率,要求濾波器組有好的頻率分辨力,即要求一個長區塊;而對于快速變化的信號,則要求好的時間分辨力,即要求一個短區塊。在編碼器中,輸入信號在經過3Hz高通濾波器去除直流成分后,再經過一個8kHz的高通濾波器取出高頻成分,用其能量與預先設定的閾值相比較,以檢測信號的瞬變情況。
AC-3采用基于改良離散余弦變換(MDCT)的自適應變換編碼(ATC)算法。雖然在AC-3標準中定義了MDCT變換,但是實際采用一個N/4點的IFFT(快速傅立葉變換),再加上兩個簡單的Pre-IFFT和Post-IFFT作為調整,以實現一個N點的IMDCT變換。ATC算法的一個重要考慮是基于聽覺遮蔽效應的臨界頻帶理論,即在臨界頻帶內一個聲音對另一個聲音信號的遮蔽效應最明顯。因此,劃分頻帶的濾波器組要有足夠迅速的頻率響應,以此保證臨界頻帶外的噪聲衰減足夠大,使時域和頻率內的噪聲限定在遮蔽閾值以下。
在AC-3編碼器的比特分配技術中,采用了應用廣泛的前向和后向自適應比特分配法則。前向自適應方法是編碼器計算比特分配,并把比特分配信息明確地編入數據比特流中,其特點是在前端編碼過程中使用聽覺模型,因此修改模型對接收側解碼過程沒有影響;其缺點是降低編碼效率,因為要傳送比特分配信息而占用了一部分有效比特。后向自適應方法沒有得到編碼器明確的比特分配信息,而是從數碼流中產生比特分配信息,優點是不占用有效比特,因此有更高的傳輸效率。其缺點是要從接收的數據中計算比特分配,如果計算太復雜會使解碼器的成本升高。此外,解碼器的算法也會隨著編碼器聽覺模型的改變而改變。AC-3采用混合前向/后向自適應比特分配,在提高碼率和降低成本間取得了平衡。
? ? ? ? ?AC-3解碼器的解碼原理基本上是編碼的逆向過程,首先解碼器必須與編碼數據流同步,然后從經過數據糾錯校驗的數碼流中分離出控制數據、系統配置參數、編碼后的頻譜包絡及量化后的尾數等內容,根據聲音的頻譜包絡產生比特分配信息,對尾數部分進行反量化,恢復變換系數的指數和尾數,再經過合成濾波器組,把數據由頻域變換到時域,最后輸出重建的PCM樣值信號。
通過對AC-3的了解,可以看到AC-3技術充分利用人耳的感官模型,針對不同性質的信號,采取了相應有效的算法,達到了在保證較高音質的前提下實現較高碼率的預期目的,是一種非常高效而又經濟的數字音頻壓縮系統。AC-3是美國數字電視系統的強制標準,是歐洲數字電視系統的推薦標準,同時,AC-3還是DVD系統的強制標準。目前我國正在發展和推廣數字電視系統,所有有理由相信AC-3技術會有一個不錯的應用前景。
評論