衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

壓縮語音以跨電話系統傳輸所需的模數轉換

科技觀察員 ? 來源:allaboutcircuits ? 作者: Sneha HL ? 2022-05-07 17:13 ? 次閱讀

本文介紹了壓擴主題——跨電話系統的人類語音的數字化、傳輸和轉換。

簡要背景

電話系統自發明以來一直處于高需求狀態,并且已經從公共交換電話網絡 (PSTN) 發展為現代無線數字移動系統。基于模數轉換的脈沖編碼調制 (PCM) 系統已經使用了六年。應該注意的是,無論使用哪種編碼,所有電話系統都是通過利用人類語音和聽覺機制背后的基本事實來工作的。

人類言語和聽覺機制

語音是人類之間的自然交流機制。單詞由不同的音素、幅度不同的單個聲音組成,安靜的音素比響亮的音素出現的頻率更高。一般來說,人類產生的語音信號的頻率范圍為 70Hz~400Hz,而人類聽覺的頻率范圍為20Hz~20kHz。我們的聽力具有選擇性,對300 Hz 至 10 kHz范圍內產生的聲音提供最高靈敏度。

這些以實驗為依據的事實得出的結論是,當在 0.3 到 3.4 kHz 范圍內記錄語音信號時,聽者很容易理解說話者所傳達的信息

poYBAGJ2OEaAEKvYAAC3M0S64IA612.jpg

圖 1. “語音香蕉”顯示了音素及其在識別所需的各種幅度下的頻率。圖片由Clear Value Hearing提供。

當聽力能力以分貝等級表示時,它的范圍從 0 dB SPL(聽力閾值)到 130 dB SPL(疼痛閾值)。

較低幅度和較高幅度之間的 比率很大。在一般意義上,較低幅度的聲音被認為是耳語,而較高幅度的聲音被認為是喊叫。然而,即使是正常的會話語音也有相當大的幅度變化,因為它是由不同的音素組成的。此外,可以看出,更安靜的音素比響亮的音素攜帶更多的信息并且具有更多的熵。

無壓擴的基于 PCM 的電話系統

電話系統最初是作為模擬系統出現的,現在已經變成了數字系統。因此,無論我們說什么都需要數字化然后傳輸——因此實際的模擬語音信號需要在接收端進行恢復。任何模擬信號到其數字形式的轉換都包括三個重要階段:采樣、量化和編碼。

語音信號的采樣

采樣是一個過程,通過該過程,我們可以將在所有時刻定義的原始信號轉換為僅在特定時刻定義的離散信號。

我們如何決定在哪些點定義信號?

我們首先考慮一個基本但非常重要的事實,即我們不僅對從發送方傳輸信號感興趣,而且對在接收方恢復信號感興趣。

與該過程相關的定理是著名的奈奎斯特定理,該定理指出,只有在至少以其中包含的最高頻率兩倍的速率對其進行采樣時,才能忠實地恢復傳輸信號。

因此,如果最高頻率是f,那么我們需要對信號進行采樣的頻率應該大于或等于 2 f。反過來,這意味著我們需要在距離小于或等于 1/2 f的時刻定義我們的信號 (由于頻率和時間彼此成反比)。

從上一節的討論中,我們知道我們對電話交談的興趣跨越了 0.3 到 3.4 kHz 的頻率范圍。并且任何成功的信號傳輸都需要存在保護頻帶,因此整個范圍變為0 到 4 kHz。因此,在我們的例子中,8 kHz (= 2 x 4 KHz) 的采樣率是一個不錯的選擇。

這表明,在采樣之后,我們的語音信號沿時間軸離散化,其中相鄰樣本之間的間距將為 18KHz=125微秒18KHz=125微秒。

語音信號的量化與編碼

請注意,采樣僅對時間軸上的信號進行數字化(參見圖 2 所示的典型示例,其中紅色正弦信號通過采樣轉換為藍色離散值信號)。然而,為了使語音信號在本質上完全數字化,我們需要沿其幅度軸對其進行離散化,這被視為量化。

pYYBAGJ2OEiAUPKIAAC5eMoTw_E272.jpg

圖 2.正弦波采樣

現在,我們的下一個問題將與采樣的情況非常相似——我們如何決定何時沿其幅度軸定義我們的信號?換句話說,我們定義信號幅度的點之間的間距應該是多少(這在技術上稱為步長)?

即使在這種情況下,我們也需要選擇步長,記住我們需要在接收端有最小的失真信號。這么想,讓我們假設我們選擇一個非常小的步長來量化低幅度信號(正弦波在值 +1 和 -1 之間變化,在圖 3a 中以粉紅色顯示)。較小的步長意味著我們將沿其幅度軸以非常接近的間隔定義我們的信號(圖 3a),因此定義我們的信號所需的步數將非常大,這需要大量的比特來對其進行編碼,這需要很大的帶寬。

poYBAGJ2OEiAHq6ZAABdiNrMLqQ950.jpg

圖 3. (a) 小步長 (b) 大步長的低幅度正弦波量化

考慮到帶寬,讓我們假設我們使用太少的步驟來定義我們的信號。較少的步數意味著我們沿其幅度軸定義信號的點之間的間距較大。這使我們能夠非常粗略地定義我們的信號(圖 3b),當我們在接收端重構信號時,這會導致問題,因為在量化過程中會丟失很多存在的信息。

接下來,我們分析在大振幅信號的情況下改變步長的影響。這在目前的情況下很重要,因為我們從關于人類言語和聽力機制部分的討論中知道,我們感興趣的信號(言語)包含廣泛的幅度。

圖 4 使用與圖 3 相同的步長來檢查量化的效果,當幅度增加四倍時(圖 4 中的原始正弦波的峰峰值幅度在 +4 到 -4 之間變化)。在這里,圖 4a 再次強調了這樣一個事實,即當我們需要復制原始信號時,較小的步長總是更好。

pYYBAGJ2OEmAIOJTAABmBCOjxAw896.jpg

圖 4. (a) 小步長 (b) 大步長的大振幅正弦波量化

另一個需要注意的重點是,圖 4b 中的量化信號不像圖 3b 中所示的量化信號那樣失真。也就是說,當信號幅度較高時,使用大步長的量化仍然會產生可接受的結果。這意味著當涉及到大幅度信號時,被證明對于低幅度信號“非常大”的步長并不是“那么大”。換句話說,可以說信號的幅度越高,量化它的步長就越大,而不會產生太大的失真。

壓擴:簡介

每個研究人員都相信,任何系統,無論多么好,都可以以某種方式進行改進。然而,為了找出最有效(或更好)的方法,必須仔細審查目前采用的概念和方法,并且必須從不同的角度進行審查。

為了在我們的案例中實現這一點,讓我們回顧文章的路徑,同時思考兩個重要點。

首先,請回想一下,就其中包含的信息而言,人類語言不是各向同性的。語音中較安靜的音素比大聲的音素出現得更頻繁并且包含更多的信息。其次,請注意,與較低幅度的信號相比,對于較高幅度的信號,選擇用于量化信號的步長可以更大(而不影響其質量)。

如果是這樣,為什么我們不能使用較小的步長量化低幅度的語音信號,而對幅度較大的語音信號使用較大的步長呢?可以辦到。事實上,這種使用非均勻電平量化語音信號的技術被稱為“壓縮擴展”,是壓縮和擴展的組合。

壓縮擴展是使用不等量化級別對信號進行編碼的過程。在該技術中,大量的小電平用于對低幅度信號進行編碼,而較高幅度的信號使用少量的大電平進行編碼。這意味著通過使用壓擴,我們可以用更少的電平量化我們的語音信號,同時保持所需的保真度。此外,級別數越少意味著要編碼的比特越少,這意味著帶寬要求降低。

結論

本文介紹了與人類語音相關的概念及其在基于 PCM 的電話系統中的特征。我希望您已經獲得了關于壓擴及其在電信領域的重要性的膚淺知識。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • PCM
    PCM
    +關注

    關注

    1

    文章

    196

    瀏覽量

    53376
  • 模數轉換
    +關注

    關注

    1

    文章

    216

    瀏覽量

    36948
收藏 人收藏

    評論

    相關推薦

    基于TMS320C6201的視頻圖像語音傳輸系統設計

    的。  圖像語音壓縮傳輸系統有二種基本的實現方法:一種是基于微機實現,圖像語音處理系統通過PC
    發表于 07-11 06:32

    基于模擬語音處理技術的電話遙控系統應用

    近年來,數碼語音處理技術領域已逐漸發展成為兩大陣營——傳統的數字語音技術和新型的模擬語音技術。前者是將語音信號經模數
    發表于 07-11 06:48

    Nios II語音加密傳輸系統有什么作用?

    由于缺乏保密措施,使得電話竊聽事件不斷發生,嚴重威脅著個人隱私、軍事商業秘密甚至地區或國家的信息安全。因此,語音壓縮和數據加密為基礎的語音
    發表于 11-01 07:42

    基于UDP協議的語音傳輸系統設計及實現

    摘 要:文中討論了基于UDP協議的語音傳輸系統的設計及實現。比較詳細的闡述了語音信息的錄制和播放、發送接收、壓縮和解
    發表于 07-02 21:51 ?44次下載

    基于DSP網絡電話終端語音傳輸的研究

    本文對于基于DSP網絡電話終端的語音傳輸進行了研究,提出了網絡電話通信系統總體設計方案。采用DSP(TMS320VC5402)和以太網接口電
    發表于 07-17 17:20 ?10次下載

    IP網絡電話中常用的語音壓縮編碼技術的性能分析

    語音編碼技術中常用的三種編碼方法入手! 由淺入深地引出了ip 網絡電話中常用的幾種語音壓縮編碼方法! 并對之進行了性能分析和比較"
    發表于 07-22 15:51 ?22次下載

    常用電話語音壓縮擴展集成電路

    常用電話語音壓縮擴展集成電路
    發表于 06-30 19:20 ?1508次閱讀

    語音壓縮技術,語音壓縮技術是什么意思

    語音壓縮技術,語音壓縮技術是什么意思 語音壓縮技術指的是對原始數字音頻信號流運用適當的數字信號
    發表于 03-06 11:11 ?2148次閱讀

    基于DSP的圖像壓縮無線傳輸系統設計

    基于DSP的圖像壓縮無線傳輸系統設計 提出一種基于DSP的無線圖像傳輸系統,該系統實現圖像的采
    發表于 03-13 10:00 ?1265次閱讀
    基于DSP的圖像<b class='flag-5'>壓縮</b>無線<b class='flag-5'>傳輸</b><b class='flag-5'>系統</b>設計

    基于DSP芯片TMS320C5402的數字壓縮語音錄放系統

    系統簡介 本系統的主要功能是通過對語音信號進行壓縮實現高效率數字錄音,可用于電話留言,語聲應
    發表于 09-14 17:54 ?2694次閱讀
    基于DSP芯片TMS320C5402的數字<b class='flag-5'>壓縮</b><b class='flag-5'>語音</b>錄放<b class='flag-5'>系統</b>

    一種語音壓縮處理通用DSP系統的設計與實現

    提出了一種基于 TMS320VC549定點 DSP微處理器芯片的語音信號壓縮 /解壓縮處理系統。 該系統采用 TLC320AD50C
    發表于 01-19 15:51 ?25次下載

    MSP430 的語音與音頻壓縮/解壓縮技術

    關鍵詞:技術 , 壓縮 , 音頻 , 語音 本應用報告將介紹 IMA 自適應差分脈沖代碼調制 (ADPCM) 的壓縮/解壓縮算法,討論在 MSP430 上使用 ADPCM 庫的相關步驟
    發表于 03-06 17:52 ?863次閱讀

    如何使用UDP協議設計及實現語音傳輸系統的方法詳細說明

     文中討論了基于UDP協議的語音傳輸系統的設計及實現。比較詳細的闡述了語音信息的錄制和播放、發送接收、壓縮和解
    發表于 11-20 17:13 ?16次下載
    如何使用UDP協議設計及實現<b class='flag-5'>語音</b><b class='flag-5'>傳輸</b><b class='flag-5'>系統</b>的方法詳細說明

    基于DSP技術模數兼容的多通道數字電話設計

    給出了一種基于 DSP 技術模數兼容的多通道數字電話系統設計方案。設計中采用了 DSP,低比特率語音壓縮編解碼,信道復用,FLASH MEM
    發表于 03-19 11:32 ?11次下載
    基于DSP技術<b class='flag-5'>模數</b>兼容的多通道數字<b class='flag-5'>電話</b>設計

    基于DTW算法的語音識別電話系統

    電子發燒友網站提供《基于DTW算法的語音識別電話系統.pdf》資料免費下載
    發表于 10-08 14:34 ?0次下載
    基于DTW算法的<b class='flag-5'>語音</b>識別<b class='flag-5'>電話</b><b class='flag-5'>系統</b>
    百家乐桌保险| 大发888注册送彩金| 大发888加盟合作| 丰禾国际娱乐城| 百家乐官网出千方法技巧| 大发百家乐现金网| 水果老虎机游戏| 百家乐官网星级游戏| 百家乐官网投注网出租| 百家乐筹码免运费| 香港六合彩马会| MG百家乐官网大转轮| 神人百家乐赌场| 盈彩娱乐| 澳门百家乐官网出千吗| 百家乐赌场论坛| 镇坪县| 百家乐官网和怎么算输赢| 先锋百家乐的玩法技巧和规则 | 威尼斯人娱乐城赌百家乐| 百家乐官网预测神法| 百家乐破解的办法| 大发888官方6222.| 百家乐官网博彩安全吗| 百家乐出庄几率| 捞金博彩论坛| 百家乐真钱棋牌| 六合彩图库大全| 太阳百家乐官网游戏| 大发888下载 客户端| 易胜博百家乐官网作弊| 网上百家乐作弊法| 百家乐官网洗码方法| 可以玩百家乐的博彩网站| 东光县| 百家乐与龙虎斗怎么玩| 利来博彩通| 百家乐里面的奥妙| 尊龙国际注册| 百家乐单双打法| 网上真钱麻将|