什么是語音芯片?
語音芯片定義:將語音信號通過采樣轉化為數字,存儲在IC的ROM中,再通過電路將ROM中的數字還原成語音信號。
根據語音芯片的輸出方式分為兩大類,一種是PWM輸出方式,一種是DAC輸出方式,PWM輸出音量不可連續可調,不能接普通功放,目前市面上大多數語音芯片是PWM輸出方式。另外一種是DAC經內部EQ放大,該語音芯片聲音連續可調,可數字控制調節,可外接功放。
普通語音芯片放音功能實質上是一個DAC過程,而ADC過程資料是由電腦完成,其中包括對語音信號的采樣、壓縮、EQ等處理。
錄音芯片包括ADC和DAC兩個過程,都是由芯片本身完成的,包括語音數據的采集、分析、壓縮、存儲、播放等步驟。
ADC=Analog Digital Change 模數轉換
DAC= Digital Analog Change 數模轉換
音質的優劣取決于ADC和DAC位數的多少。例如:20秒到 340秒,最低從10秒到340秒。語音芯片直觀的從名稱上來看,就是與語音有關的芯片,語音就是存儲的電子聲音,凡是能發出聲音的芯片,就是語音芯片,俗稱聲音芯片,英文準確些來說應該是Voice IC. 在語音芯片的大家庭中,根據聲音的類型不同可分為(Speech IC)和(Music IC)兩種。這兒應該算是語音芯片專業的區分方法。
2、語音信號的量化表述:(分類:語音芯片?和?音樂芯片)?
(a)?“語音芯片”介紹:??
(1)語音信號的量化
采樣率(f)、位數(n)、波特率(T)??采樣:將語音模擬信號轉化成數字信號。??采樣率:每秒采樣的個數(byte)。
波特率:每秒鐘采樣的位數(bit)。波特率直接決定音質。Bps:bit?per?second
采樣位數指在二進制條件下的位數。一般在沒有特別說明的情況下,聲音的采樣位數指8位,由00H--FFH,靜音定為80H。?
(2)采樣率
奈奎斯特抽樣定理(Nyquist?Law):要從抽樣信號中無失真地恢復原信號,抽樣頻率應大于2倍信號最高頻率。抽樣頻率小于2倍頻譜最高頻率時,信號的頻譜有混疊。抽樣頻率大于2倍頻譜最高頻率時,信號的頻譜無混疊。
嗓音的頻帶寬度為20~20K?HZ左右,普通的聲音大概在3KHZ以下。所以,一般CD取的音質為44.1K和16bit,如果碰到某些特別的聲音,如樂器,音質也有用48K和24bit的情況,但不是主流。
一般在我們處理針對普通語音IC的時候,采樣率最高達到16K就夠了、說話聲一般取8K(如電話音質)、6K左右。低于6K效果比較差。
在應用單片機的過程中,采樣越高,定時器中斷速度越快,會影響到其他信號的監控和檢測,所以要綜合考慮。
語音芯片有什么作用
語音芯片主要就是是產品上增加語音播報的功能,實現的也就是把語音播放出來。
常見的如:小家電按鍵語音、安全警報提醒、貨車報“左轉彎,請注意”等等,應用非常的廣泛
語音芯片的種類,不過主要的分類基本也就大致兩種:
1、第一種,稱之為OTP語音芯片,大多數是SOP8封裝的語音芯片,內置幾段常用的語音,出廠之后就固化死了,不可修改,這個是通過專用的燒錄器燒錄進去的,也有可能是在制作晶元的時候就已經光照進去了,這種就需要很大的量了,所以運用不靈活,而且播放音質一般。
2、第二種,就是MP3語音芯片芯片,它是支持MP3解碼,比OTP語音芯片在技術上是一個跨越,將MP3這種優秀的技術應用于語音芯片上,同時他強大的usb直接虛擬flash成為U盤,這樣更新語音非常方便,直接像拷貝U盤一樣拷貝語音進去就可以了。也可以通過外掛TF卡、SD卡或者U盤的方式進行解碼播放,播放聲音細膩優質。
語音芯片發展趨勢
趨勢一、定制化、低功效、高效能、端智能
語音芯片以其定制化、低功效、高效能、端智能以及成本上的優勢等勢必會在未來占據重要的市場地位,成為人與云端溝通的橋梁。在亞馬遜、阿里、小米等公司的助推之下,智能音箱的銷售在全球取得了爆發式的增長,語音芯片的出貨量也將出現一個爆發。縱觀這個語音芯片的發展歷史,他經歷了通用組合芯片、語音芯片、語音AI芯片三個階段。而在起一個通用組合芯片階段,由于芯片本身漫長的研發周期和高昂的研發投入,在當時并沒有形成一定的市場規模的前提下,市場上并沒有后出現專門運用了語音芯片的產品。另外一個方面,在語音交互場景出現的初期,智能設備并沒有形成一定規模的銷量,即使相關的從業者看到了潛在的機會,研發一款成熟的語音芯片所需要的前期的投入成本決定在初期的智能設備上不可能大規模使用語音芯片,只能以其他芯片作為過渡。
趨勢二、AI語音芯片蓄勢待發
未來,隨著華為麒麟970芯片以及蘋果A11芯片的推出,AI芯片成為行業熱議的話題。所謂AI芯片也被稱為AI加速器或計算卡,即專門用于處理人工智能應用中的大量計算任務的模塊(其他非計算任務仍由CPU負責),從而實現端側智能。
目前無論是智能音箱還是其他智能設備,更多的智能都是在云端來實現,但云端存在著語音交互“時延”的問題,對網絡的需求限制了設備的使用空間,以及由此帶來的數據與隱私危機。為了讓設備使用場景不受局限,用戶體驗更好,端側智能以成為一種趨勢,語音AI芯片也隨之而來。