電子發燒友報道(文/黃山明)如何去給一個產品定義是否智能?能夠進行計算,能夠感知外部變化,能夠具備交互能力,簡單來說如果設備能夠像人一樣,可以思考與交流,并且可以根據指令幫助我們完成某一個特定的事情,筆者認為便可以稱之為智能產品,而智能汽車亦如是。
從車聯網到智能座艙,智能汽車技術正在快速發展,作為智能的體現,使用語音操控是最便捷的交互方式。據國務院發布的《新能源汽車產業發展規劃(2021-2025)》,預計2025年新能源汽車銷量將達到1700萬輛,市場滲透率達到20%。具體到車載語音市場,據公開數據統計,2020年中國前裝車載語音市場(包含軟硬件)規模約為17億元人民幣,到2025年,市場規模將增長至30億元人民幣。
2019-2025年中國汽車智能語音前裝市場規模預測|ICVTank
如何讓駕駛員愛上車載語音?
相比按鍵或是觸控方案,車載語音對于車輛控制,既能避免駕駛員分心,又能提升駕駛員的駕駛體驗。同時,車載語音作為連接車聯網的入口,就如同當年的智能音箱一樣,受到了眾多企業的關注。但與智能音箱相比,由于車輛的使用環境、用戶群體的不同,對語音系統提出了更嚴苛的要求。
一個很突出的問題是,據筆者詢問過幾位新能源智能汽車車主表示,在體驗過幾次車載語音后,便表示不會再用這一功能。究其原因,主要在于用戶體驗不佳,反應遲鈍,無法正確理解車主的需求等。
為此,電子發燒友帶著這些疑惑采訪到了清微智能CEO王博,他認為問題主要出在用戶體驗上。首先是習慣性問題,通過語音來控制并非是許多駕駛者的第一反應;第二則是技術問題,一個指令發出去,兩三秒之后才反應,很難說是一個很好的體驗,而且在目前的網絡環境下,一些特殊場景中,可能無法聯網進行使用;除此之外的網絡傳輸信息泄密等安全問題也需要考慮。
聲揚科技合伙人及產品VP謝基有對電子發燒友記者表示,從技術角度來看,想要讓車載語音擁有一個好的用戶體驗,需要在幾個方面上改進,一個是在車內環境中如何精準獲取用戶的聲音,但車內環境復雜,存在車噪、風噪等噪音,以及各種聲波反射后的混響,想要獲得精準人聲比較困難;另一個則是語音的識別率,當車載語音多次無法準確識別駕駛員的語音指令時,自然就不會再用了。
語音識別原理圖
針對這些問題,聲揚科技也聯合了ADI進行相關合作,在其芯片上集成同聲分離的算法,能夠在兩個人同時說話時,將各自的聲音區分開來進行識別。
當兩人以上同時說話時,單點的音節無法分辨,因為這兩個聲音在物理形態上處于疊加,聲波疊加后可能變成第三種聲音。汽車環境中,可以采用多麥克風陣列的方式將聲音進行收集。再進行同聲分離,分離出不同音區的聲音,后續再用算法進行降噪和去混響。
而在降噪方面,尤其是在車窗開啟時,噪聲極大。許多汽車在車內的吸音并不一定做的很好,這種情況下車內的噪聲,對于語音識別帶來極大挑戰。聲揚科技在這些方面都有較為豐富的技術積累,同時也與ADI等企業合作進行技術攻關。
至于語義的理解,目前而言已經發展較為成熟。只要前端做的足夠好,對于后端而言壓力會減輕許多。聲揚科技在車內場景針對數字的識別準確率可以達到99%以上,對于非固定內容的識別率也保持在90%以上。
當車載語音能夠切實幫助駕駛員解決實際問題,精準接收并執行駕駛員的指令,減少注意力的分散,提升駕駛體驗,這樣才能得到真正廣泛的應用。而在目前,車載語音仍處于較為初級的階段,許多功能正在快速迭代,這也推動著車載語音滲透率的進一步增長。
離線語音算法僅KB級 對廠商提出高要求
據水木清華研究中心數據顯示,2019年,中國乘用車車載語音裝配率為48.8%;2020年1-9月,裝配率已經提升至64.8%。從市場競爭格局來看,據中泰證券數據顯示,2020年1-4月,科大訊飛和Cerence占據83%份額,百度、思必馳、傲碩、阿里云等企業緊隨其后。
2020年1-4月國內語音識別供應商裝機量統計|中泰證券
在進行語音識別的過程中,車輛可能需要處于聯網狀態當中,這就對車路協同、大數據、移動網絡有一定的要求,而在車內的應用場景中,用戶使用車載語音希望能夠得到即時的反饋,如調整座椅、控制空調等,這些簡單且固定的命令可以交由本地去做。
王博認為,目前階段,車載語音主要用來人對車的一些簡單的操作,語義相對簡單和有限,離線的方案還是比較適合的。另外,隨著算法的演進和優化,以前在云端的模型,現在完全可以放在車機端使用。只要讓車機具備更新語音模型的能力,就能讓離線方案也獲得不錯的用戶體驗。
清微智能的車載離線語音模塊無需聯網,減少了網絡通信的延遲,可打造真正的“無縫”連接,讓系統快速響應;同時針對駕車環境,清微方案配備車噪降噪算法;另外,可重構計算技術帶來的芯片靈活性可方便集成客戶自有算法,提升駕駛者的使用體驗。
目前而言,由于通信基礎設施還未完全覆蓋所有應用場景,如地下停車場中,由于信號較差,導致聯網功能在一定程度上無法使用,造成用戶體驗下降。為此,聲揚科技也提供了相應的離線解決方案,在使用聲紋識別時,可以通過離線方式來判斷駕駛員的身份。
謝基有表示,未來可能隨著5G的發展,對于信號覆蓋會有一定提升,使用云端服務會更加便捷,但并非所有場景都能夠被信號覆蓋。一個很顯著的例子是,盡管4G網絡發展多年,但在許多地點,如地下停車場時,信號仍然非常差,因此離線在某些場景中仍然是必須的。
此外,離線方案需要在CPU中運行,單靠MCU無法承載。即便是CPU,也需要進行深度的優化及定制,還需要考慮到一些芯片無法進行浮點運算,則需要再做浮點程序定點化操作。但這些芯片中所預留的RAM僅有KB級,如聲揚科技在ADI的DSP芯片上運行整個算法,僅用了150KB左右,這就對于供應商廠家技術提出了更高的要求。
聲紋識別解決安全問題 算法解決數據難題
車載語音除了幫助駕駛員解放雙手,減少注意力的分散,更多的是為駕駛員提供一種更為舒適的駕駛體驗,提高對整輛車的掌控感。但車載語音的出現也帶來了一個問題,當車內并非只有一人時,其他人如果也通過語音來控制車輛,如行駛過程中打開后備箱、打開車門等,反而會對駕駛造成一定的安全隱患。
對此,謝基有表示,聲揚科技非常擅長的一個領域便是聲紋識別,可以判斷出哪些語音是車主本人所說的,哪些是其他人說的話。通過聲紋判定了身份也就確認了是否有進行該操作的權限,從而解決上述問題。聲揚科技也與國內的一些汽車品牌進行合作,當行車過程中靠近某個景點,提示是否需要購買門票時,可以設定只有具備權限的人,才能完成確認進行購買支付的操作。
并且聲紋識別也可以進行活體檢測,通過語音圖譜,可以清楚的辨別是否是真人在現場說話,還是通過錄音回放甚至是通過語音合成的方式進行通話,這種聲紋鑒定技術也被應用在了防電話詐騙等安防領域。
當然,眾所周知,做聲紋識別等生物識別技術時需要使用到大量的數據,幫助企業進行技術的迭代,但許多語音廠商拿不到主機廠的數據,主機廠沒有沒有語音廠商的技術,又不愿意分享車內數據以提升產品功能,因此很難實現有效連接。而語音如要發揮最大優勢,還應該與車控以及V2X部分進行連接。但是主機廠在這方面也對語音廠商有限制,因為如果連接的話會增加主機廠的風險。
謝基有表示,V2X有兩種數據,一部分是車輛本身的行駛數據,如車速等;另一部分則是語音的數據,而語音廠商目前只需要語音數據去完成算法性能的提升,其實并不需要大量的數據,可以在應用過程當中通過自動學習來進行迭代。
同時,在應用之前,聲揚科技也會通過其他場景中的語音數據,來優化算法,盡管與車內環境場景不同,但在人物的聲紋特征上是一致的,通過降噪等算法,讓應用環境差異變得更小,也更適用于車內的場景。因此可以認為,聲揚科技的算法具有較好的普適性及獨創性。
5%到20% 新能源汽車帶動車載語音快速發展
據中汽協發布的《2021年中國汽車市場預測報告》顯示,預計2020年全年汽車總銷量將達2530萬輛,其中新能源汽車銷量約達130萬輛,占比約為5.14%。而中國推出的《新能源汽車產業發展規劃》從政策層面明確提出,到2025年我國新能源汽車銷量將占總銷量的20%,顯然未來幾年,新能源汽車還有巨大的發展機遇。
而新能源汽車的快速發展,也將帶動車載語音的快速滲透。謝基有認為,新能源汽車代表著造車新勢力,他們對于新技術的接受程度會更高,并且新能源汽車一個很大的亮點就是智能,除了ADAS智能輔助駕駛系統外,智能座艙也是也是其中重要的一環,而車載語音便是與智能座艙緊密結合。
在過去幾年,汽車中車載語音大多在后裝市場,許多傳統車企對于新技術的接受程度較低,想要說服這些企業在前裝便把語音系統加入進去較為困難,因此只能采用后裝的方式,這時候就出現了如智能后視鏡、智能中控等技術。
不過目前有一個趨勢,車載語音正在向前裝市場滲透,隨著新能源汽車的快速發展,對于車載語音具有極大的推動作用。聲揚科技也表示,會持續在兩個方面進行發力,一個是前端語音信號的處理,如何去解決源頭的問題;二是解決安全性問題,通過聲紋識別,如何在操作控制過程當中將安全性做好。
能夠看到,在這個市場中,匯集了許多互聯網大咖,對于這些巨頭而言,需要做完整的智能生態,因此車載語音這一塊自然也不會放過。但并不代表BAT這些巨頭做了生態之后,其他企業就沒有機會了。車載語音包含了太多的技術點,而每一個技術都能夠產生巨大的市場空間。
就如同王博所提到的那樣,車載語音場景為駕駛員帶來更大的安全性,而語音交互也并非新的技術,最后必然會成為一種標配,隨著網絡速度和技術的發展,帶來的無非是駕駛者對其依賴的程度逐漸加深,從目前的可有可無變為真正的需求。
本文由電子發燒友原創,轉載請注明以上來源。如需入群交流,請添加微信elecfans999,投稿爆料采訪需求,請發郵箱huangjingjing@elecfans.com。
-
人機交互
+關注
關注
12文章
1217瀏覽量
55535 -
新能源汽車
+關注
關注
141文章
10626瀏覽量
100135 -
語音識別
+關注
關注
38文章
1742瀏覽量
112932 -
人工智能
+關注
關注
1796文章
47683瀏覽量
240313 -
車載語音
+關注
關注
0文章
19瀏覽量
10390
發布評論請先 登錄
相關推薦
MCU在車載系統中的展望
億緯鋰能擬5.79億元全資控股億緯動力
比亞迪30億教育慈善基金啟動
極越內部回應百度投資傳聞:30億為資金缺口預期
2024年全球蘋果從印度的出口額有望超過100億美元
廣和通擬以1.5億美元出售車載前裝無線通信模組業務
車載語音識別系統語音數據采集標注案例
![<b class='flag-5'>車載</b><b class='flag-5'>語音</b>識別系統<b class='flag-5'>語音</b>數據采集標注案例](https://file1.elecfans.com/web2/M00/E6/CD/wKgaomZFbauAGHl1AAAzh3hGv1M833.png)
評論