本站原創(chuàng),作者:章鷹,電子發(fā)燒友執(zhí)行副主編。
美國研究公司Strategy Analytics近日發(fā)布了《2018年第三季度全球智能音箱市場報告》。報告顯示,全球智能音箱出貨量第三季度達到2270萬,同比增長197%,創(chuàng)歷史新高。亞馬遜在第三季度依然市場占有率最高,占據(jù)了32%的份額,谷歌以23%的份額緊追其后。百度的加入改變了全球智能音箱的市場格局,市場占有率猛增至8%,進入全球前四名。
“據(jù)IDC統(tǒng)計,2018年第三季度,搭載百度DuerOS的智能音箱在中國市場出貨量第一名,小度系列智能硬件在中國市場增速最快,市場份額增至24%。百度在遠場語音技術上有很大的突破。我們和Duer OS生態(tài)一起發(fā)展,上周Duer OS產品的出貨量突破2億。這與百度遠場語音技術的突破是密切相關的。“百度語音部門負責人在1月16日深圳舉辦的百度大腦硬件及平臺發(fā)布會現(xiàn)場表示。
遠場語音技術三大關鍵點
2017年年初,各家開發(fā)廠商針對遠場語音技術進行軍備競賽,智能音箱的市場大戰(zhàn),從2017年開始到現(xiàn)在,是從近場語音技術到遠場語音技術的過度階段,廠商會介紹自己的遠場語音技術多么厲害,現(xiàn)在很少有人提手機上語音識別的效果。
遠場語音技術的三大關鍵點:第一、信號處理,沒有信號處理,就沒有現(xiàn)在的遠場語音的效果,信號處理用于定位,定位算法才能創(chuàng)造遠場語音智能;第二、軟硬結合,在遠場交互時代,需要與硬度深度結合,將算法、軟件在硬件上打磨好,提升用戶體驗;第三、端到端語音語言一體化,信號處理基于端到端建模,聲學模型是匹配好場景的,還有喚醒技術,采用端到端思路,對端到端詞匯進行建模,再將喚醒技術和信號處理技術結合,下沉到Duer OS系統(tǒng)層,才能達到很好的喚醒效果。
語音技術軟硬一體化解決方案
教會機器聽懂人話的過程,就是通過深度神經網絡訓練聲學模型和語言模型的過程。而一些公司宣傳的機器識別準確率過高,速記員都達不到這一水平,還有很多相關的工作需要去完成,不能單靠深度神經網絡的方法來實現(xiàn)。語音識別準確率涉及多方面原因,例如遠場精確識別就是業(yè)界難題。
“最新一年百度在語音技術上兩大進展:一次喚醒多次交互技術,技術特點是信號尾點和語義尾點聯(lián)合優(yōu)化模型;第二點,針對聲學模型和語義模型做雙重的置信度模型,在喚醒一次后可以和機器進行自由交談,技術的關鍵點是將干擾信息去除。需要端到端的思路,用信號衰減的思路,配合聲紋技術,進行交互。這個技術會在小度系列的硬件產品落地。” 百度語音部門負責人解釋說。
百度在遠場語音交互技術突破,包括一次喚醒多次交互技術以及 SMLTA 模型,SMLTA 模型在百度輸入法正式發(fā)布這個技術,特點是語言和語義進行建模訓練,這個模型可以跑在手機端,取得和在線識別媲美的效果。
百度歷經一年多的打磨和開發(fā),全新推出了百度遠場語音開發(fā)套件,包括遠場語音端到端技術、兩款分別主打高性能和高性價比的計算板卡、3種形態(tài)的麥克風陣列,形成了環(huán)形6+1麥、線形4麥和車載3麥的多形態(tài)麥克風陣列套件方案。
“讓硬件制造商、ODM、OEM做智能音箱、智能電視、語音機器人、可穿戴設備和車載可以在百度大腦上找到和使用語音開發(fā)套件。我們希望提供一條產業(yè)鏈,讓上下游合作起來。” 百度語音部門負責人強調說。“這套開發(fā)套件的優(yōu)勢,靈活、快速讓開發(fā)者對接自己在場景中的資源,對接語義理解能力,對接知識庫。“
百度遠場語音開發(fā)套件基于端到端方案,嚴格按照最佳技術實踐指導生產,可解決語音交互產品研發(fā)過程中無可用設備選型、選型調試成本大、調試效果不佳等問題。該方案支持回聲消除、聲源定位、波束形成、噪聲抑制等處理算法,一、三、五米識別和喚醒效果優(yōu)于同類產品,目前已落地150多款產品。
車載三麥克陣列,車上語音識別要求比較高,不僅是主音區(qū),而且是雙音區(qū)的語音識別,除了主駕駛位,還包括副駕駛位,百度車載三麥克鈍角陣列放置在車頂,可以輕松實現(xiàn)主音區(qū)和雙音區(qū)的語音識別,解決方案已經在百度車聯(lián)網聯(lián)盟內的被多個車廠采用。百度還在做DSP相關技術,配合麥克風陣列,價格更有競爭力。
主流芯片價格透明,兩年原廠開發(fā)經驗,主板方案非常有競爭力。合作模式:語音端到端產品,開發(fā)時間長,需要重新開模和設計,直接貼牌,提供產品原型,在這個基礎上做二次開發(fā);線下做開發(fā),把方案放入適用的產品內部。
百度大腦AI硬件生態(tài)聯(lián)盟
發(fā)布會現(xiàn)場,百度聯(lián)合首批合作伙伴成立百度大腦硬件生態(tài)聯(lián)盟,首批聯(lián)盟伙伴包含芯片廠商賽靈思,攝像頭模組廠商奧比中光、睿識、慧谷航天,開發(fā)套件廠商天啟,終端設備廠商華正聯(lián)等等。作為聯(lián)盟發(fā)起人和組織者,百度大腦希望與聯(lián)盟伙伴一起,共同制訂端計算與AI硬件標準,共同促進和繁榮AI落地應用。
百度大腦也將對聯(lián)盟合作伙伴提供深度技術支持、渠道支持、品牌授權、產品折扣和運營資源等權益,全面開啟AI技術終端化的大門,賦能合作伙伴的同時為產業(yè)帶來加速的交流和融合。正如百度AI技術生態(tài)部總經理喻友平所言,人工智能若要長期推動各個產業(yè)的升級與優(yōu)化,需要合作伙伴的共同努力,打造適合AI發(fā)展的健康環(huán)境。
-
百度
+關注
關注
9文章
2280瀏覽量
90754 -
語音識別
+關注
關注
38文章
1742瀏覽量
112926 -
智能音箱
+關注
關注
31文章
1784瀏覽量
78789
發(fā)布評論請先 登錄
相關推薦
2025中國(華東)智能家居技術創(chuàng)新研討會
![2025<b class='flag-5'>中國</b>(華東)<b class='flag-5'>智能</b>家居<b class='flag-5'>技術</b>創(chuàng)新研討會](https://file1.elecfans.com//web3/M00/06/E6/wKgZO2eQh42AKxjIAAGMO-UlTZ808.jpeg)
OptiFDTD案例:二進制光柵建模及近場和遠場模擬
「2024中國AIEV產業(yè)智駕創(chuàng)新企業(yè)」揭榜,文遠知行光榮上榜
![「2024<b class='flag-5'>中國</b>AIEV產業(yè)智駕創(chuàng)新企業(yè)」揭榜,文<b class='flag-5'>遠</b>知行光榮上榜](https://file1.elecfans.com/web3/M00/03/9A/wKgZPGdqfJyANdmnAAEQNzOdIkM042.png)
AI芯片驅動臺積電Q3財報亮眼!3nm和5nm營收飆漲,毛利率高達57.8%
![AI芯片驅動臺積電<b class='flag-5'>Q3</b>財報亮眼!<b class='flag-5'>3</b>nm和5nm營收飆漲,毛利率高達57.8%](https://file1.elecfans.com/web2/M00/09/B9/wKgZomcRzdiAZ5voAAKu2dtcCx4310.png)
魯大師2024年手機Q3季報:頂級旗艦激烈角逐,驍龍、天璣新芯片發(fā)布前最后一戰(zhàn)
![魯大師2024<b class='flag-5'>年</b>手機<b class='flag-5'>Q3</b>季報:頂級旗艦激烈角逐,驍龍、天璣新芯片發(fā)布前最后一戰(zhàn)](https://file1.elecfans.com//web2/M00/0A/09/wKgaomcF-1WAJxM-AAH7zqz7iUY37.jpeg)
使用bq40z50-R2過程中,Q4可以防止在適配器反接的時候,損壞Q3?
摩爾線程亮相2024中國元宇宙大會
奧迪全新Q3即將亮相,尺寸升級,設計新穎,或采用插電式混合動力
這個電路Q1和Q3會同時導通嗎?
語音芯片究竟如何寫入語音?思澤遠科技為您詳細解答
![<b class='flag-5'>語音</b>芯片究竟如何寫入<b class='flag-5'>語音</b>?思澤<b class='flag-5'>遠</b>科技為您詳細解答](https://file1.elecfans.com/web2/M00/C5/0F/wKgaomXxRY-AbOKpAAA5FE1D7HY741.png)
評論