由于硬件和軟件的進(jìn)化突破,語(yǔ)音用戶界面或各種尺寸和價(jià)格點(diǎn)的支持 VUI 的產(chǎn)品現(xiàn)在都可以推向市場(chǎng)。與直到今天定義語(yǔ)音控制體驗(yàn)的“對(duì)著麥克風(fēng)說(shuō)話并等待”模型不同,新系統(tǒng)現(xiàn)在可以以最終用戶謹(jǐn)慎甚至不可見的方式嵌入到產(chǎn)品中,并具有即時(shí)響應(yīng)時(shí)間,而不是“ t 體驗(yàn)云延遲。
在評(píng)估智能揚(yáng)聲器和云的語(yǔ)音控制替代方案時(shí),產(chǎn)品開發(fā)人員面臨著新的機(jī)遇和挑戰(zhàn)。開發(fā)人員必須考慮尺寸和位置,因?yàn)楦叨任⑿突脑O(shè)備被嵌入到家具和電器中。將語(yǔ)音應(yīng)用程序與邊緣機(jī)器學(xué)習(xí)相結(jié)合對(duì)于讓產(chǎn)品隨著時(shí)間的推移變得更加智能是必要的。同時(shí),設(shè)備也越來(lái)越依賴電池供電,需要開發(fā)人員進(jìn)行工程設(shè)計(jì)以實(shí)現(xiàn)最佳能源管理。最后,開發(fā)人員必須考慮用戶對(duì)功能的期望。對(duì)于消費(fèi)者來(lái)說(shuō),精心設(shè)計(jì)的語(yǔ)音控制感覺無(wú)處不在,能夠聽到角落和穿墻的聲音。所有這些以及更多內(nèi)容匯集了在構(gòu)建支持 VUI 的產(chǎn)品時(shí)必須考慮的幾個(gè)設(shè)計(jì)元素。
語(yǔ)音控制 2.0 更自由的方面之一是可以自由地說(shuō)出語(yǔ)音命令,而無(wú)需附近的智能揚(yáng)聲器。集成在智能家居設(shè)備中的語(yǔ)音可以使整個(gè)家庭成為一個(gè)可聽區(qū)域,在識(shí)別喚醒詞或其他可定義的聲音時(shí)隨時(shí)可用。專門的硬件和軟件用于產(chǎn)生準(zhǔn)確的遠(yuǎn)場(chǎng)音頻捕獲。
設(shè)計(jì)技巧
為了在遠(yuǎn)場(chǎng)環(huán)境中有效地捕捉聲音,一些設(shè)計(jì)技術(shù)開始發(fā)揮作用,包括:端口方向:聲學(xué)端口是可以在沒有物理障礙的情況下接受音頻信號(hào)的地方。端口的位置(頂部或底部)由單個(gè)設(shè)備的外形尺寸決定。為了簡(jiǎn)化設(shè)計(jì),聲學(xué)端口通常位于麥克風(fēng)附近,如下所示。但是,端口孔應(yīng)與揚(yáng)聲器和其他聲學(xué)噪聲源(例如電機(jī)和放大器)足夠遠(yuǎn),以最大限度地減少麥克風(fēng)輸入處的不需要的信號(hào)。
圖 1. 頂部和底部加載聲學(xué)端口配置的橫截面(來(lái)源:Knowles)
麥克風(fēng)陣列和波束成形:使用多個(gè)麥克風(fēng)稱為“陣列”。在任何給定時(shí)刻,麥克風(fēng)陣列都會(huì)同時(shí)聽到來(lái)自各個(gè)方向的聲音。除了口頭命令外,他們還會(huì)聽到家中的其他聲音和動(dòng)作。通過(guò)一種稱為波束成形的技術(shù),可以對(duì)麥克風(fēng)陣列進(jìn)行編程,以選擇性地捕獲來(lái)自一個(gè)方向的聲音,同時(shí)拒絕來(lái)自其他方向的聲音。波束成形算法的最終結(jié)果是選擇性地調(diào)諧出來(lái)自所需方向的信號(hào)以外的信號(hào)。波束成形是數(shù)字信號(hào)處理鏈中的第一步。
數(shù)字信號(hào)處理 (DSP) 算法:DSP 是任何語(yǔ)音控制系統(tǒng)的基石。這就是想要的音頻信息的意義——捕捉它、聚焦它、凈化它、放大它——這樣音素就可以發(fā)出文字、命令和噪音,而不會(huì)破壞這個(gè)過(guò)程。DSP 幾乎用于語(yǔ)音交互的所有階段,從音頻捕獲和語(yǔ)音增強(qiáng)到語(yǔ)音處理。
圖 2. 遠(yuǎn)場(chǎng)語(yǔ)音拾取(來(lái)源:Jerry Lu)
以便利為設(shè)計(jì)理念
除了針對(duì)功能進(jìn)行設(shè)計(jì)之外,支持 VUI 的設(shè)備還需要針對(duì)便利性和可用性進(jìn)行設(shè)計(jì)。喚醒詞的兩個(gè)主要設(shè)計(jì)考慮圍繞能源管理和處理能力。由于 VUI 必須始終處于“偵聽”模式以等待喚醒詞,因此電池供電的 VUI 和 VCD 必須設(shè)計(jì)用于極低的能量消耗以及立即喚醒。此外,設(shè)備在過(guò)濾掉不需要的聲音的同時(shí)區(qū)分想要的語(yǔ)音命令的能力需要不可忽視的處理能力,這需要準(zhǔn)確性和即時(shí)性。包含強(qiáng)大音頻邊緣處理器的產(chǎn)品現(xiàn)在可以提供計(jì)算能力和低功耗、低延遲操作,從而實(shí)現(xiàn)即時(shí)用戶體驗(yàn)。
即使在今天的早期階段,語(yǔ)音控制的爆炸式增長(zhǎng)也充分證明了智能家居中語(yǔ)音控制的市場(chǎng)機(jī)會(huì)。智能家居的支柱任務(wù),包括安全、能源管理、娛樂和高級(jí)安全,都通過(guò)語(yǔ)音控制變得更簡(jiǎn)單、更容易訪問(wèn)。語(yǔ)音最終可以作為整個(gè)智能家居的統(tǒng)一控制器,從房子的任何房間發(fā)出命令……如果它們的設(shè)計(jì)考慮到用戶并利用語(yǔ)音控制技術(shù)的重大進(jìn)步。
審核編輯 黃昊宇
-
設(shè)計(jì)方法
+關(guān)注
關(guān)注
0文章
12瀏覽量
9121 -
語(yǔ)音控制
+關(guān)注
關(guān)注
5文章
484瀏覽量
28310
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論