衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

三星無聲語音助手專利解密:可以完成精準語音識別任務

ss ? 來源:愛集微APP ? 作者:愛集微APP ? 2021-02-12 15:03 ? 次閱讀

【嘉德點評】三星發(fā)明的可以完成精準語音識別任務的語音識別助手,在交互時無需發(fā)出語音,僅通過用戶少量選擇操作就可以完成復雜的交互任務,因此,可以簡便且準確地采用語音識別方式來實現(xiàn)交互任務。

集微網(wǎng)消息,在2019年,三星就曾預告過新的“人造人”NEON助手,并表示NEON可以像真正的人類一樣進行對話,并有一定的感知能力。NEON的網(wǎng)站上宣傳其外觀和行為都像真實的人類,能夠表現(xiàn)出情感和智慧,而據(jù)相關消息,三星最終將隨三星Galaxy S21 Ultra獨家發(fā)售這款數(shù)字助手。

數(shù)字助手首先也是一款手機助手軟件,目前,智能手機能夠提供各種類型的應用服務,其中就包括手機助手軟件,用戶可以通過語音、文字等方式與智能手機之間進行交互,智能手機通過該語音識別助手軟件識別語音后,提供對應的應用服務。

智能手機識別語音的功能可以有三種方式:交互任務型、知識問答型及閑聊型。其中,交互任務型語音識別方式使得用戶可以通過直接的語音輸入,由智能手機識別該語音,完成與智能手機的應用服務之間的交互意圖,而無需進行多次語音識別界面的操作。

但是,智能手機提供的交互任務型語音識別方式對用戶來說,使用率并不高,這是因為用戶在通過語音操控智能手機時,存在以下缺點:1)公眾場合不適合使用語音,有隱私問題;2) 智能手機處于嘈雜的遠程環(huán)境下,語音識別的效果不佳;3)因為用戶發(fā)音不準確,形同意思的表述方式多樣等因素,語音識別和語音理解的準確率還需要提高;4)有些用戶不習慣使用智能手機提供的語音識別界面。

那么,智能手機該如何在這些條件下簡便且準確地采用語音識別方式實現(xiàn)交互任務呢?為此,三星在2019年9月27日申請了一項名為“一種采用語音識別方式實現(xiàn)交互任務的方法及系統(tǒng)”的發(fā)明專利(申請?zhí)枺?01910921533.6),申請人為三星電子(中國)研發(fā)中心和三星電子株式會社。

根據(jù)該專利目前公開的資料,讓我們一起來看看這項應用于智能設備的語音識別方法及系統(tǒng)吧。

如上圖,為該專利中發(fā)明的采用語音識別方式實現(xiàn)交互任務的方法流程示意圖,首先,系統(tǒng)會基于當前環(huán)境進行語音識別來得到文本以及語義信息,基于得到的文本以及語義信息,來確定對應的上下文信息,且劃分不同的場景,基于不同的場景來在系統(tǒng)中匹配不同的語音技能推薦表。

這種利用語音技能推薦表的方式,可以更加準確的應對不同的場景,通過事先準備好豐富的語料庫,就可以非常人性化的與用戶進行對話以及完成相應的操作。而當要實現(xiàn)交互任務時,則會根據(jù)語音技能推薦表執(zhí)行智能手機的交互任務。同時,由于是智能助手主動分析用戶所處場景,并主動提供相關的操作服務,因此無需用戶主動發(fā)起語音喚醒,而是由語音助手主動為用戶提供相關服務,只需用戶進行選擇即可。

如上圖,為這種采用語音識別方式實現(xiàn)交互任務的方法子流程圖,當用戶喚醒語音助手插件模塊時,語音助手插件模塊被觸發(fā),該模塊通知語言輸入信息采集模塊啟動信息采集,信息采集模塊通過上下文感知模塊獲取到當前的環(huán)境信息,再向語音助手插件模塊發(fā)送請求,來獲取從用戶語音識別得到的文本,以及做自然語言理解后的語義信息。

之后,語言輸入信息采集模塊將采集到的文本、語義信息及當前的環(huán)境信息傳輸給語言技能生成模塊,由此來生成語言技能庫,并通知語言技能推薦模塊。

語言技能推薦模塊在特定情況下可以啟動,將大量不同的上下文劃分到若干類場景中,對每個場景生成相應的語言技能推薦表。

如上圖,為在手機上使用語言技能推薦表的展示圖,該款語音助手插件模塊為Bixby,當每次都調用Bixby時,都會顯示出語言技能推薦表,并且場景不同,該語言技能推薦表中的推薦技能偶讀不同。

例如,經(jīng)過學習后,如果用戶打開手機并且喚醒了Bixby,則就可以觸發(fā)語言技能推薦表的展示,當用戶選擇某條推薦的語言技能時,將該語言技能推薦表中的文本用作用戶語言輸入識別的結果,以完成后續(xù)用戶的指令。

以上就是三星發(fā)明的可以完成精準語音識別任務的靜默式語音識別助手,其在實現(xiàn)交互任務時,基于當前環(huán)境下對語音識別得到文本以及語音信息,在交互時無需發(fā)出語音,僅通過用戶少量選擇操作就可以完成復雜的交互任務,因此可以簡便且準確地采用語音識別方式來實現(xiàn)交互任務。

責任編輯:xj

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 三星電子
    +關注

    關注

    34

    文章

    15875

    瀏覽量

    181334
  • 語音助手
    +關注

    關注

    7

    文章

    237

    瀏覽量

    26842
收藏 人收藏

    評論

    相關推薦

    空調語音控制方案NRK3501語音識別芯片-讓智能生活觸手可及!

    NRK3501語音識別芯片支持離線語音控制空調,精準識別,遠場降噪,最多支持200條離線指令,5米內識別
    的頭像 發(fā)表于 01-07 11:40 ?132次閱讀
    空調<b class='flag-5'>語音</b>控制方案NRK3501<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片-讓智能生活觸手可及!

    語音識別與自然語言處理的關系

    在人工智能的快速發(fā)展中,語音識別和自然語言處理(NLP)成為了兩個重要的技術支柱。語音識別技術使得機器能夠理解人類的語音,而自然語言處理則讓
    的頭像 發(fā)表于 11-26 09:21 ?589次閱讀

    語音識別技術的應用與發(fā)展

    語音識別技術的發(fā)展可以追溯到20世紀50年代,但直到近年來,隨著計算能力的提升和機器學習技術的進步,這項技術才真正成熟并廣泛應用于各個領域。語音識別
    的頭像 發(fā)表于 11-26 09:20 ?745次閱讀

    ASR與傳統(tǒng)語音識別的區(qū)別

    ASR(Automatic Speech Recognition,自動語音識別)與傳統(tǒng)語音識別在多個方面存在顯著的區(qū)別。以下是對這兩者的對比: 一、技術基礎 ASR : 基于深度學習算
    的頭像 發(fā)表于 11-18 15:22 ?643次閱讀

    ASR語音識別技術應用

    ASR(Automatic Speech Recognition)語音識別技術,是計算機科學與人工智能領域的重要突破,能將人類語音轉換為文本,廣泛應用于智能家居、醫(yī)療、交通等多個領域。以下是對ASR
    的頭像 發(fā)表于 11-18 15:12 ?1031次閱讀

    基于Arm Neoverse N2實現(xiàn)自動語音識別技術

    自動語音識別 (Automatic Speech Recognition) 技術已經(jīng)深入到現(xiàn)代生活的方方面面,廣泛應用于從語音助手、轉錄服務,到呼叫中心分析和
    的頭像 發(fā)表于 11-15 11:35 ?445次閱讀
    基于Arm Neoverse N2實現(xiàn)自動<b class='flag-5'>語音</b><b class='flag-5'>識別</b>技術

    WTK6900FC語音識別模塊

    語音識別
    WT-深圳唯創(chuàng)知音電子有限公司
    發(fā)布于 :2024年09月25日 17:35:07

    唯創(chuàng)知音WT2605C用在離在線語音識別方案# #語音芯片 #語音識別 #唯創(chuàng)知音

    語音識別
    WT-深圳唯創(chuàng)知音電子有限公司
    發(fā)布于 :2024年09月12日 17:24:28

    三星Bixby語音助手即將進軍家電產(chǎn)品,實現(xiàn)自然語言交互

     三星宣布,Bixby語音助手即將全面進駐BESPOKE AI系列家電,用戶可通過自然語言對家電進行語音控制。Bixby作為三星智能手機、手
    的頭像 發(fā)表于 08-26 17:20 ?847次閱讀

    什么是離線語音識別芯片?與在線語音識別的區(qū)別

    離線語音識別芯片適用于智能家電等,特點為小詞匯量、低成本、安全性高、響應快,無需聯(lián)網(wǎng)。在線語音識別功能更廣泛、識別準確率高,但依賴穩(wěn)定網(wǎng)絡。
    的頭像 發(fā)表于 07-22 11:33 ?479次閱讀

    ESP32-WROOM跑了官方的語音識別中的asr例程,但是切換到語音識別就會出錯的原因?

    我是用的是ESP32-WROOM芯片,用的Vscode+IDF+ADF,我跑了一下官方的語音識別中的asr例程,但是我發(fā)現(xiàn),語音喚醒可以,但是一旦切換到
    發(fā)表于 07-19 08:27

    三星即將發(fā)布Bixby升級版:基于大語言模型的創(chuàng)新飛躍

    在科技日新月異的今天,三星電子再次站在了智能語音助手技術的前沿。公司總裁兼移動體驗業(yè)務負責人TM Roh近期宣布了一項激動人心的消息:三星今年將推出基于先進大語言模型(LLM)的Bix
    的頭像 發(fā)表于 07-12 17:46 ?1439次閱讀

    Transformer模型在語音識別語音生成中的應用優(yōu)勢

    隨著人工智能技術的飛速發(fā)展,語音識別語音生成作為人機交互的重要組成部分,正逐漸滲透到我們生活的各個方面。而Transformer模型,自其誕生以來,憑借其獨特的自注意力機制和并行計算能力,在
    的頭像 發(fā)表于 07-03 18:24 ?1310次閱讀

    車載語音識別系統(tǒng)語音數(shù)據(jù)采集標注案例

    車載語音識別系統(tǒng)是指利用機器學習算法實現(xiàn)的一種自然語言處理技術,載語音識別系統(tǒng)通過辨別聲音的語調、語速和音量,將所聽到的語音轉化成可讀取的語
    的頭像 發(fā)表于 06-19 15:52 ?409次閱讀
    車載<b class='flag-5'>語音</b><b class='flag-5'>識別</b>系統(tǒng)<b class='flag-5'>語音</b>數(shù)據(jù)采集標注案例

    車載語音識別系統(tǒng)語音數(shù)據(jù)采集標注案例

    車載語音識別系統(tǒng)是指利用機器學習算法實現(xiàn)的一種自然語言處理技術,載語音識別系統(tǒng)通過辨別聲音的語調、語速和音量,將所聽到的語音轉化成可讀取的語
    的頭像 發(fā)表于 06-19 15:49 ?574次閱讀
    免费百家乐追号工具| 百家乐官网规则博彩正网| 百家乐官网计划软件| 大发888官方6222.| 赌片百家乐官网的玩法技巧和规则| 二八杠技巧| 百家乐官网双龙出海| 大发888国际娱乐城lm0| 网络百家乐官网路子玩| 大发888博爱彩| 南京百家乐官网的玩法技巧和规则 | 百家乐官网最长的闲| 百家乐网上赌有作假吗| 百家乐官网平注法是什么| 百家乐轮盘一体机厂家| 订做百家乐官网桌子| 足球百家乐系统| 百家乐官网网盛世三国| 大发888娱乐城888bg| 百家乐官网合作| 喀什市| 百家乐线上| 下载百家乐官网棋牌大厅| 全讯网跑狗图| 牌九百家乐官网的玩法技巧和规则 | 线上kk娱乐城| 百家乐三跳| 新澳门百家乐官网软件下载| 大发888电话多少| A8百家乐游戏| 百家乐官网游戏软件开发| 黄金城百家乐下载| 联合百家乐官网的玩法技巧和规则 | 百家乐官网号公| 百家乐怎样赢| 电子百家乐作假| 五张百家乐官网的玩法技巧和规则| 丰禾娱乐| 新加坡百家乐的玩法技巧和规则 | 大发888娱乐场下载安装| 百家乐代理龙虎|