衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

破局人工智能:AI平臺及智能語音應用解析

電子工程師 ? 來源:未知 ? 作者:胡薇 ? 2018-09-21 08:53 ? 次閱讀

近年來,人工智能技術快速發展,與其他行業的結合也成為業界不斷探索的方向。在人工智能基礎和工具方面,AI平臺已成為降低人工智能門檻的關鍵因素;而在人工智能應用方面,作為最成熟的應用方向之一,智能語音已在智能家居、智能車載等領域有了迅猛發展。以騰訊為代表的巨頭企業,憑借強大的技術積累和在社交聊天、游戲娛樂等垂直領域定制化服務的豐富經驗,在AI平臺和智能語音兩方面都推出了豐富的解決方案。

9 月 15 日,以“破局人工智能:AI平臺及智能語音應用解析”為題的沙龍在上海舉辦,本次活動由 CSDN、騰訊云聯合主辦。

本次分享從人工智能技術的大背景切入,根據技術發展現狀講述AI平臺如何降低人工智能門檻,幫助企業快速構建AI能力;以及深度學習語音識別上的應用,語音技術在智能音箱等場景中的應用和解決方案,并探討智能語音的未來發展趨勢。

騰訊云大數據的高級研究員羅冬日講述了“深度學習在語音識別上的應用”。為什么現在語音識別的準確率得到大幅提升?他給出了三點原因:

一是互聯網存儲了大量的語音數據;

二是GPU/CPU硬件的計算速度有量級的提升;

三是深度學習算法方面的應用。

關于深度學習在聲學模型上的應用,羅冬日主要講述了 DNN、LSTM、CLDNN 三種深度學習網絡

首先是 DNN,輸入一幀數據,然后得到發音單元的分類結果;LSTM 單元會利用到分割時間點的一些數據源輔助判斷當前數據如何分類,當然雙向的 LSTM 效果會更好;CLDNN 是比較成熟和穩定的一種結構,在卷積網絡后面再接 LSTM,后來再接 Dense,有一些高效的企業會提出更加新的網絡,最后的識別效果也會更好。

此外,還有端到端的識別方法,如 CTC、encoder—decoder+attention 以及 Google 的 LAS 模型。

羅冬日提到,雖然現在語音廠商們都稱語音識別的準確率達到了 97%,但這是在安靜的情況下,如果是高噪音環境、口音識別或帶情緒的聲音情形下,還需采用更高質量的陣列麥克風,更多的遠場數據,以及語義理解的輔助。

騰訊高級產品架構師倪捷講述了智能語音擴展數字化服務。他認為,語音在數字化的時代重要性主要是用戶不斷追求更好人機交互體驗的結果。

基于騰訊云的語音識別、語音合成等語音類能力,他介紹了一些實際應用的解決方案。首先是直播安全的解決方案,除了基于圖像層面的鑒別外,還包括語音甚至音頻聲音識別的能力。其次是智慧法庭解決方案。以前的書記員需要做庭審記錄,但會遇到可讀性不強的問題,而語音識別技術則可對庭審記錄準確轉寫,并且便于后續做檔案檢索。

還有客服質檢,由于現在話務員跟客戶的對話質量不可控,這就需要基于客服錄音做質檢,但靠人工質檢的方式耗時長,資源消耗大,而通過語音轉寫等技術,在文字層面上就可通過關鍵詞或者特定業務邏輯對客服做評分。

攜程的客服服務使用的正是騰訊的語音識別技術,其數據智能部總監張童皓在隨后的演講中就旅游場景中的客服質檢做了重點介紹。

他展示了智能質檢的識別過程。通過標注數據拿出來跟場景相關的關鍵詞做比對,并對無用詞進行刪除,通過雙向 LSTM+注意力機制,如果發現它跟現有的價格標簽關聯度很高,就可以得出一個關聯關系。在這個過程當中有可能關聯出降價,然后打出來價格倒掛的標簽,當用戶在攜程上下了訂單后,如果發現酒店的價格比線上便宜很多,這個時候會打電話投訴。

他展望了智能質檢的未來,利用 AI 技術未來可能會有一個永不離崗的資深高能質檢員,使用 5 臺服務器,便可實現每日通話全覆蓋,已分類問題全時覆蓋,并對突發問題快速檢索;另外要打造出智能培訓師,進行高分低分對比,提煉金牌話術;另外還有可能打造出實時輔導員,像在線知識庫那樣,讓坐席人員解決問題更有效率。

騰訊語音識別中心的專家研究員王珺則分享了智能音箱的語音識別技術。她講述了智能音箱語音交互技術的麥克風陣列、聲紋識別、語音識別、語義理解和 TTS 五大鏈條,并對每個步驟做了前沿技術介紹。

關于基于喚醒詞的關鍵技術,目前最新的技術有哪些缺陷?王珺表示,首先是拓展性差,并且專用隱層或專用偏置訓練的方法不能有效捕獲目標說話人特征。自適應到目標說話人的波束形成深度學習方法,目前最先進的技術都要求平均至少 10s 的自適應語音,遠超真實應用場景可接受的自適應語音(例如喚醒詞)長度,可用性差,不易落地。

而騰訊的基于喚醒詞信息的目標說話人語音提取技術的攻關目標,在性能上更優,包括在信號的失真比、主觀語音質量評估、干擾說話人數、魯棒性。而且從系統實時性,模型參數復雜度全方面評估,另外還包括拓展性、擴用性、深度研究價值等方面。

王珺還分享了端到端語言識別的 Attention 建模方法的關鍵技術點,最前沿的序列到序列技術各有它們的優缺點:CTC 的方法是序列到序列前沿技術的經典方法,它的優勢是從左到右的序列到序列的模型,比較簡單,解碼速度快;同時它的缺陷是模型建立的前提是假設當前幀的輸出和之前的輸出標注獨立。

基于 Attention 的優點是什么?王珺解釋,它不需要假設與之前輸出標注獨立,對下一層的預測可以用到聲學模型和語言模型的分析有自帶的語言模型方法。但是也有非常明顯的缺陷,Attention 缺乏從左到右的對齊限制。而CTC與Attention結合的方法可以得到正確的對齊結果。目前研究人員也在盡力的縮小它和經典混合系統的差距。

騰訊高級產品經理郭律探討了機器學習平臺與人工智能的關系。簡單而言,把海量數據通過機器學習的手段來進行處理,所形成的模型就是人工智能。所謂機器學習的本質,解決的就是“精細”問題。這其中有4個約束條件:

第一是業務場景,把業務問題轉化為機器學習的建模問題;

第二是海量數據的機器學習,從原理上面基于統計來實現;

第三是數據質量的問題;

第四是數據閉環,不斷讓模型學習新的數據。

除了業務和數據,郭律認為 AI 能力不可或缺的元素有兩個,一個是人才,另一個是技術能力,包含計算資源等能力。但是相對而言 AI 工程化、建模的人才,AI 的計算資源和計算能力,包括計算資源和框架,其實相差不多。

他認為AI 具有多樣性,但 AI 人才和計算能力具有通用性。他們按 AI 的人才成熟度的不同,歸納為 4 類:

第一是 AI Geek,從底層計算資源搭建到計算框架的引入,一直到算法編寫層面,包括模型調優都能夠獨立進行編碼。

第二是 AI 研究者,他們自己會寫比較高級的算法。

第三種是 AI 從業者,他們知道整個建模的流程,也能夠用一些開源的算法做一些模型訓練。

第四種是 AI 應用者,他們是 AI 非從業人員,希望使用人工智能解決業務痛點,大部分人都屬于這一類。

因此,針對不同的用戶層次,需要提供不一樣機器學習產品和服務。郭律以騰訊的智能鈦機器學習平臺服務為例給出了不同用戶所需要的差異化服務,比如 TI-A 是深度學習加速器,主要為專業級用戶進行模型訓練加速,同時在模型訓練完之后,可以部署成服務對外進行在線預測,解決了從模型落地到具體應用場景的問題。TI-ONE,智能一站式機器學習平臺,它有一個可視化的 UI,客戶可以一目了然地看到整個建模工作流,而且里面有豐富的內置算法組件。TI-S 的特點是全自動,只需要給出數據,就可以反饋出可用的模型,并部署成一個應用。

此外,郭律還介紹了智能鈦機器學習平臺服務具體的功能。該平臺對企業而言意味著降低了企業獲得 AI 能力的門檻,可以幫助企業打造自己的 AI 生態,它能幫助形成“數據+模型”雙閉環,支持模型自更新。

以下為騰訊的三款機器學習平臺產品詳細介紹:

▌TI-ONE

智能鈦一站式機器學習(TI OneStop,TI-ONE)適合 AI 初學者,同時又兼顧專業用戶需求的一站式機器學習平臺。

全流程一站式服務

TI-ONE 提供從數據預處理到模型部署的全流程服務,各個環節無縫銜接、流暢易用,從此用戶不再需要為完成一個機器學習任務在不同的產品間切換,并疲于各種兼容性的問題。

拖拽式任務流

通過圖形化界面的拖拉拽操作,組件與節點間自動連線,數據流向自動生成,繪制任務流暢便捷。

多框架支持

支持多種機器學習框架,方便用戶按照自己的習慣與需求自由選擇框架來搭建任務。

豐富內置算法

TI-ONE 平臺內置豐富的各類算法,從數據預處理流程到各類機器學習和深度學習算法,AI 初學者們可以通過組件的拖拽在任務流中直接使用,無論是機器學習的回歸預測、深度學習的圖片分類、目標檢測,用戶不再需要編寫晦澀難懂的算法代碼即可解決各場景需求。當然,專業級用戶也可選擇自定義算法的上傳。

靈活的調度模式

在完成了任務流的搭建,在任務調度環節,TI-ONE 支持對參數進行數值型與枚舉型的預設定,自動完成多次任務,同時提供定時調度功能滿足周期性的調度,大大減少手動多次調度的重復性工作量,在完成了多次運行后,用戶可前往歷史實例模塊,快速橫向比對所有模型,選擇最優結果。

結果可視化

運行產生的模型結果,鼠標懸浮即可顯示,同時 TI-ONE 內置豐富的模型評估方式和圖標形式,讓用戶直觀地對比多個結果,模型優劣一眼可辨。

一鍵部署服務

TI-ONE 提供了一鍵式部署工具,用戶可以將訓練好的模型部署成 Application,然后裝載成多個實例,一個實例還可以有多個版本。第三方的用戶使用 REST API 便可輕松實現調用。

如此就完成了用 TI-ONE 構建任務流到發布模型服務的全流程。

▌TI-A

智能鈦機器學習加速器(TI Accelerator,TI-A)是專為 AI 算法工程師設計的專業級機器學習平臺。旨在為用戶提供專業級的大規模訓練工具,并提供極致的性能優化。

命令行操作

區別于 TI-ONE 圖像化的界面風格,TI-A 提供命令行的操作界面,為專業級用戶提供熟悉的工作環境。

大規模訓練

幾乎所有算法工程師團隊都面臨過大規模訓練時速度太慢、計算集群成本高、IT 維護步驟復雜等困境。通過 TI-A 用戶可以一鍵構建分布式 Tensorflow 框架,同時內部封裝了 CNN、DNN、LSTM 等模型的分布式訓練版本,大規模訓練從此不再和“繁瑣”相綁定。

高性能

TI-A 基于 Tensorflow 框架進行性能優化,對比原生框架不論是單機性能,還是多級多卡的性能都有顯著的加速比提升,為用戶提供更極致的性能體驗。

▌TI-S

如何使整個機器學習過程更加自動化,減少數據科學家和 AI 算法專家在整個機器學習過程中的繁重勞動力,同時讓更多沒有 AI 背景的人也可以輕松使用 AI 技術,一直是機器學習領域熱議的課題。如何能夠把完整的機器學習工作流做成云端易用的產品,讓用戶僅需要在界面上拖拽樣本數據就可以完成數據處理、特征抽取、模型訓練等全流程?

即將推出的智能鈦自動機器學習(TI SelfLearning,TI-S)將全面支持結構化數據、圖像等領域的 AI 建模,使非 AI 專業人士能夠通過 TIS 獲得人工智能決策的能力。

TI-S 整體流程圖

TI-S 提供從數據預處理、特征工程、模型調參、模型評估、模型預測到結果分析的一站式服務,全流程覆蓋,實現從訓練至預測的完整閉環,讓用戶無需算法經驗也能基于場景數據生成模型,真正降低 AI 技術落地各行業的門檻。

同時,智能鈦自主研發的自動數據清洗、自動擇參、自動調參、自動特征選擇、自動算法選擇等技術,亦能高效輔助解決 AI 專業人員在工作各環節中繁瑣、耗時的問題。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1796

    文章

    47666

    瀏覽量

    240272
  • 智能音箱
    +關注

    關注

    31

    文章

    1784

    瀏覽量

    78788

原文標題:從概念到應用,騰訊視角深入“解剖”AI平臺和語音技術

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    人工智能技術—AI

      人工智能技術的概念從出來到現在已經有很多年的歷史了,其實所謂的人工智能技術本身就是一種模擬人類大腦的思考方式的一種技術,它的英文簡稱是AI技術,在西方國家,人工智能技術被認為是計算
    發表于 10-21 12:03

    智能音箱PK人工智能電視:誰更適合做為智能家庭入口?

    氣大漲,成為繼智能音箱后,又一大熱門智能單品。前段時間,暴風TV推出號稱第一臺干掉電視遙控器的人工智能電視,并希冀將AI智能電視作為智慧家庭
    發表于 04-20 09:28

    人工智能AI經典入門書

    人工智能AI經典入門書,很難找的噢,給喜歡的朋友
    發表于 09-12 17:13

    語音人工智能AI耳機,或將引爆智能耳機市場

    先進的人工智能技術的支持,DACOM成功地將AI科技與無線藍牙耳機相互結合,研發出一款可以全語音交互對話及出行導航線路規劃等一站式人工智能藍牙耳機,成為
    發表于 11-02 11:55

    人工智能:超越炒作

    ,到2025年,人工智能有可能使數字經濟的價值幾乎翻倍至23萬億美元。從戰略角度來看,人工智能最大的潛力在于它與物聯網的互補性。集成的技術組合為數字業務價值創造了一個強大的新平臺。將AI
    發表于 05-29 10:46

    人工智能語音芯片行業的發展趨勢如何?

    人工智能是近三年來最受關注的核心基礎技術,將深刻的改造各個傳統行業。人工智能在圖像識別、語音識別領域的應用自2017年來高速發展,是人工智能最熱點的兩項落地應用。手把手教你設計
    發表于 09-11 11:52

    史上最全AI人工智能入門+進階學習視頻全集(200G)【免費領取】

    `近幾年來,人工智能AI)概念很火熱,幾乎人人都在學習人工智能AI市場人才的搶奪也非常的激烈。根據百科的解釋,人工智能是屬于計算機科學的
    發表于 11-27 12:10

    如何構建人工智能的未來?

    創建Kynisys平臺:我們如何構建人工智能AI)的未來?
    發表于 03-03 07:06

    人工智能芯片是人工智能發展的

    人工智能芯片是人工智能發展的 | 特倫斯謝諾夫斯基責編 | 屠敏本文內容經授權摘自《深度學習 智能時代的核心驅動力量》從AlphaGo的人機對戰,到無人駕駛汽車的上路,再到AI合成主播
    發表于 07-27 07:02

    人工智能ai論文

    人工智能ai論文
    發表于 07-28 08:39

    人工智能AI芯片到底怎么用

    什么是人工智能AI)芯片?AI芯片的主要用處有哪些?在AI任務中,AI芯片到底有多大優勢?
    發表于 09-22 08:00

    AI人工智能計算棒RK1808 Al Compute Stick介紹

      瑞芯微Rockchip旗下AI平臺重要升級,正式面向全球AI開發者發布三大開發套件∶AlI開發工具包RKNN-ToOkit、AlSDK軟件開發工具包Rock-X SDK、以及AI
    發表于 08-15 17:53

    嵌入式人工智能學習路線

    系統項目簡介:人工智能工業分揀系統基于AI計算機視覺、AI語音識別+機械臂控制為一體的機械臂控制、倉庫貨物分揀、整理功能,基于TensorFlow框架,通過深度學習神經網絡算法識別倉庫
    發表于 09-16 17:07

    《移動終端人工智能技術與應用開發》人工智能的發展與AI技術的進步

    人工智能的發展是隨著人類生活需要,產業需求不斷提升的,其中人工智能的發展很大程度上受到了計算機算力的影響,隨著數據處理量的增大,人工智能算法對算力的要求逐年增加,而且沒過兩年算力上升一倍,因此往往
    發表于 02-17 11:00

    AI 人工智能的未來在哪?

    人工智能AI智能大模型已經孵化;繁衍過程將突飛猛進,ChatGPT已經上線。 世界首富馬斯克認為AI對人類是一種威脅;谷歌前CEO施密特認為AI
    發表于 06-27 10:48
    赌博百家乐规则| 百家乐官网单跳| 网上百家乐洗码技巧| 最新娱乐城送彩金| 百家乐怎么玩啊| 百家乐官网最低投注| 百家乐官网猜大小规则| 百家乐群号| 澳门百家乐官网鸿福厅| 大发888博彩网站xa11| 一筒百家乐官网的玩法技巧和规则| 武鸣县| 大发888游戏平台 17| 百家乐看图赢钱| 澳门百家乐实战| 金宝博百家乐游戏| 百家乐官网三号的赢法| ,| 竞咪百家乐的玩法技巧和规则| 最大的百家乐官网网站| 真钱百家乐官网赌博| 皇家百家乐的玩法技巧和规则| 678百家乐官网博彩娱乐网| 香港六合彩开奖| 大发888娱乐场下载iypu| 鼎龙百家乐的玩法技巧和规则| 澳门百家乐官网经| 网络百家乐官网内幕| 文山县| 百家乐必胜| 尊龙国际开户| 威尼斯人娱乐场 赌场网址| 百家乐官方网址| 信誉百家乐官网平台| 内江市| 真人百家乐官网打法| 华宁县| 彝良县| 澳门百家乐官网如何算牌| 鲜城| 加查县|