哪个网上棋牌信誉好,澳门新东方娱乐城,卡塔尔世界杯决赛圈球队(中国)·官方网站

亞馬遜宣布將人工智能處理遷移到自家定制的 AWS Inferentia 芯片。這意味著亞馬遜最大的推理（inferencing）服務(wù)（例如語音助手 Alexa）將交由更快、更專業(yè)的芯片進行處理，而非基于 NVIDIA 的多用途 GPU。

亞馬遜已經(jīng)將大約 80% 的 Alexa 語音助手處理遷移到 Elastic Compute Cloud （EC2） Inf1 實例上處理。和使用傳統(tǒng) GPU 的 G4 實例相比，Inf1 實例將吞吐量提高了 30%，成本下降了 45%。亞馬遜認為，它們是推斷自然語言和語音處理工作負載的最佳實例。

Alexa 的工作方式是這樣的：實際的智能音箱（或者揚聲器）可以不做任何操作，所有任務(wù)都交由 AWS 處理器完成。或者更準確的說，一旦 Echo 設(shè)備上的芯片檢測到喚醒詞，系統(tǒng)就會啟動。。它開始實時將音頻流傳輸?shù)皆啤Ｔ跀?shù)據(jù)中心的某個地方，音頻被轉(zhuǎn)換為文本（這是推理的一個示例）。然后從文本中提取含義（另一個推理實例）完成所需要的所有操作，例如獲取當天的天氣信息等等。

Alexa 完成您的請求后，她需要將答案傳達給您。然后，腳本被轉(zhuǎn)換為音頻文件（另一個推理示例），并發(fā)送到您的Echo設(shè)備。回音播放文件，以便于你出行的時候是否決定帶上雨傘。顯然，推理是工作的重要組成部分。毫不奇怪，亞馬遜投入了數(shù)百萬美元來制造完美的推理芯片。

Inferentia 芯片由四個 NeuronCore 組成。每個實現(xiàn)一個“高性能脈動陣列矩陣乘法引擎”。每個NeuronCore或多或少地由以線性，獨立方式處理數(shù)據(jù)的大量小型數(shù)據(jù)處理單元（DPU）組成。每個Inferentia芯片還具有巨大的緩存，從而提高了延遲。

責(zé)任編輯：haq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴