當地時間12月3日,亞馬遜在“AWS re:invent”大會上正式發布了自主研發的第二代基于Arm架構的服務器芯片Graviton2,同時公布了去年發布的云端AI推理芯片Inferentia的最新進展。
亞馬遜AWS在此次大會上推出了Inf1實例,該實例由Inferentia芯片提供支持,是一個在云端為AI推理提供支持的實例,AWS CEO Andy Jassy稱之為云中可用的成本最低的推理產品。
Andy Jassy 指出:使用云服務為AI解決方案提供動力的運營成本絕大多數來自推理,而推理芯片可能會很昂貴,并且要求低延遲和高吞吐量。許多企業都在模型訓練的定制芯片上投入了大量精力,盡管常規 CPU 上已經能夠較好地執行推理運算,但定制芯片的效率明顯更高。“與Nvidia G4實例相比,Inf1具有更低的延遲,吞吐量將提高3倍,并且每個實例的成本降低40%。”
Inferentia芯片還將由Annapurna Labs提供支持,該芯片企業是2015年被以色列AWS收購的。Inferentia芯片擁有4的個NeuronCore,可以提供128TOPS的算力,而每個Inf1實例可以提供2000 TOPS的算力。
與 EC4 上的常規 G4 實例相比,Inferentia 能夠讓 AWS 帶來更低的延時、三倍的吞吐量、且降低 40% 單次的成本。
Inf1實例目前已經上市,并將與PyTorch,MXNet和TensoRFlow集成。不過,目前其僅可在EC2計算服務中使用,但明年,Inf1將可以用于EKS實例和Amazon的SageMaker,來進行機器學習的推理運算。
-
ARM
+關注
關注
134文章
9169瀏覽量
369222 -
AI
+關注
關注
87文章
31534瀏覽量
270342 -
亞馬遜
+關注
關注
8文章
2680瀏覽量
83626
發布評論請先 登錄
相關推薦
NeuroBlade攜手亞馬遜EC2 F2實例,加速數據分析
亞馬遜云科技發布Amazon Trainium2實例
亞馬遜轉向Trainium芯片,全力投入AI模型訓練
亞馬遜云科技宣布Amazon Trainium2實例正式可用
![<b class='flag-5'>亞馬遜</b>云科技宣布Amazon Trainium2<b class='flag-5'>實例</b>正式可用](https://file1.elecfans.com//web3/M00/01/41/wKgZO2dRoUKAalitAABcr--ZvVY405.jpg)
亞馬遜追加40億美元投資,深化與Anthropic戰略合作
亞馬遜將推新芯片,挑戰英偉達
![<b class='flag-5'>亞馬遜</b>將推新<b class='flag-5'>芯片</b>,挑戰英偉達](https://file1.elecfans.com/web2/M00/E5/D3/wKgaomZBeIyADEqiAACsZ19UYWk044.png)
亞馬遜將推出最新人工智能芯片
亞馬遜云科技推出Amazon Lambda SnapStart功能
亞馬遜云科技宣布基于自研Amazon Graviton4的Amazon EC2 R8g實例正式可用
亞馬遜網絡服務即將推出第四代Graviton處理器
亞馬遜云科技升級“3+1”合作伙伴戰略 與合作伙伴共赴新征程
![<b class='flag-5'>亞馬遜</b>云科技升級“3+<b class='flag-5'>1</b>”合作伙伴戰略 與合作伙伴共赴新征程](https://file1.elecfans.com//web2/M00/EA/A0/wKgZomZZdtGAc8-LAACgoDkq59U065.jpg)
評論