衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

省成本還是省時(shí)間,AI計(jì)算上的GPU與ASIC之選

E4Life ? 來(lái)源:電子發(fā)燒友 ? 作者:周凱揚(yáng) ? 2023-07-17 00:01 ? 次閱讀
電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))隨著AI計(jì)算逐漸蠶食通用計(jì)算的份額,數(shù)據(jù)中心的硬件市場(chǎng)已經(jīng)開(kāi)始出現(xiàn)了微妙的變化。最搶手的目前已經(jīng)成了GPU,反觀CPUASICFPGA等硬件,開(kāi)始成為陪襯。但高昂的售價(jià)以及強(qiáng)綁定的供應(yīng)關(guān)系,還是讓不少企業(yè)開(kāi)始探索別的出路。
仍在被瘋搶的GPU
在今年第一季度AI熱潮高漲下,全球已經(jīng)開(kāi)啟了一波GPU搶購(gòu)。無(wú)論是借助GPU開(kāi)發(fā)各自大模型應(yīng)用的互聯(lián)網(wǎng)廠商,還是想借此發(fā)展其AI服務(wù)器業(yè)務(wù)的云服務(wù)廠商,都在搶購(gòu)英偉達(dá)目前主推的A100和H100兩大GPU。
就連臺(tái)積電哪怕第一季度業(yè)績(jī)下滑明顯,其CEO魏哲家在法說(shuō)會(huì)上也表示在AI相關(guān)的需求上觀察到了增量上行,將幫助其在今年實(shí)現(xiàn)可觀的庫(kù)存消化。
H100 GPU / 英偉達(dá)
在美國(guó)商務(wù)部半導(dǎo)體出口新規(guī)剛推出不久,A100在非正常渠道的單價(jià)就飆升至20000美元,是原價(jià)的兩倍左右。為此英偉達(dá)僅僅面向中國(guó)市場(chǎng)推出了A800和H800,只不過(guò)將高速互聯(lián)總線NVLink限制在了400GB/s,但好歹仍足以滿足大部分AI計(jì)算的需求。
可好景不長(zhǎng),隨著緊缺和搶購(gòu)的趨勢(shì)很快蔓延到了A800和H800上,據(jù)了解,國(guó)內(nèi)市場(chǎng)的A800單價(jià)一周上漲了30%,從原來(lái)9萬(wàn)元上升至13萬(wàn)元,甚至連帶使得搭載該卡的服務(wù)器現(xiàn)貨同樣漲價(jià),頗有當(dāng)年礦潮期顯卡漲價(jià)整機(jī)一并漲價(jià)的趨勢(shì)。
使其狀況更加惡化的是,英偉達(dá)據(jù)傳大量削減了A800的供應(yīng),而是轉(zhuǎn)為推廣更高端也更昂貴的H800,單價(jià)在25萬(wàn)元左右。高端的GPU無(wú)疑能夠帶來(lái)更高的性能,但性價(jià)比相對(duì)較低,大規(guī)模部署的成本也會(huì)更加難以承受。所以從全球市場(chǎng)的購(gòu)買(mǎi)表現(xiàn)上來(lái)看,互聯(lián)網(wǎng)公司和云服務(wù)廠商顯然覺(jué)得A100或A800更香一點(diǎn)。
可為了更高的利潤(rùn)轉(zhuǎn)化,英偉達(dá)決心調(diào)整A800和H800的供應(yīng)比例的話,也就說(shuō)得過(guò)去了。A100的市場(chǎng)流通率較高,而A800這種面世不久的特供產(chǎn)品,也更方便在供應(yīng)上加以限制。
省時(shí)和省錢(qián)
既然GPU困人已久,為何不打破這一限制,轉(zhuǎn)用大規(guī)模量產(chǎn)成本更低的ASIC產(chǎn)品呢?事實(shí)上,很多廠商早就有類(lèi)似的心思,只不過(guò)執(zhí)行起來(lái)卻是寸步難行。首先對(duì)于大模型這樣的AI應(yīng)用來(lái)說(shuō),硬件性能只是一個(gè)方面,擁有優(yōu)質(zhì)的軟件生態(tài)也很重要。
英偉達(dá)的CUDA成了任何進(jìn)軍AI產(chǎn)業(yè)的公司在軟件生態(tài)上的一頭攔路虎,遲遲沒(méi)法突破。固然ASIC的方案可以省下不少硬件成本,但在軟件上仍有不小的障礙。初創(chuàng)公司ASIC硬件的軟件生態(tài)不成熟,巨頭自研的產(chǎn)品又難以與第三方開(kāi)發(fā)結(jié)合起來(lái),或者說(shuō)能打造出爆品應(yīng)用的概率更低。
反觀CUDA,發(fā)展這么多年積累的各種library已經(jīng)逐漸趨于成熟,甚至在英偉達(dá)的GPU上優(yōu)化到了最佳狀態(tài),開(kāi)發(fā)者只需要調(diào)用API即可實(shí)現(xiàn)所需的效果。這堵墻就連同為GPU廠商的AMD等競(jìng)爭(zhēng)對(duì)手都未能攻破,因?yàn)锳I時(shí)代下省時(shí)才能搶占先機(jī),省錢(qián)是之后采取考慮的事。
話雖如此,相關(guān)的嘗試依舊沒(méi)有停止,諸如谷歌的TPU、亞馬遜的Trainium以及微軟最近在研究的Chiplet Cloud等等,都是廠商們對(duì)ASIC持續(xù)看好的表現(xiàn)。可以看出,讓互聯(lián)網(wǎng)企業(yè),尤其是芯片設(shè)計(jì)能力欠缺的企業(yè),去走ASIC這條路線是很難的。而托管了諸多第三方芯片設(shè)計(jì)平臺(tái)、大模型和AI計(jì)算負(fù)載的云服務(wù)廠商,有這個(gè)技術(shù)積累,也有實(shí)力組建或已組建達(dá)標(biāo)的芯片設(shè)計(jì)隊(duì)伍,最終做到省時(shí)又省錢(qián)。
寫(xiě)在最后
ASIC固然前景可觀,但目前廠商們?cè)谫?gòu)置GPU上花的錢(qián)多半是多于自研投入的,這也就是GPU作為通用計(jì)算硬件的future proofing性質(zhì)。可能在GPT爆火的今年,這款A(yù)SIC提供了遠(yuǎn)超GPU的性能或成本優(yōu)勢(shì),但未來(lái)保不齊會(huì)出現(xiàn)其他的爆品應(yīng)用。GPU可以很快調(diào)轉(zhuǎn)勢(shì)頭,但ASIC就可能會(huì)被淘汰。所以對(duì)這些公司來(lái)說(shuō),無(wú)論是購(gòu)買(mǎi)A100還是A800,不僅是對(duì)現(xiàn)在的投資,也是對(duì)未來(lái)的投資。
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • asic
    +關(guān)注

    關(guān)注

    34

    文章

    1206

    瀏覽量

    120765
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4777

    瀏覽量

    129360
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31536

    瀏覽量

    270344
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    GPU計(jì)算服務(wù)怎么樣

    在當(dāng)今數(shù)字化快速發(fā)展的時(shí)代,高性能計(jì)算需求日益增長(zhǎng)。為滿足這些需求,GPU計(jì)算服務(wù)應(yīng)運(yùn)而生。那么,GPU計(jì)算服務(wù)怎么樣呢?接下來(lái),
    的頭像 發(fā)表于 02-05 15:01 ?48次閱讀

    ASICGPU的原理和優(yōu)勢(shì)

    ? 本文介紹了ASICGPU兩種能夠用于AI計(jì)算的半導(dǎo)體芯片各自的原理和優(yōu)勢(shì)。 ASICGPU
    的頭像 發(fā)表于 01-06 13:58 ?608次閱讀
    <b class='flag-5'>ASIC</b>和<b class='flag-5'>GPU</b>的原理和優(yōu)勢(shì)

    GPU是如何訓(xùn)練AI大模型的

    AI模型的訓(xùn)練過(guò)程中,大量的計(jì)算工作集中在矩陣乘法、向量加法和激活函數(shù)等運(yùn)算上。這些運(yùn)算正是GPU所擅長(zhǎng)的。接下來(lái),AI部落小編帶您了解
    的頭像 發(fā)表于 12-19 17:54 ?242次閱讀

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    GPU Computing Guide》是由Dassault Systèmes Deutschland GmbH發(fā)布的有關(guān)CST Studio Suite 2024的GPU計(jì)算指南。涵蓋GP
    發(fā)表于 12-16 14:25

    使用瑞薩AnalogPAK SLG47001/03節(jié)省開(kāi)發(fā)時(shí)間

    在當(dāng)今快速發(fā)展的技術(shù)市場(chǎng)中,對(duì)更快、更高效的產(chǎn)品開(kāi)發(fā)的需求比以往任何時(shí)候都高。企業(yè)一直在尋找簡(jiǎn)化流程和縮短上市時(shí)間的方法。有助于節(jié)省時(shí)間、簡(jiǎn)化設(shè)計(jì)和降低成本的產(chǎn)品對(duì)于保持競(jìng)爭(zhēng)力至關(guān)重要。
    的頭像 發(fā)表于 12-12 10:54 ?283次閱讀
    使用瑞薩AnalogPAK SLG47001/03節(jié)省開(kāi)發(fā)<b class='flag-5'>時(shí)間</b>

    《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    CPU、GPU的演進(jìn)歷程,AI專用芯片或?qū)⒁I(lǐng)未來(lái)計(jì)算平臺(tái)的新方向。正如愛(ài)因斯坦所說(shuō):\"想象力比知識(shí)更重要\" —— 在芯片設(shè)計(jì)領(lǐng)域,創(chuàng)新思維帶來(lái)的突破往往令人驚嘆。
    發(fā)表于 11-24 17:12

    華迅光通AI計(jì)算加速800G光模塊部署

    。骨干交換機(jī),相當(dāng)于核心層交換機(jī),直接連接到葉交換機(jī),每個(gè)骨干交換機(jī)連接到所有葉交換機(jī)。 AI計(jì)算和800G光模塊 與傳統(tǒng)的三層拓?fù)浣Y(jié)構(gòu)相比,脊葉結(jié)構(gòu)需要大量的端口。因此,無(wú)論是服務(wù)器還是交換機(jī)
    發(fā)表于 11-13 10:16

    FPGA和ASIC在大模型推理加速中的應(yīng)用

    隨著現(xiàn)在AI的快速發(fā)展,使用FPGA和ASIC進(jìn)行推理加速的研究也越來(lái)越多,從目前的市場(chǎng)來(lái)說(shuō),有些公司已經(jīng)有了專門(mén)做推理的ASIC,像Groq的LPU,專門(mén)針對(duì)大語(yǔ)言模型的推理做了優(yōu)化,因此相比
    的頭像 發(fā)表于 10-29 14:12 ?762次閱讀
    FPGA和<b class='flag-5'>ASIC</b>在大模型推理加速中的應(yīng)用

    GPU加速計(jì)算平臺(tái)是什么

    GPU加速計(jì)算平臺(tái),簡(jiǎn)而言之,是利用圖形處理器(GPU)的強(qiáng)大并行計(jì)算能力來(lái)加速科學(xué)計(jì)算、數(shù)據(jù)分析、機(jī)器學(xué)習(xí)等復(fù)雜
    的頭像 發(fā)表于 10-25 09:23 ?294次閱讀

    如何計(jì)算上拉電阻的值

    ,但在對(duì)性能有更高要求或特定條件下,則需要通過(guò)更為精確的計(jì)算來(lái)確定電阻值。本文將詳細(xì)介紹如何計(jì)算上拉電阻的值。 首先,我們需要理解上拉電阻在I2C總線中的基本作用。在I2C的開(kāi)漏輸出設(shè)計(jì)中,上拉電阻負(fù)責(zé)在無(wú)設(shè)備驅(qū)動(dòng)總線時(shí),將SC
    的頭像 發(fā)表于 09-09 17:20 ?615次閱讀

    人工智能在項(xiàng)目管理中的應(yīng)用:Atlassian Intelligence六大自動(dòng)化任務(wù)方法詳解,讓Jira與Confluence效率翻倍

    的情況下節(jié)省時(shí)間和金錢(qián)的有效方法之一。無(wú)論是設(shè)置提醒還是改進(jìn)寫(xiě)作,AI都可以幫助您高效地完成工作。AtlassianIntelligence將AI的強(qiáng)大功能與At
    的頭像 發(fā)表于 08-12 11:44 ?1606次閱讀
    人工智能在項(xiàng)目管理中的應(yīng)用:Atlassian Intelligence六大自動(dòng)化任務(wù)方法詳解,讓Jira與Confluence效率翻倍

    科技驅(qū)動(dòng)未來(lái),提升AI算力,GPU擴(kuò)展正當(dāng)時(shí)

    GPU可以大幅縮短AI算法的訓(xùn)練和推斷時(shí)間,從而節(jié)省時(shí)間成本
    的頭像 發(fā)表于 04-16 18:22 ?1012次閱讀
    科技驅(qū)動(dòng)未來(lái),提升<b class='flag-5'>AI</b>算力,<b class='flag-5'>GPU</b>擴(kuò)展正當(dāng)時(shí)

    AI服務(wù)器異構(gòu)計(jì)算深度解讀

    AI服務(wù)器按芯片類(lèi)型可分為CPU+GPU、CPU+FPGA、CPU+ASIC等組合形式,CPU+GPU是目前國(guó)內(nèi)的主要選擇(占比91.9%)。
    發(fā)表于 04-12 12:27 ?717次閱讀
    <b class='flag-5'>AI</b>服務(wù)器異構(gòu)<b class='flag-5'>計(jì)算</b>深度解讀

    FPGA在深度學(xué)習(xí)應(yīng)用中或?qū)⑷〈?b class='flag-5'>GPU

    基礎(chǔ)設(shè)施,人們?nèi)匀粵](méi)有定論。如果 Mipsology 成功完成了研究實(shí)驗(yàn),許多正受 GPU 折磨的 AI 開(kāi)發(fā)者將從中受益。 GPU 深度學(xué)習(xí)面臨的挑戰(zhàn) 三維圖形是 GPU 擁有如此
    發(fā)表于 03-21 15:19

    GPU理想成本揭秘,性價(jià)比

    如果新的 GPU 能夠?yàn)轭l繁和不頻繁升級(jí)的玩家提供最佳性能提升,從而滿足最廣泛的 PC 游戲玩家的需求,那么這一代將被認(rèn)為更加成功。
    發(fā)表于 03-15 11:15 ?769次閱讀
    <b class='flag-5'>GPU</b>理想<b class='flag-5'>成本</b>揭秘,性價(jià)比<b class='flag-5'>之</b><b class='flag-5'>選</b>
    皇家棋牌| 金冠百家乐的玩法技巧和规则| 太阳城百家乐官网作弊| 克拉克百家乐的玩法技巧和规则| 百家乐官网玩牌| 蒙特卡罗国际网址| 娱乐网百家乐的玩法技巧和规则 | 中原百家乐的玩法技巧和规则| 深圳百家乐官网的玩法技巧和规则 | 如何玩百家乐官网赚钱| 博狗官网| 免费百家乐追号软件| 永利百家乐开户| 涿鹿县| 大发888客户端下载| 百家乐技术下载| 百家乐官网最低投注| 皇冠国际足球| 全讯网3| 百家乐开户送10彩金| 百家乐官网发脾机| 大发888体育在线投注平台| 百家乐浴盆博彩通排名| 广东百家乐官网网| 锡林浩特市| 大发888在线娱乐城加盟合作| 网上百家乐庄家有赌场优势吗| 百家乐官网电子发牌盒| 百家乐官网能赚大钱吗| 炸金花棋牌游戏| 粤港澳百家乐娱乐| 网上百家乐玩法| 百家乐官网五湖四海娱乐平台 | 百家乐官网路单破解软件| 澳门葡京赌场出台女| 大发888娱乐场下载iypu rd| 百家乐五湖四海赌场娱乐网规则| 百家乐连黑记录| 狮威百家乐官网赌场娱乐网规则 | 大发888娱乐城3403| 海王星百家乐的玩法技巧和规则|