電子發(fā)燒友網(wǎng)報(bào)道(文/李寧遠(yuǎn))如今,由于物聯(lián)網(wǎng)的興起造成了數(shù)據(jù)沖擊,對(duì)重要物聯(lián)網(wǎng)傳感器數(shù)據(jù)的處理越來(lái)越接近數(shù)據(jù)最初所在的位置,便有了對(duì)基于邊緣計(jì)算的機(jī)器學(xué)習(xí)技術(shù)的需求。這兩年,人工智能發(fā)展的主題已經(jīng)非常明確,就是落地應(yīng)用。在眾多的AI技術(shù)當(dāng)中,無(wú)論是上層的算法應(yīng)用,還是產(chǎn)品,最終都依賴于底層算力的保障,也就是AI芯片。
邊緣AI市場(chǎng)落地風(fēng)向
從去年起,邊緣AI市場(chǎng)已經(jīng)進(jìn)入爆發(fā)期,AIoT終端數(shù)量已經(jīng)超越智能手機(jī)。從AI落地的場(chǎng)景來(lái)看,AI芯片的兩大工作負(fù)載主要是數(shù)據(jù)訓(xùn)練和推理計(jì)算。其中,推理計(jì)算市場(chǎng)份額的增速正在趕超數(shù)據(jù)訓(xùn)練市場(chǎng)。
現(xiàn)在一個(gè)算法模型能做到僅僅2KB,性能表現(xiàn)卻超過(guò)4MB的神經(jīng)網(wǎng)絡(luò)算法。深度學(xué)習(xí)算法的微型化改變表明以GPT-3為代表的超大型模型并不適用于企業(yè)級(jí)市場(chǎng)。
在新的物聯(lián)網(wǎng)框架中,數(shù)據(jù)在設(shè)備本地就可以得到處理。這需要在底層芯片設(shè)計(jì)上就考慮好算法模型在不同場(chǎng)景中有限的部署條件,包括算力、功耗和硅片面積的分配。從單位算力的成本效用上看,推理計(jì)算更能代表企業(yè)級(jí)市場(chǎng)所需要的落地方向。
邊緣AI芯片落地挑戰(zhàn)
首先就是邊緣AI的場(chǎng)景呈多元化,不同場(chǎng)景對(duì)芯片的功耗和性能要求都有差異。而另一方面,碎片化場(chǎng)景的市場(chǎng)容量具有不確定性,需要在芯片研發(fā)的工程成本和收益之間取得平衡,這是所有芯片廠商都需要面對(duì)的考驗(yàn)。
高質(zhì)量數(shù)據(jù)的獲取同樣是一大難點(diǎn),即如何從大數(shù)據(jù)中篩選可靠的數(shù)據(jù)。大數(shù)據(jù)不意味著高質(zhì)量的數(shù)據(jù),在AI芯片上執(zhí)行深度學(xué)習(xí)任務(wù)需要硬件傳感器的持續(xù)優(yōu)化。
另外對(duì)于傳統(tǒng)客戶而言,除了智能產(chǎn)品的采購(gòu)成本外,還有使用成本。芯片的功耗,產(chǎn)品是否易于部署,都影響著AI的落地和推廣。芯片廠商如何根據(jù)不同的場(chǎng)景定制不同算力的芯片也是落地環(huán)節(jié)上的痛點(diǎn)。
目前邊緣AI芯片缺乏高可用的開(kāi)發(fā)平臺(tái),軟件編譯工具設(shè)計(jì)復(fù)雜,用戶的開(kāi)發(fā)和使用門檻偏高,但這些可預(yù)見(jiàn)都會(huì)在落地過(guò)程中不斷完善和迭代。
商用邊緣AI芯片
面向AIoT,地平線推出了旭日系列邊緣AI芯片。通過(guò)IC設(shè)計(jì)和軟件的共同努力,實(shí)現(xiàn)了性能、功耗、靈活性和成本之間的平衡。旭日2邊緣AI芯片采用BPU伯努利1.0 架構(gòu),可提供 4TOPS等效算力,對(duì)多類目標(biāo)進(jìn)行實(shí)時(shí)檢測(cè)和精準(zhǔn)識(shí)別。旭日2集成了Dual-Cortex A53,能高效支持多種主流AI任務(wù)。同時(shí)還支持EMCC、SPI Flash。
旭日3則是地平線推出的,主打低功耗和高性能的全新一代AIoT邊緣AI芯片。其集成了地平線最先進(jìn)的伯努利2.0架構(gòu)AI引擎( BPU),可提供5TOPS的等效算力。
新的BPU架構(gòu)極大提升了對(duì)先進(jìn)CNN網(wǎng)絡(luò)架構(gòu)的支持效果,以及極大降低了AI運(yùn)算對(duì)DDR帶寬的占用率。輔以地平線天工開(kāi)物AI開(kāi)發(fā)平臺(tái),極大簡(jiǎn)化算法開(kāi)發(fā)與部署過(guò)程,降低AI產(chǎn)品的落地成本。
伯努利2.0 BPU結(jié)構(gòu)下,DDR Utilization 呈5倍提升。先進(jìn)的ISP處理算法,使得在寬動(dòng)態(tài)、低照度場(chǎng)景下,也能得到1200 w pixel高質(zhì)量的圖像。旭日3可同時(shí)處理不同分辨率4 ~ 8個(gè)Camera Sensor的輸入,并支持多種圖像后處理,同時(shí)支持 H.264 / H.265 編解碼,性能達(dá)到4K@60fps 。
勘智K210 /K510
第一代芯片勘智K210專門針對(duì)機(jī)器視覺(jué)任務(wù)設(shè)計(jì),浮點(diǎn)計(jì)算能力可以達(dá)到1.28TFLOPS,可以媲美嵌入式領(lǐng)域主流的開(kāi)發(fā)選擇。同時(shí),它的功耗只有0.3W,典型工作場(chǎng)景的功耗小于1W,單位算力功耗低,是一款非常經(jīng)濟(jì)的選擇。第二代勘智K510根據(jù)實(shí)際的落地情況和客戶反饋進(jìn)行升級(jí)。這款I(lǐng)P內(nèi)核重新進(jìn)行架構(gòu)設(shè)計(jì),實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)中不同層級(jí)對(duì)計(jì)算資源、存儲(chǔ)和帶寬的需求,并且提升數(shù)據(jù)的復(fù)用率,降低芯片功耗。
其次,針對(duì)數(shù)據(jù)獲取的速度和質(zhì)量,勘智K510配置了全新的視覺(jué)模組。與第一代芯片相比,K510在幀率和外設(shè)方面都有大幅優(yōu)化。每T算力幀率達(dá)到業(yè)內(nèi)領(lǐng)先水平。此外,K510還支持浮點(diǎn) BF16 計(jì)算,在不適合進(jìn)行模型量化的場(chǎng)景相比同類產(chǎn)品更具優(yōu)勢(shì)。
(Video subsystem示意圖)
小結(jié)
從長(zhǎng)遠(yuǎn)來(lái)看,邊緣AI芯片將把企業(yè)的物聯(lián)網(wǎng)應(yīng)用提升到一個(gè)全新的水平。由AI芯片推動(dòng)的智能設(shè)備將有助于擴(kuò)展現(xiàn)有市場(chǎng),同時(shí)改變制造、建筑、物流、農(nóng)業(yè)和能源等各行業(yè)的價(jià)值分配方式。
原文標(biāo)題:國(guó)產(chǎn)邊緣AI芯片落地人工智能領(lǐng)域風(fēng)向
文章出處:【微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
責(zé)任編輯:pj
-
AI
+關(guān)注
關(guān)注
87文章
31536瀏覽量
270343 -
人工智能
+關(guān)注
關(guān)注
1796文章
47683瀏覽量
240302 -
物聯(lián)網(wǎng)傳感器
+關(guān)注
關(guān)注
1文章
53瀏覽量
7144 -
AIoT
+關(guān)注
關(guān)注
8文章
1421瀏覽量
30954
原文標(biāo)題:國(guó)產(chǎn)邊緣AI芯片落地人工智能領(lǐng)域風(fēng)向
文章出處:【微信號(hào):elecfans,微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論