邊緣AI應(yīng)用正處于大規(guī)模落地的前夕,巨大的IoT市場和革命性的AI技術(shù)產(chǎn)生的劇烈交互將帶來前所未有的應(yīng)用革命和商業(yè)機(jī)會(huì)。那么在邊緣設(shè)備部署AI應(yīng)用的瓶頸都有哪些?
有人有現(xiàn)成的芯片和應(yīng)用場景,卻為缺乏算法和平臺(tái)苦惱。
有人有自己的算法,卻為缺乏一個(gè)好用的嵌入式跨平臺(tái)框架而苦惱。
有人有自己的算法和硬件平臺(tái),卻為嵌入式平臺(tái)有限算力苦惱。
OPEN AI LAB看到了業(yè)界痛點(diǎn),順應(yīng)市場需求推出了專為嵌入式平臺(tái)設(shè)計(jì)的AI推理框架——Tengine。
專門針對Arm嵌入式設(shè)備優(yōu)化的神經(jīng)網(wǎng)絡(luò)推理引擎
OPEN AI LAB于2016年12月成立,由Arm中國聯(lián)合產(chǎn)業(yè)伙伴發(fā)起,致力于推動(dòng)芯片、硬件、算法、軟件整個(gè)產(chǎn)業(yè)鏈的深度合作,加速人工智能產(chǎn)業(yè)化應(yīng)用部署和應(yīng)用場景邊界拓展。Tengine便是一款輕量級模塊化高性能的神經(jīng)網(wǎng)絡(luò)推理引擎,專門針對Arm嵌入式設(shè)備優(yōu)化。完美支持Arm平臺(tái),支持Arm Cortex CPU,Arm Mali GPU,Arm DLA,第三方DSP,堪稱兼容“全能王”。
而開發(fā)者可以使用Tengine一網(wǎng)打盡主流框架模型和嵌入式操作系統(tǒng),還能異構(gòu)調(diào)度平臺(tái)里的各類硬件,充分利用硬件算力。此外,Tengine還提供了常見AI應(yīng)用算法,包括圖像檢測,人臉識(shí)別,語音識(shí)別等。不懂AI沒關(guān)系,上手就能跑AI應(yīng)用。Tengine同時(shí)還支持各類常見卷積神經(jīng)網(wǎng)絡(luò),包括SqueezeNet,MobileNet,AlexNet,ResNet等,支持層融合、8位量化等優(yōu)化策略。并且通過調(diào)用針對不同CPU微構(gòu)架優(yōu)化的HCL庫,將Arm CPU的性能充分挖掘出來。
Tengine的“發(fā)動(dòng)機(jī)”——HCL計(jì)算庫
有人說NCNN是一個(gè)為手機(jī)端極致優(yōu)化的高性能神經(jīng)網(wǎng)絡(luò)前向計(jì)算框架,從設(shè)計(jì)之初深刻考慮手機(jī)端的部署和使用。在過去,NCNN確實(shí)是這樣的,只是那時(shí)候還沒有Tengine。
現(xiàn)在,HCL計(jì)算庫作為Tengine的插件,是性能最快的Arm CPU NN計(jì)算庫,并且支持動(dòng)態(tài)8位量化計(jì)算,精度幾乎不變,相比于NCNN最快能帶來2-3倍的性能提升,內(nèi)存使用減少為三分之一。
*Tengine性能數(shù)據(jù)A72,A53性能基于RK3399平臺(tái)測試,A17性能基于RK3288平臺(tái)測試
NCNN數(shù)據(jù)為2018年9月7日
HCL INT8量化計(jì)算精度變化
FP32INT8Diff
TOP1TOP5TOP1TOP5TOP1TOP5
MobileNetv167.86%87.60%66.40%86.44%-1.46%-1.16%
SqueezeNet57.86%79.86%57.80%79.92%-0.06%0.06%
GoogLeNet68.48%88.82%68.70%88.82%0.22%0.00%
ResNet5071.60%89.90%71.60%89.86%0.00%-0.04%
*采用ILSVRC2012_VAL數(shù)據(jù)集測試5000張圖片得到量化精度測試結(jié)果如下
Tengine + HCL,不同人群的量身定制
Tengine作為AI 應(yīng)用框架,不僅對上層應(yīng)用提供推理API接口,支持主流模型與格式,還在下層定義硬件接口,適配嵌入式平臺(tái)各類計(jì)算模塊,此外支持同時(shí)運(yùn)行多個(gè)AI應(yīng)用算法以及調(diào)用多個(gè)計(jì)算模塊計(jì)算。因此,Tengine的面世對AI開源生態(tài)具有里程碑的意義。有了Tengine,應(yīng)用和算法廠商可以擺脫復(fù)雜的嵌入式平臺(tái)適配工作,配合HCL直接挖掘硬件的全部潛能;有了Tengine,芯片廠能夠站在Arm 嵌入式AI生態(tài)的肩膀上,以最快的速度順利將芯片推向市場,在邊緣AI應(yīng)用中部署。作為OPEN AI LAB為邊緣AI應(yīng)用部署開發(fā)的兩大利器,Tengine + HCL將助力嵌入式人工智能產(chǎn)業(yè)加速向前推進(jìn),為最終實(shí)現(xiàn)萬物智能貢獻(xiàn)力量。
-
ARM
+關(guān)注
關(guān)注
134文章
9169瀏覽量
369223 -
嵌入式系統(tǒng)
+關(guān)注
關(guān)注
41文章
3625瀏覽量
129757 -
AI
+關(guān)注
關(guān)注
87文章
31535瀏覽量
270343 -
Tengine
+關(guān)注
關(guān)注
1文章
47瀏覽量
2876
發(fā)布評論請先 登錄
相關(guān)推薦
有個(gè)嵌入式系統(tǒng)的硬件要開發(fā),有朋友有興趣么?
ARM架構(gòu)嵌入式主板特點(diǎn)
![<b class='flag-5'>ARM</b>架構(gòu)<b class='flag-5'>嵌入式</b>主板特點(diǎn)](https://file1.elecfans.com/web2/M00/EB/A1/wKgZomZe5fWAXs4EAABHp9zbA6E074.png)
ARM嵌入式通信協(xié)議及應(yīng)用
ARM嵌入式實(shí)時(shí)操作系統(tǒng)比較
嵌入式系統(tǒng)的未來趨勢有哪些?
ARM MCU嵌入式開發(fā) | 基于國產(chǎn)GD32F10x芯片+嵌入的開始
RT-Thread出席第六屆中國嵌入式技術(shù)大會(huì),共話嵌入式操作系統(tǒng)與智能工業(yè)
![RT-Thread出席第六屆中國<b class='flag-5'>嵌入式</b>技術(shù)大會(huì),共話<b class='flag-5'>嵌入式</b>操作<b class='flag-5'>系統(tǒng)</b>與智能工業(yè)](https://file1.elecfans.com/web2/M00/C4/8A/wKgZomX0EhWACv8DAAAUet8ikhs451.png)
嵌入式軟件開發(fā)與AI整合
![<b class='flag-5'>嵌入式</b>軟件開發(fā)與<b class='flag-5'>AI</b>整合](https://file1.elecfans.com/web2/M00/8D/79/wKgaomS7KZ-AY3GzAAArJzrUg1c443.png)
嵌入式系統(tǒng)怎么學(xué)?
第六屆中國嵌入式技術(shù)大會(huì):AI與嵌入式應(yīng)用、RISC-V生態(tài)、嵌入式操作系統(tǒng)與智能工業(yè)
![第六屆中國<b class='flag-5'>嵌入式</b>技術(shù)大會(huì):<b class='flag-5'>AI</b>與<b class='flag-5'>嵌入式</b>應(yīng)用、RISC-V生態(tài)、<b class='flag-5'>嵌入式</b>操作<b class='flag-5'>系統(tǒng)</b>與智能工業(yè)](https://file1.elecfans.com/web2/M00/E5/E7/wKgZomZFcsyAcT-5AAA2A4dQRkQ217.png)
深度詳解嵌入式系統(tǒng)專用輕量級框架設(shè)計(jì)
![深度詳解<b class='flag-5'>嵌入式</b><b class='flag-5'>系統(tǒng)</b>專用輕量級<b class='flag-5'>框架</b>設(shè)計(jì)](https://file1.elecfans.com/web2/M00/D2/87/wKgaomYjRd2APDxTAAAtWrrRF18443.png)
評論