一、曠視宣布開源深度學習框架“天元”
3月25日下午,曠視科技舉辦線上發布會,宣布開源新一代AI生產力平臺Brain++的核心深度學習框架曠視天元(MegEngine)。
據了解,天元的前身是曠視內部自用的算法訓練推理引擎MegEngine,由曠視3名實習生在2013年啟動研發,并與2014年正式完成上線。這款自研的深度學習框架支撐了曠視6年以來在國際AI競賽的表現,以及公司產品和業務的落地,
二、天元框架采用推理一體化的機制
據介紹,在傳統深度學習研發中,產品從原型到生產部署往往需要分開設計和調用訓練框架和推理框架兩種框架,這就導致模型在訓練和推理的轉換的過程中出現不明原因的性能或精度損失,需要開發者手工進行優化,而算法在計算平臺部署的時候出現各種問題也無法追溯。
天元框架避免了這樣的問題,通過訓練、推理一體化的機制省去模型轉換的過程,可直接將訓練后的模型進行推理,并保證跨設備的模型精度對齊,同時天元內置自動模型優化、簡化流程,減少因手工操作的機會,降低出錯概率。
除此之外,天元配置了 Python 和 C++ 接口,支持動態圖、靜態圖一鍵轉換和混合編程,可使用高級編程語言進行圖優化和圖編譯。在運行時管理環節,天元具備執行流與調度器,采用動態、靜態內存分配并存的方式,并通過自動的亞線性內存管理優化器可以得到更好的內存優化效果;在底層設計上,天元的計算內核兼容主流計算設備,且支持多機多卡和分布式訓練。而為了解決模型復現困難的問題,天元則支持 PyTorch Module 導入,可針對計算機視覺任務進行優化。
目前,曠視已在中國新一代人工智能開源開放平臺OpenI啟智社區和開源社區 GitHub 上同步發布了天元 Alpha 版源代碼,開發者也可以通過天元官方網站的在線深度學習工具免費調用算力、獲取最新數據集和訓練腳本,進行簡單訓練和試用。
三、開源MegEngine,逐步釋放Brain++生產力
在MegEngine框架基礎之上,曠視研究院還提出了“三位一體”概念,將數據和算力平臺融合,構建了集“算法、數據和算力”于一體的AI生產力套件Brain++。
曠視Brain++本質上是一個超級工具套件,初衷是降低人工智能的使用成本。唐文斌曾提到,希望Brain++能夠為研發人員提供端到端的解決方案,提升大家的工作效率,不用再重復“造輪子”。
曠視做了這一一個類比:一個餐館的核心價值是為客人提供美味的菜品(就像AI產業的核心價值是提供專業可靠的AI解決方案),那么實現這個價值最重要的人則是大廚(開發者)。小作坊里的廚師需要自己洗菜(數據清洗)、配菜(搭模型)、炒菜(訓模型)、調火候和口味(調參數),一個中午也許只能為三桌客人提供菜品。而在現代化、自動化中央廚房里工作的大廚,他將擁有標準化、流水線管理的配菜間和智能化的爐灶等套件工具,那么或許他一個人就可以搞定一棟樓菜品供應。曠視Brain++就是希望為開發者提供這樣一套“中央廚房”式的解決方案。
Brain++這個生產力套件最為核心的部分就是能夠批量生產算法的深度學習框架,曠視希望通過MegEngine的開源,逐步將Brain++的生產力賦能給學術界和產業界的廣大開發者。
三、開源成為人工智能下一階段發展新趨勢
2012 年后,深度學習的發展帶動人工智能進入拐點,前者擁有高于傳統機器學習十倍、百倍的神經網絡參數,在人工智能最先落地的語音識別、圖像識別領域,深度學習都是不可或缺的重要工具。商業落地中的數據反哺,也帶動了算力、框架上的不斷升級。開發者口中通用的深度學習開源框架基本不出這幾種:TensorFlow、 PyTorch、Caffe、CNTK、ONNX 等,這背后又分別站著谷歌、Facebook、微軟等巨頭。
唐文斌在發布會上提到,技術信仰是曠視人的基因,相信技術的變革能夠改變世界。對于曠視來說,自研的AI生產力套件已經能夠滿足企業發展需要,但一個人的力量始終是有限的,一群人在一起才能創造奇跡。只有開源才能讓更多優秀的開發者凝聚起來共享、共建、共贏,打破堅硬的技術壁壘,碰撞激發出更多優秀的代碼。
更重要的是,開源是推進技術實現產業發展的催化劑。AI要真正實現產業化、通用化,需要大規模部署AI能力,在數據、計算、部署場景、硬件解決方案上具備一系列“工業級”的基礎,但眼前本質的問題在于AI技術的基礎條件尚未成熟,曠視希望能夠通過開源為AI產業基礎設施添磚加瓦。
人工智能算法從研發到部署是一套龐大的系統工程,深度學習框架作為通用性的底層支持平臺,可實現算法訓練和模型部署的高效流程化和深度神經網絡模型設計自動化。在減少人員參與而不犧牲訓練質量的條件下,能夠大幅提高算法生產效率,對于人工智能技術及應用研發人員的重要性不言而喻。
-
曠視科技
+關注
關注
1文章
153瀏覽量
11231
發布評論請先 登錄
相關推薦
評論