6 月 20 日,AI產品和服務提供商第四范式宣布發布最新 AI 系列產品SageOne Appliance軟硬一體化AI集成系統,性能較市面開源工具或GPU解決方案至少提高6倍。這是繼 2018 年9 月 18 日第四范式發布自動機器學習平臺AI 先知 AutoML 與計算機視覺平臺AI 先知 AutoCV 兩款產品之后的又一系列AI新產品。同時,該公司還發布了“啟航”合作伙伴計劃,對合作伙伴開放“先知”生態體系建設。
SageOne Appliance軟硬一體化AI集成系統
在幫助企業轉型及應用AI的過程中,第四范式總結出企業AI轉型的“1+N”戰略方法?!?”是指利用AI達到極致效果,在自己的核心業務上建立絕對優勢;“N”是借力科技創新帶來的基礎設施成本的降低,規?;穆涞赜诟鄻I務場景,提升整體經營效率。
第四范式創始人&CEO戴文淵表示,企業的核心業務通常有1或數個,在實際經營中,核心業務創造的營收占比可達80%甚至更多,因而1%的提升就足以改變企業競爭格局。如果企業能高效地完成一千個場景的全面覆蓋,即使每個場景只提升1倍,那也是百分之百的提升。面對場景眾多的企業,AI的“規模化落地”能力是企業全面智能化轉型的關鍵。
第四范式聯合創始人、首席架構師胡時偉表示:傳統算力和AI應用負載之間存在天然的鴻溝,傳統算力只是解決在計算、訪存、I/O帶寬的局部密集問題,而AI應用負載則需要解決全部密集的問題。發展企業級AI專用算力已經成為行業的普遍共識和大勢所趨。
為解決這些問題,第四范式發布了最新AI產品SageOne Appliance軟硬一體化AI集成系統,共發布 SageOne Advanced、SageOne Standard 和 SageOne WorkStation 三大系列共7款產品,覆蓋大中小企業中開發、投產和驗證等全部場景應用。
據介紹,SageOne Appliance 的整體架構如下圖所示,由AI應用、AI平臺、AI核心引擎和硬件基礎設施四部分組成。
▌三大核心引擎
第四范式 SageOne 借助自研AI訓練引擎、AI推理引擎和AI特征存儲引擎三大引擎的領先技術,針對硬件中的芯片、存儲、網絡等組件進行了重新定義,根據企業AI應用的實際情況進行了專用計算架構、資源管理和調度等進行深度優化和加速,為企業 “1+N”AI應用提供充沛算力。
AI訓練引擎——全面加速高維機器學習過程
SageOne AI 訓練引擎以自研高維機器學習分布式框架GDBT和高維算法為基礎,并使用第四范自主研發的硬件加速卡4Paradigm ATX800,該卡采用20nm制程,算力達到1.5TFLOPS,內置FlashGBM加速系統,充分用內存和高速緩存帶寬,支持自動優化訓練超參數、高位特征計算過程I/O加速和高維 GBDT 訓練加速等功能,在企業應用場景中表現出多達 10 倍的訓練性能。
此外,第四范式和英特爾聯合實驗室針對最新Cascade Lake-AP處理器的全新AVX512指令集、多核心及主頻利用率和CLX AP微架構IO總線的利用率進行了全面優化。
SageOne內置第四范式自主研發的高維、分布式網絡通訊協議Swift,集成P-PRC自研網絡通信框架、零拷貝數據交換協議等通訊技術,結合基于CLX-AP架構的參數服務器集群。SageOne在高維特征計算過程I/O最大10X加速,高維稀疏場景模型訓練比GPU提速5X以上,自研pRPC通信框架比百度bRPC和谷歌gRPC提速3-10X。
AI推理引擎,實時AI推理能力
SageOne內置自研實時特征計算引擎和模型預估引擎,為企業AI應用提供特征處理過程免開發上線、線下線上一致性保證、一鍵生成預估服務、異構模型統一服務等AI核心應用服務,結合非易失性存儲的無限緩存和超低延遲內存存儲等硬件技術,確保企業AI應用時具備海量量時序特征計算和萬億維模型實時推理能力的同時,提供百萬級并發實時請求支持和99.9%請求毫秒級響應的高并發業務極速響應服務。
AI特征存儲引擎,超低延時在線AI數據治理
面向AI的數據治理是企業AI規?;涞氐幕A,針對企業中多源異構數據對接、離線在線數據一致性管理、回流數據自動標準及權限、審計等眾多治理需求,SageOne借由自研內存時序數據庫引擎的優勢,具備毫秒級海量時序特征供給性能,并通過融合InfiniCache無限緩存等技術,實現自動切換存儲介質優化TCO和 RAFT一致性災備與恢復等高性能企業級標準。SageOne利用超低延遲數據訪問接口、超高數據吞吐傳輸通道和水平擴展動態擴容服務等突出能力,為企業AI應用構建了超低延遲在線數據治理能力。
值得一提的是,SageOne 存儲引擎中使用的 RTIDB 是業界首個AI特征數據庫。胡時偉分析道,市面上有很多數據庫,如關系型數據庫、分析型數據庫等主要是人對數據進行處理并得到結果,但是,AI數據庫要解決的問題不是給人看的,而是給機來“看”,所以對于吞吐量、一致性的要求較高。因為第四范式要解決1+N的問題,原來面向傳統應用的數據庫應用起來非常不順利,會產生很多折損,但按照AI數據庫的架構,用全量、實時、一致性的數據標注,可以更好地支持核心場景和應用。軟件層面要求實時性和全量兼顧,這就會產生內存不足、網絡傳輸吞吐量的問題,因
此,軟硬一體化和無限閃存技術可以彌補傳統的系統架構中內存成本太高、磁盤延遲太大的問題,以相同的代價實現性能提高十倍以上,同時保持延遲基本相同。
軟件目標的體系架構和算法的設計,再加上硬件的支持,是這套數據庫的特點。
特點:高維計算、實時決策
相比于同類產品,SageOne 的優勢在于高維計算和實時決策。
第四范式自主研發的高維機器學習算法,面對企業海量多源異構的數據場景,特征維度可以達到6500萬,在同等維度下,大部分的開源工具或GPU解決方案會以失敗告終。同時,模型的預測效果提升,比如金融風控的性能提升9倍,金融反洗錢的效率提高6倍。
另外,SageOne通過毫秒級數據響應和百萬級吞吐量實時提升核心業務成效,讓原本只能出現于“事后”的統計分析,轉變成為 “事中”實時業務決策AI應用。在企業核心場景的實時業務決策中,15個SageOne推理引擎節點都夠支撐20億維特征模型實時2萬次并發請求,其中99.9%請求在100ms內響應,大幅提升實時決策在核心業務場景中的關鍵價值。
最后,胡時偉表示,對于中小企業或者處于擁抱AI的初級階段的公司,可以采用SageOne Standard產品,SageOne WorkStation和SageOne Advanced產品也可以使用。
此外,第四范式還展示了全面國產化的AI軟硬一體機——領航,產品內置國產化的CPU、BIOS、網卡和操作系統等軟硬組件,融合了第四范式的企業級先知Sage平臺中自研高維機器學習框架、AutoML和實時自學習等。
SageOne機器學習框架和算法特點
相比于之前的先知平臺產品,SageOne在機器學習框架和算法上進行了一些改進和創新。
胡時偉表示,從方法論來講,從高維實時這個角度,SageOne繼承了之前先知平臺的優勢,但是由于軟硬一體的設計,SageOne可以做到純軟做不到的事情,比如硬件和軟件一起加速的設計使得企業可以在同等投入的基礎上性能可以再提升十倍或更高,維度可以進一步擴大,這個是原先純軟件方案做不到的。
第二,SageOne引入了存儲引擎,此前軟件是在傳統數據平臺上,但SageOne體系提出了全新的數據治理和架構,規?;膽煤蛿祿]環就要靠這個新的架構,因為傳統大數據平臺底層的硬件架構支持不了最新實時和一致性需求,所以SageOne引入數據庫產品,這是整個新的體系架構中的創新。
獨立團隊自研AI芯片,2019年更注重AI創造價值
軟硬件一體化已成為最近一些公司發布新產品的趨勢,將軟件解決方案直接嵌入到硬件設施中。第四范式也不例外。目前,第四范式在新加坡已經有一支十多人規模的AI芯片研發團隊,正在進行軟硬件一體化的研究。戴文淵表示,現在產業已經從軟件符合算力的階段向軟件定義算力的階段轉變,第四范式也將從整體到局部,依次做出改變。
2018 年 12 月 19日,第四范式宣布完成 C 輪融資,融資金額超過 10 億元人民幣,估值約 12 億美金,成為一支獨角獸,同時引入包括國新、啟迪、保利、三峽、中信、農銀、交銀等戰略股東,紅杉中國繼續追加投資。2019年2月,第四范式入選CB Insights全球AI百強榜及領軍獨角獸榜單。
戴文淵透露,第四范式其實已經有了上市規劃,但短期內暫無具體計劃,上市板塊也需靈活選擇。戴文淵強調,上市不是目的,上市的方式需要適合第四范式的發展。
目前,第四范式已進入金融、醫療、政府、能源、零售、媒體等領域,加速AI通用平臺在各行業的拓展和規?;涞貞?。
最后,如果說2017年是AI技術井噴的一年,2018年是AI 落地的一年,那么 2019 年將會出現什么現象和改變呢?
對此,戴文淵給出了自己的想法:“2019年將會關注AI在各個行業里創造的價值,過去我們關注的是AI公司本身,比如又一個大牛出來了,好像寫了很多論文,好像拿了好多錢。但這個都不是根本,長期存在價值一定不是說簡歷好看,而是能不能持續給企業產生價值?!?/p>
-
AI
+關注
關注
87文章
31536瀏覽量
270357
原文標題:繼AutoML后,第四范式發布軟硬一體化AI集成系統SageOne
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論