提供AI算力的另一種方式。
最常見的方式是提供算力。大模型需要大算力,因此,對算力尤其是英偉達GPU的巨額投入是不可或缺的。英偉達曾透露,2023財年數據中心業務有40%的收入來自超大規模數據中心與云服務商。
但現在,云計算廠商又多了一門新生意。
近期,有“混合云第一股”之稱的云廠商青云科技推出了兩款新的云產品——AI算力調度平臺與AI算力云。AI算力調度平臺是一款軟件產品,它介于底層的資源層與上層的模型層之間,通過整合不同來源、類型和架構的算力資源,實現統一調度與運營,為用戶提供按需獲取和調度的服務;AI算力云,就是以青云為主來運營的AI算力服務。
這兩款AI算力產品與服務針對的是算力中心的短期建設與中長期運營的需求。青云科技總裁林源表示,今天中國云計算市場處在算力建設階段,大量的數據中心如雨后春筍般出現,這些建設者有地方政府、國資央企、地方AI集成商等。對于建設者而言,成本與技術的挑戰都很大,比如一臺最新的一臺英偉達服務器高達200萬元。如此大的投資,怎么建?建成之后如何運營,如何賺錢?這些問題都需要有人來解決。
青云科技的AI算力調度平臺已經成功服務于國家超算濟南中心。濟南超算中心是一個多元計算中心,對外提供1000P算力、300PB存儲,算力類型包括HPC超算,主要服務于山東省的高校;以CPU為主的通用算力,主要服務于傳統的政務云、企業數字化應用;以GPU為主的智算,主要服務于智慧城市,以及正在爆發的AI需求。
濟南超算中心的建設覆蓋了幾乎所有產業鏈上下游公司,但青云科技為其獨家提供了算力調度平臺,至今已經運營了3年。濟南超算中心目前已經盈利。
對于AI算力云服務,不同于大廠選擇重金投入GPU來獲取稀缺的算力資源,青云科技采用了“輕資產”運營,以生態合作的方式共同運營AI算力。
以濟南超算中心為例,建成之后不僅服務于當地企業,也會服務于全國其他地區的企業。當青云科技的客戶有算力需求,青云科技可以通過直接調度濟南超算的算力向客戶提供AI算力資源。因此,青云科技既是濟南超算的供應商,也是其渠道商。
這樣的案例不在少數。青云科技已經與北京、寧夏、河南、湖北、四川等地區的算力中心建立起合作關系。
在2023年半年報中,青云科技披露AI算力服務的收入超2000萬元。林源表示,未來AI算力產品與服務將會成為青云科技營收的主力。
過去十年,中國的云計算市場一共經歷了三次比較大的機會。第一次是數字化,移動數字化催生了公有云,產業數字化催生了私有云;第二次是信創與國產替代。而當前爆發的生成式AI,就是第三次大機會。
林源認為,2023年由GPU驅動的智算,正如十年前的2013年由CPU驅動的通用云計算。而這一次的市場規模,要比過去大10倍、甚至100倍。
近期,「甲子光年」等媒體采訪了青云科技總裁林源,青云科技產品經理苗慧。以下是專訪實錄,略經刪改:
1.與大廠定位不同
問:青云的算力調度產品有哪些特色?
苗慧:簡單舉幾個例子。第一,青云針對上百臺機器的大集群,研發了更加優化的調度算法。比如在調度的鏈路標簽上,盡可能做到調度同一個交換機,減少數據的損耗。第二,在應用環境上,青云應用了K8s和Slurm兩種調度平臺同時為客戶服務,是完全集成好的。在顆粒度和運維傳統機器方面,也會有更多的優化。
圖片來源:青云科技
問:大廠、運營商、私有云廠商也有軟件能力,為什么說青云的AI算力調度運營是青云科技的優勢?
林源:首先,私有云廠商想做,需要補齊十幾年公有云運營的經驗。第二,大廠的定位一定是發展自己的云,而不是支持別人去做云,或者說支持第三方做云只是他的一個項目而已,主力還在自己的云產品與服務。
苗慧:比如對于國家超算的人員配置,根本沒有研發這個崗位,全都是運維人員。用戶通過青云AI算力調度平臺,申請10臺機器,5分鐘內就能得到。否則,運維人員需要兩個人部署三天,這就是更多的投入。
問:英偉達今年發布了AI云產品DGX Cloud,青云的產品和英偉達DGX Cloud在定位上有沒有相似?
苗慧:DGX-Cloud還是基于硬件。英偉達在今年發布了24臺機器的整機,巨大的機器上云一定會有優勢。但DGX Cloud不在中國區運營,從資源層和運營層都是其自身的。青云的算力調度產品不僅自己的公有云能用,還能給到任何一家算力中心。
林源:英偉達DGX Cloud還是單一算力,肯定以GPU為主。站在英偉達的角度,他服務于大模型的訓練、推理,定位就是面對AI的場景,以及賣GPU卡。而青云科技根據中國市場國情,需要向下兼容,不同的客戶需要的芯片算力種類不同,既有GPU,也有CPU、超算。比如我們跟英特爾9系列做適配,一個芯片2T內存,在推理場景比英偉達還要好一些。青云的算力調度平臺,針對的是多元算力。
2.“輕資產”提供AI算力
?
問:青云自身在算力上的投入是怎樣的?
林源:GPU不太一樣,青云不會跟云大廠拼投資,而是以相對“輕資產”的方式與別人一起運營AI算力云。青云是聯合運營方,投資的是技術與產品,但不會花1個億買幾百張卡、幾百臺服務器。重資產不是青云的價值所在。
問:那誰來做算力層面的投入?
林源:目前來看,算力層面上的投資建設者主要有以下幾種:第一種是地方國企和地方央企,例如能源公司,他們有強烈的興趣將電力轉變成算力。第二種是地方政府,他們需要新的工具來促進產業聚集,提升GDP,有些直接進行投資,有些與央企或銀行合作。第三種是大模型公司、AI芯片公司等,他們在各地都參與建立了算力中心,但缺乏標準平臺,他們也想銷售硬件或整合解決方案,通常更愿意與獨立的供應商合作。我們之間互為渠道伙伴,青云協助他們進行計算資源調度,并一起提供AI計算資源云服務。
以濟南超算為例,濟南超算會基于他投資的算力直接賣給他的客戶,青云也會出售給青云的客戶,青云既是他的供應商,也是他的渠道商。未來所有的本地數據中心建設都會面臨這個問題,當地企業會消費一部分,剩余部分他會希望有人幫他消耗。AI算力云與算力調度中心是青云的同構產品,可以進行系統級的產品對接。
圖片來源:青云科技
問:除了和濟南超算有合作外,還有其他的合作方嗎?
林源:跟北京、寧夏、河南、湖北、四川等地區有合作。北京是以高校為主,寧夏是地域性的算力投資建設者,四川、湖北是能源公司,河南是地方政府。還有一些小城市,主要是一些AI合作伙伴,對接當地的算力中心后,用青云的調度平臺做賦能。
問:青云自己提供云服務和青云給甲方提供算力調度服務,會成為一種競合的關系嗎?
林源:我們先看下市場現狀,為什么會有那么多供應商和地區云、國資云、地方私有云平臺呢?這是中國的市場形態決定的,每個人都有所屬的客戶和資源。AI來了之后,市場會不一樣嗎?我覺得不會那么快改變。
問:很多大模型廠商會選擇自己買卡,這類廠商對于青云科技的AI算力云還有需求嗎?
林源:大模型廠商自己的規劃中,有相對固定的部分,他會更愿意買卡,因為現金充裕,會更加可控,這部分跟青云確實沒太大關系。但在模型訓練階段、項目落地階段,有很多彈性需求,比如他需要訓練行業模型,同時希望跟一場算力云廠商合作提供MaaS的服務。大模型公司一定會買一部分,自建一部分。
問:目前市場上算力資源不夠,怎么辦?
林源:算力不夠的核心是GPU的供貨問題,不在于我們。用戶一般是簽完合同后等著我們的算力供應,所有廠商都面臨相同的問題。但是不同廠商的解法不一樣,大廠是靠錢買,青云的方式是與合作伙伴一起。青云的核心是調度平臺,但不妨礙青云一起給客戶提供AI算力云。
問:在青云開放同盟中,有哪些廠商?青云處于什么地位?
林源:可以分為技術生態和商業生態。技術生態的第一層是GPU、CPU等異構芯片;第二層是模型生態(MaaS),包括主流的商業大模型、開源大模型。在芯片層跟模型層之間,就是算力調度層。算力調度層不僅靠青云,也有很多廠商在做模型的加速和模型的驅動。技術生態還有一環,就是行業ISV。
商業生態,包括我們說的智算中心建設方,以及天然就能幫你售賣的合作伙伴。
問:在AI時代,大家合作的意愿會比以前更強嗎?在巨大的市場紅利面前,為什么會愿意收益共享?
林源:先談主觀看法,我認為有必要這么做,大家就應該各司其職、合作共贏。現在持這種想法的不只青云一家。哪怕是客戶,也不希望一家獨大,不希望被一家廠商綁定。他希望在每一個細分領域找到最優秀的人,為他提供整體解決方案。這是一個正常的、合理的商業模式。
第二點是客觀。一家企業很難從底層資源到上層應用,自己把做有事情做好,AI時代這會比過去更難?,F在的經濟環境,要核算投入產出比,需要成為所有行業的專家,才能“單打獨斗”,這是一個客觀的挑戰。
問:AI會給現有的云廠商格局帶來一些什么樣的變化?青云如何定位自己未來的位置?
林源:AI一定會對于現在的云廠商帶來變化。第一,對于底層技術的需求,以及對于合作的模式,都在發生變化。
第二,現在所有人都在同一起跑線上。我判斷會有一些新晉做AI Cloud的公司進入市場。傳統的IDC已經不適合GPU運行,因為能耗、設計都不一樣,傳統IDC面臨改造升級。
第三,有些云廠商自己也做大模型,青云科技不做,而是深耕AI算力調度平臺。面對新的AI應用需求,大家需要很多技術積累、技術迭代,這特別像2013年的云時代。
在資本側,確實可以自己投資建設,但現在AI不缺投資者與建設者,缺的是運營平臺。資本會有影響,但不會像以前那么大。
總結來說,大廠在技術與資本層面并沒有明顯的優勢。我們為什么擁抱AI,因為AI是唯一的增長市場。2017年之前,大家不會考慮增量市場的問題,但之后客戶應用在飽和,越來越多的云廠商冒出來,這時候大廠靠自己的品牌以及價格優勢在公有云市場上來搶奪機會。現在大家忙的不是競爭,而是在AI時代如何為客戶更好地服務,解決算力問題。
3.AI會成為未來營收主力
問:青云科技的半年報顯示,今年上半年AI算力服務的收入有2000多萬元。青云的算力產品與服務,未來可以帶來多大的營收?有哪些期待?
林源:營收數字以公開的財報口徑為準。但基本上有這樣一個趨勢:AI算力現在更多以訓練為主,之后我們希望它進入推理階段。訓練的增速是可以期待的,2023年以GPU為主的算力云,就跟2013年以CPU為主的云一模一樣。2013-2017這幾年,所有云廠商都是100%的增長。
問:AI算力是一個很大的市場,但AI算力調度是否只是其中一小部分市場?
林源:我們看的是兩塊,第一塊AI算力調度本身,這有點像原來傳統交付模式的生意。第二塊是AI算力云,它既有產品的部分,也有服務的部分。這一部分未來十年的市場空間更大,我覺得是10倍、100倍的增長,而青云科技至少會比上一階段做到的規模更大。
問:青云現在的營收主力還是私有云,未來AI算力調度會成為營收的主力嗎?
林源:我覺得它一定會成為主要的營收,但是它需要點時間。過去青云最早做數字化、做信創業務,尤其過去兩年信創占私有云很大一部分,這不是青云決定的,而是市場決定的。之后所有的客戶都會往AI遷移,不管是傳統客戶還是互聯網客戶,生意模式與運營模式都會由AI驅動。如果不做AI,真的會落后。所以,它一定會成為主營的業務。
問:在AI算力服務這一塊,客戶需求比較旺盛的主要集中在哪幾個領域?
苗慧:主要就是訓練。現在大模型作為技術基礎,在上層面向不同的行業。只要能標準化的,都在大規模地做模型的訓練,然后生產出自己的小模型。在理解人類意圖的時候,意圖模型也隨之更新。所以,如果我要做一個行業,大概要訓練3~5個小模型,為這個行業提供服務。
問:青云算力調度平臺是一個標準化平臺嗎?在行業的應用上有沒有差別?
林源:青云對算力調度平臺的定位就是“產品”,產品就是標準化的。在濟南超算這一客戶中,會有客制化的部分,但那是他要做的事情,不是青云要做的事情。青云的定位始終是一家軟件產品公司,而不是一家項目公司。
問:青云現階段更希望吸引什么樣的行業,或者什么樣的行業有更大的意愿采用這一產品?
苗慧:青云AI算力調度平臺主要服務于超算中心、區域算力中心、區域電信、區域的一些合作伙伴,我們共同建設起那朵云,共同運營。
第二是青云公有云的AI算力云,主要服務于大模型的開發商。因為大模型開發商也在面向客戶提供一些像金融領域的模型、交通領域的模型,它需要大規模的機器進行訓練,青云還是面向于這種模型提供商比較多。
第三是青云計劃今年年底或者明年,大規模的推理就會上云,因為大規模的訓練研發工作會有一個階段性的成果,推理服務會是之后相對重點的工作。
-
云計算
+關注
關注
39文章
7850瀏覽量
137874 -
AI
+關注
關注
87文章
31536瀏覽量
270343 -
算力
+關注
關注
1文章
1016瀏覽量
14959 -
大模型
+關注
關注
2文章
2551瀏覽量
3172
原文標題:AI算力調度平臺,大模型時代云計算的新生意|甲子光年
文章出處:【微信號:jazzyear,微信公眾號:甲子光年】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論