hg4366com,辽宁省娱乐场所全部关闭,瑞士皇冠官网首页下载安装视频大全免费 (中国)·官方网站

高端GPU持續(xù)缺貨之下，一家要挑戰(zhàn)英偉達的芯片初創(chuàng)公司成為行業(yè)熱議焦點。

8枚芯片跑大模型，就能支持5萬億參數(shù)（GPT-4的三倍）。

這是獨角獸企業(yè)SambaNova剛剛發(fā)布的新型AI芯片SN40L——

型號中40代表是他們第四代產(chǎn)品，L代表專為大模型（LLM）優(yōu)化：高達1.5T的內(nèi)存，支持25.6萬個token的序列長度。

CEORodrigo Liang表示，當前行業(yè)標準做法下運行萬億參數(shù)大模型需要數(shù)百枚芯片，我們的方法使總擁有成本只有標準方法的1/25。

SambaNova目前估值50億美元（約365億人民幣），累計完成了6輪總計11億美元的融資，投資方包括英特爾、軟銀、三星、GV等。

他們不僅在芯片上要挑戰(zhàn)英偉達，業(yè)務(wù)模式上也說要比英偉達走的更遠：直接參與幫助企業(yè)訓(xùn)練私有大模型。

目標客戶上野心更是很大：瞄準世界上最大的2000家企業(yè)。

1.5TB內(nèi)存的AI芯片

最新產(chǎn)品SN40L，由臺積電5納米工藝制造，包含1020億晶體管，峰值速度638TeraFLOPS。

與英偉達等其他AI芯片更大的不同在于新的三層Dataflow內(nèi)存系統(tǒng)。

520MB片上SRAM內(nèi)存

65GB的高帶寬HBM3內(nèi)存

以及高達1.5TB的外部DRAM內(nèi)存

與主要競品相比，英偉達H100最高擁有80GB HBM3內(nèi)存，AMD MI300擁有192GB HBM3內(nèi)存。

SN40L的高帶寬HBM3內(nèi)存實際比前兩者小，更多依靠大容量DRAM。

Rodrigo Liang表示，雖然DRAM速度更慢，但專用的軟件編譯器可以智能地分配三個內(nèi)存層之間的負載，還允許編譯器將8個芯片視為單個系統(tǒng)。

除了硬件指標，SN40L針對大模型做的優(yōu)化還有同時提供密集和稀疏計算加速。

他們認為大模型中許多權(quán)重設(shè)置為0，像其他數(shù)據(jù)一樣去執(zhí)行操作很浪費。

他們找到一種軟件層面的加速辦法，與調(diào)度和數(shù)據(jù)傳輸有關(guān)，但沒有透露細節(jié)，“我們還沒準備好向公布是如何做到這一點的”。

咨詢機構(gòu)Gartner的分析師Chirag Dekate認為，SN40L的一個可能優(yōu)勢在于多模態(tài)AI。

GPU的架構(gòu)非常嚴格，面對圖像、視頻、文本等多樣數(shù)據(jù)時可能不夠靈活，而SambaNova可以調(diào)整硬件來滿足工作負載的要求。

目前，SambaNova的芯片和系統(tǒng)已獲得不少大型客戶，包括世界排名前列的超算實驗室，日本富岳、美國阿貢國家實驗室、勞倫斯國家實驗室，以及咨詢公司埃森哲等。

業(yè)務(wù)模式也比較特別，芯片不單賣，而是出售其定制技術(shù)堆棧，從芯片到服務(wù)器系統(tǒng)，甚至包括部署大模型。

為此，他們與TogetherML聯(lián)合開發(fā)了BloomChat，一個1760億參數(shù)的多語言聊天大模型。

BloomChat建立在BigScience組織的開源大模型Bloom之上，并在來自O(shè)penChatKit、Dolly 2.0和OASST1的OIG上進行了微調(diào)。

訓(xùn)練過程中，它使用了SambaNova獨特的可重配置數(shù)據(jù)流架構(gòu)，然后在SambaNova DataScale系統(tǒng)進行訓(xùn)練。

這也是這家公司最大被投資者熱捧之外的最大爭議點之一，很多人不看好一家公司既做芯片又做大模型。

給每家大企業(yè)打造150個大模型

在與The Next Platform網(wǎng)站交流時，CEO Rodrigo Liang表示：

用于大模型訓(xùn)練的公開數(shù)據(jù)已快耗盡，但對參數(shù)數(shù)量的追求還在不斷增加。

各種大模型的性能相差只有幾個百分點，這不是大家應(yīng)該玩的游戲。

他認為大模型與生成式AI商業(yè)化的下一個戰(zhàn)場是企業(yè)的私有數(shù)據(jù)，尤其是大企業(yè)。

這些企業(yè)坐擁大量的數(shù)據(jù)，但自己不知道其中大部分內(nèi)容是什么。

對于企業(yè)私有大模型的形態(tài)，SambaNova也有與眾不同的觀點。

他們認為最終企業(yè)內(nèi)部不會運行一個GPT-4或谷歌Gemini那樣的超大模型，而是根據(jù)不同數(shù)據(jù)子集創(chuàng)建150個獨特的模型，聚合參數(shù)超過萬億。

相當于把GPT-4等大模型內(nèi)部的Mixture of Experts（專家混合）架構(gòu)擴展到整個系統(tǒng)，稱為Composition of Experts（專家合成）。

在企業(yè)運轉(zhuǎn)的每個節(jié)點運行一個完整且經(jīng)過專門調(diào)整的基礎(chǔ)模型，分別用法律語料庫、制造語料庫、風險管理語料庫、財富管理語料庫、客戶銷售語料庫、客戶支持語料庫等等不同數(shù)據(jù)訓(xùn)練。

這些專家模型之間通過一種軟件路由或負載平衡器聯(lián)在一起，收到推理請求后決定具體向哪個模型推送提示詞。

這一策略與GPT-4和谷歌Gemini等做法形成鮮明對比，巨頭大多希望創(chuàng)建一個能泛化到數(shù)百萬個任務(wù)的巨型模型。

分析師認為技術(shù)上可能谷歌的做法性能更強，但SambaNova的方法對企業(yè)來說更實用。

沒有任何一個模型或人能完整訪問企業(yè)的所有數(shù)據(jù)，限制每個部門能訪問的專家模型，就能限制他們能訪問的數(shù)據(jù)。

斯坦福系芯片公司，華人工程師主力

SambaNova成立于2017年，2020年之前都比較低調(diào)。

聯(lián)創(chuàng)3人都是斯坦福背景，連產(chǎn)品系列名Cardinal（深紅色）都是斯坦福的昵稱與代表顏色。

CEO Rodrigo Liang是前Sun/甲骨文工程副總裁，也有人將這個名字解讀為暗指甲骨文老對頭IBM的DeepBlue（深藍）。

另外兩位聯(lián)合創(chuàng)始人都是斯坦福教授。

CTOKunle Olukotun是電氣工程教授，因多核芯片架構(gòu)方面的研究而聞名，開發(fā)了首批支持線程級推測 (TLS) 的芯片之一。

Christopher Ré是計算機科學副教授，重點研究方向機器學習和數(shù)據(jù)分析的速度和可擴展性。

此外團隊中還有不少華人工程師。

從官網(wǎng)公開信息來看，SambaNova的領(lǐng)導(dǎo)團隊中，至少有3名華人。

Jonathan Chang，擁有UC伯克利的機械工程學士學位以及南加州大學的MBA學位。

他在構(gòu)建高增長方面擁有20多年的經(jīng)驗。加入SambaNova之前，Chang在特斯拉工作了近9年。

Marshall Choy，此前曾擔任甲骨文公司系統(tǒng)產(chǎn)品管理和解決方案開發(fā)副總裁，監(jiān)督了數(shù)十個行業(yè)的企業(yè)硬件和軟件產(chǎn)品的上市。

Penny Li，在EDA工具和微處理器設(shè)計方面擁有超過27年的經(jīng)驗。此前，她曾在IBM和甲骨文工作過。

如果去領(lǐng)英搜索還能發(fā)現(xiàn)更多華人團隊成員。

目前SambaNova包含SN40L芯片的人工智能引擎已上市，但定價沒有公開。

根據(jù)Rodrigo Liang的說法，8個SN40L組成的集群總共可處理5萬億參數(shù)，相當于70個700億參數(shù)大模型。

全球2000強的企業(yè)只需購買兩個這樣的8芯片集群，就能滿足所有大模型需求。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

gpu

gpu

+關(guān)注

關(guān)注
28

文章
4777

瀏覽量
129362
英偉達

英偉達

+關(guān)注

關(guān)注
22

文章
3848

瀏覽量
91995
AI芯片

AI芯片

+關(guān)注

關(guān)注
17

文章
1906

瀏覽量
35219

原文標題：1.5T內(nèi)存挑戰(zhàn)英偉達！8枚芯片撐起3個GPT-4，華人AI芯片獨角獸估值365億

文章出處：【微信號：WW_CGQJS，微信公眾號：傳感器技術(shù)】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

億鑄科技榮登2024創(chuàng)業(yè)邦100未來獨角獸榜單

在第16屆創(chuàng)業(yè)邦100未來獨角獸峰會上，億鑄科技以其在AI大算力芯片領(lǐng)域的杰出成就和巨大潛力，榮登“2024創(chuàng)業(yè)邦100未來獨角獸”榜單。這

發(fā)表于 12-28 15:49 ?443次閱讀

匯頂科技擬并購芯片獨角獸云英谷

近日，半導(dǎo)體領(lǐng)域再次發(fā)生一起引人注目的并購事件。國內(nèi)知名芯片企業(yè)匯頂科技宣布，計劃通過發(fā)行股份及支付現(xiàn)金的方式，收購芯片獨角獸云英谷的控制權(quán)。

發(fā)表于 12-03 12:59 ?554次閱讀

Tenstorrent獲7億美元融資，貝索斯參投挑戰(zhàn)英偉達

AI芯片初創(chuàng)公司Tenstorrent近日宣布獲得高達7億美元的融資，公司估值也隨之攀升至26億

發(fā)表于 12-03 11:07 ?371次閱讀

英偉達加速認證三星AI內(nèi)存芯片

近日，英偉達公司正在積極推進對三星AI內(nèi)存芯片的認證工作。據(jù)英偉

發(fā)表于 11-25 14:34 ?306次閱讀

億鑄科技榮登中國潛在獨角獸企業(yè)榜單

在近日舉辦的“2024中國潛在獨角獸企業(yè)發(fā)展大會”上，長城戰(zhàn)略咨詢隆重發(fā)布了《GEI中國潛在獨角獸企業(yè)研究報告2024》，深度剖析了中國潛在獨角獸企業(yè)的最新發(fā)展動態(tài)。該報告連續(xù)第五年發(fā)布，億

發(fā)表于 11-18 10:12 ?479次閱讀

主線科技榮登中國潛在獨角獸企業(yè)榜單

日前，長城咨詢重磅發(fā)布2024年GEI中國潛在獨角獸企業(yè)榜單及研究報告。主線科技憑借卓越的技術(shù)硬實力、前瞻性的市場布局以及持續(xù)的創(chuàng)新活力，從眾多競爭者中脫穎而出，榮獲“潛在獨角獸”稱號。中國潛在

發(fā)表于 11-12 17:17 ?647次閱讀

連續(xù)3年！路凱智行榮登中國潛在獨角獸榜單

超過十年，獲得過私募投資，且尚未上市，最近一輪融資的投后估值超過（含）10億美元的企業(yè)。潛在獨角獸企業(yè)則一般是獲得過私募投資，且尚未上市，成立5年之內(nèi)，最新一輪融資

發(fā)表于 11-04 13:32 ?378次閱讀

AI芯片巨頭英偉達漲超4% 英偉達市值暴增7500億

行業(yè)股票開始反彈，那么英偉達公司的股票將是個不錯的選擇。還有瑞穗證券（Mizuho）也認為英偉達公司的股價仍有很大的上漲空間。 ? ? ?美

發(fā)表于 08-13 15:33 ?1165次閱讀

估值160億，背靠國產(chǎn)傳感器首富，浙江誕生中國唯一民營晶圓代工獨角獸

此前，胡潤研究院發(fā)布《2024全球獨角獸榜》，列出了全球成立于2000年之后，價值10億美元以上的非上市公司。 ? 其中，來自浙江寧波的晶圓制造企業(yè)——榮芯半導(dǎo)體，估值160

發(fā)表于 08-02 08:44 ?2804次閱讀

2023年中國傳感器跑出9家獨角獸公司，總估值達1807億！（附全名單）

核聚變、GPU芯片、半導(dǎo)體材料、氫能、新型儲能、合成生物等領(lǐng)域加快涌現(xiàn)獨角獸企業(yè)。集成電路、清潔能源、商業(yè)航天等前沿科技領(lǐng)域獨角獸企業(yè)數(shù)量占比近七成（249家），新晉獨角獸企業(yè)中這一比

發(fā)表于 06-20 15:43 ?7440次閱讀

200億，這里崛起一個半導(dǎo)體超級獨角獸

，最終入局的包括了國家級基金、地方國資、半導(dǎo)體專業(yè)基金及券商系基金等陣容。根據(jù)增資比例計算，時代半導(dǎo)體估值超200億，堪稱湖南年度最大獨角獸。而透過這只

發(fā)表于 05-30 10:48 ?525次閱讀

進一步解讀英偉達 Blackwell 架構(gòu)、NVlink及GB200 超級芯片

，通過英偉達高帶寬接口（NV-HBI）將兩個最大可制造芯片合并為一個圖形處理器單元，支持10TB/s帶寬，形成高效的通信通道，提升整體性能。

發(fā)表于 05-13 17:16

東風嵐圖以305億元估值入選《2024全球獨角獸榜》

4月9日，胡潤研究院發(fā)布《2024全球獨角獸榜》列出全球成立于2000年之后價值10億美元以上的非上市公司

發(fā)表于 04-12 09:21 ?458次閱讀

深蘭科技再次入圍《2024胡潤全球獨角獸榜》

4月9日，胡潤研究院于廣州發(fā)布了《2024全球獨角獸榜》，榜單列出了全球成立于2000年之后，企業(yè)估值價值在10億美元以上的非上市公司。深蘭

發(fā)表于 04-11 09:17 ?723次閱讀

英國AI芯片獨角獸Graphcore考慮出售

近日，英國AI芯片領(lǐng)域的獨角獸企業(yè)Graphcore陷入財務(wù)困境，據(jù)傳正在考慮出售給海外買家以籌集新資金并彌補嚴重虧損。據(jù)外媒報道，Graphcore正與多家主要科技公司探討潛在交易，其中包括英國半導(dǎo)體IP巨頭Arm、日本軟銀集

發(fā)表于 02-19 13:46 ?676次閱讀