11月27日,浪潮信息發布"源2.0"基礎大模型,并宣布全面開源。源2.0基礎大模型包括1026億、518億、21億等三種參數規模的模型,在編程、推理、邏輯等方面展示出了先進的能力。
當前,大模型技術正在推動生成式人工智能產業迅猛發展,而基礎大模型的關鍵能力則是大模型在行業和應用落地能力表現的核心支撐,但基礎大模型的發展也面臨著在算法、數據和算力等方面的諸多挑戰。源2.0基礎大模型則針對性地提出了新的改進方法并獲得了能力的提升。
算法方面,源2.0提出并采用了一種新型的注意力算法結構:局部注意力過濾增強機制(LFA:Localized Filtering-based Attention)。LFA通過先學習相鄰詞之間的關聯性,然后再計算全局關聯性的方法,能夠更好地學習到自然語言的局部和全局的語言特征,對于自然語言的關聯語義理解更準確、更人性,提升了模型的自然語言表達能力,進而提升了模型精度。
數據方面,源2.0通過使用中英文書籍、百科、論文等高質量中英文資料,降低了互聯網語料內容占比,結合高效的數據清洗流程,為大模型訓練提供了高質量的專業數據集和邏輯推理數據集。為了獲取中文數學數據,我們清洗了從2018年至今約12PB的互聯網數據,但僅獲取到了約10GB的數學數據,投入巨大,收益較小。為了更高效地獲得相對匱乏的高質量中文數學及代碼數據集,源2.0采用了基于大模型的數據生產及過濾方法,在保證數據的多樣性的同時也在每一個類別上提升數據質量,獲取了一批高質量的數學與代碼預訓練數據。
算力方面,源2.0采用了非均勻流水并行的方法,綜合運用流水線并行+優化器參數并行+數據并行的策略,讓模型在流水并行各階段的顯存占用量分布更均衡,避免出現顯存瓶頸導致的訓練效率降低的問題,該方法顯著降低了大模型對芯片間P2P帶寬的需求,為硬件差異較大訓練環境提供了一種高性能的訓練方法。
源2.0作為千億級基礎大模型,在業界公開的評測上進行了代碼生成、數學問題求解、事實問答方面的能力測試,測試結果顯示,源2.0在多項模型評測中,展示出了較為先進的能力表現。
源2.0采用全面開源策略,全系列模型參數和代碼均可免費下載使用。
審核編輯:湯梓紅
-
半導體
+關注
關注
334文章
27715瀏覽量
222674 -
浪潮
+關注
關注
1文章
468瀏覽量
23947 -
大模型
+關注
關注
2文章
2551瀏覽量
3172
發布評論請先 登錄
相關推薦
浪潮信息與智源研究院攜手共建大模型多元算力生態
浪潮信息與智源研究院達成戰略合作協議
浪潮信息發布"源"Yuan-EB,刷新RAG檢索最高成績
浪潮信息發布“源”Yuan-EB助力RAG檢索精度新高
![<b class='flag-5'>浪潮信息</b><b class='flag-5'>發布</b>“<b class='flag-5'>源</b>”Yuan-EB助力RAG檢索精度新高](https://file1.elecfans.com/web2/M00/0D/4B/wKgaomdFY7uAIpEfAAAgMc9jFXk015.png)
浪潮信息發布AIStation V5,全面支持大模型開發流程與高效算力調度
![<b class='flag-5'>浪潮信息</b><b class='flag-5'>發布</b>AIStation V5,<b class='flag-5'>全面</b>支持大<b class='flag-5'>模型</b>開發流程與高效算力調度](https://file1.elecfans.com//web2/M00/FC/26/wKgaomaP2-eAaFFDAAFr8QTjDb8468.jpg)
為大模型專門優化 浪潮信息發布分布式全閃存儲AS13000G7-N系列
![為大<b class='flag-5'>模型</b>專門優化 <b class='flag-5'>浪潮信息</b><b class='flag-5'>發布</b>分布式全閃存儲AS13000G7-N系列](https://file1.elecfans.com//web2/M00/E3/EB/wKgZomY93LqAB0zmAACk7cG7-Us233.jpg)
浪潮信息發布為大模型專門優化的分布式全閃存儲AS13000G7-N系列
![<b class='flag-5'>浪潮信息</b><b class='flag-5'>發布</b>為大<b class='flag-5'>模型</b>專門優化的分布式全閃存儲AS13000G7-N系列](https://file1.elecfans.com/web2/M00/E2/15/wKgZomY61--ATpyVAAALqqPGbD8415.jpg)
浪潮信息“元腦”品牌全面升級,全力進擊人工智能!
![<b class='flag-5'>浪潮信息</b>“元腦”品牌<b class='flag-5'>全面</b>升級,全力進擊人工智能!](https://file1.elecfans.com/web2/M00/CF/42/wKgZomYh2lyADlK9AAANUbNvv98911.jpg)
浪潮信息發布企業大模型開發平臺“元腦企智”EPAI
![<b class='flag-5'>浪潮信息</b><b class='flag-5'>發布</b>企業大<b class='flag-5'>模型</b>開發平臺“元腦企智”EPAI](https://file1.elecfans.com/web2/M00/CD/2F/wKgaomYggfiAUJ84AAANX-qM0HU927.jpg)
浪潮信息"源2.0"大模型YuanChat支持英特爾最新商用AI PC
![<b class='flag-5'>浪潮信息</b>"<b class='flag-5'>源</b><b class='flag-5'>2.0</b>"大<b class='flag-5'>模型</b>YuanChat支持英特爾最新商用AI PC](https://file1.elecfans.com//web2/M00/C6/02/wKgZomYEMqWAGh5CAAGNLjfb0sc454.jpg)
浪潮信息與英特爾合作推出一種大模型效率工具“YuanChat”
![<b class='flag-5'>浪潮信息</b>與英特爾合作推出一種大<b class='flag-5'>模型</b>效率工具“YuanChat”](https://file1.elecfans.com/web2/M00/C6/D3/wKgaomYDs-iAXotIAAFZxWMgFo8771.jpg)
評論