衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI初創企業推MoE混合專家模型架構新品abab 6.5

微云疏影 ? 來源:綜合整理 ? 作者:綜合整理 ? 2024-04-17 15:06 ? 次閱讀

4 月 17 日,國內人工智能初創公司 MiniMax 稀宇科技宣布推出采用混合專家模型架構的 losoev 6.5 系列模型,其核心性能已接近 GPT-4、Claude-3 和 Gemini-1.5。

losoev 6.5 系列包含兩款模型:

losoev 6.5:擁有萬億級別的參數,可處理 200k tokens 的上下文長度;

losoev 6.5s:與 losoev 6.5 共享相同的訓練技術和數據,但效率更高,同樣支持 200k tokens 的上下文長度,且能夠在 1 秒鐘內處理近 3 萬字的文本。

自今年 1 月份推出國內首款基于 MoE 架構的 losoev 6 模型以來,MiniMax 通過優化模型架構、重建數據管道、改進訓練算法以及實施并行訓練策略等手段,在加速模型擴展方面取得了顯著進展。

在 200k token 的范圍內,官方對 losoev 6.5 進行了業內常見的“大海撈針”測試,即將一句與原文無關的句子插入長文本中,然后通過自然語言詢問模型,觀察其能否準確識別出這句話。經過 891 次測試,losoev 6.5 均能準確回答問題。

losoev 6.5 和 losoev 6.5s 模型將逐步應用于 MiniMax 旗下的產品,如海螺 AI 和 MiniMax 開放平臺。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4630

    瀏覽量

    93354
  • 人工智能
    +關注

    關注

    1796

    文章

    47666

    瀏覽量

    240282
  • 模型
    +關注

    關注

    1

    文章

    3305

    瀏覽量

    49220
收藏 人收藏

    評論

    相關推薦

    法國AI初創企業Mistral AI計劃IPO

    法國AI領域的初創企業Mistral AI近日宣布了其未來的發展藍圖。公司創始人兼首席執行官Arthur Mensch明確表示,Mistral AI
    的頭像 發表于 01-24 13:58 ?219次閱讀

    企業AI模型托管怎么做的

    當下,越來越多的企業選擇將AI模型托管給專業的第三方平臺,以實現高效、靈活和安全的模型運行。下面,AI部落小編為您介紹
    的頭像 發表于 01-15 10:10 ?76次閱讀

    企業AI模型部署攻略

    當下,越來越多的企業開始探索和實施AI模型,以提升業務效率和競爭力。然而,AI模型的部署并非易事,需要
    的頭像 發表于 12-23 10:31 ?171次閱讀

    獵戶星空發布Orion-MoE 8×7B大模型AI數據寶AirDS

    。 Orion-MoE 8×7B是獵戶星空精心打造的開源混合架構專家模型,該模型擁有高達8×7
    的頭像 發表于 11-29 13:57 ?304次閱讀

    騰訊發布開源MoE大語言模型Hunyuan-Large

    近日,騰訊公司宣布成功推出業界領先的開源MoE(Mixture of Experts,專家混合)大語言模型——Hunyuan-Large。這款模型
    的頭像 發表于 11-06 10:57 ?371次閱讀

    昆侖萬維開源2千億稀疏大模型Skywork-MoE

    近日,昆侖萬維公司宣布開源一款名為Skywork-MoE的稀疏大模型,該模型擁有高達2千億參數,不僅性能強勁,而且推理成本更低,為人工智能領域帶來了新的突破。
    的頭像 發表于 06-04 14:44 ?621次閱讀

    浪潮信息發布“源2.0-M32”開源大模型

    浪潮信息近日推出了革命性的“源2.0-M32”開源大模型。該模型在源2.0系列基礎上,引入了“基于注意力機制的門控網絡”技術,構建了一個包含32個專家混合
    的頭像 發表于 05-29 09:08 ?722次閱讀

    騰訊云大模型價格調整:混元-lite、混元-standard免費,混元-pro降價

    據了解,騰訊混元大模型是騰訊全鏈路自研的萬億參數大模型,采用混合專家模型MoE)結構,
    的頭像 發表于 05-23 17:05 ?1055次閱讀

    人大系初創公司智子引擎發布全新多模態大模型Awaker 1.0

    人大系初創公司智子引擎近日震撼發布了新一代多模態大模型Awaker 1.0,這一里程碑式的成果標志著公司在通用人工智能(AGI)領域取得了重要突破。與前代ChatImg序列模型相比,Awaker 1.0憑借其獨特的
    的頭像 發表于 05-06 09:59 ?666次閱讀

    MOE與MOT:提升LLM效能的關鍵策略比較

    MoE 與 MoT:在專家混合中(左),每個令牌都被路由到不同的專家前饋層。在令牌混合(右)中,每組內的令牌被
    的頭像 發表于 04-15 09:53 ?972次閱讀
    <b class='flag-5'>MOE</b>與MOT:提升LLM效能的關鍵策略比較

    AI初創企業Suno發布首款音樂AI生成模型SunoV3

    美國人工智能初創企業Suno近日震撼發布其首款音樂AI生成模型——SunoV3。這款創新產品已正式登陸其官方網站,并向所有用戶免費開放使用,標志著音樂創作領域邁入了全新的智能化時代。
    的頭像 發表于 03-26 09:17 ?1208次閱讀

    英特爾與Arm聯手助力初創企業開發Arm架構SoC

    據介紹,此次合作旨在聯合推動使用Intel 18A制程工藝研發Arm架構SoC的初創企業發展。英特爾和Arm將攜手提供IP和制造及相關金融支持,助力初創
    的頭像 發表于 03-25 15:34 ?470次閱讀

    微軟支付6.5億美元獲得Inflection AIAI模型授權

    微軟近日宣布向人工智能初創公司Inflection AI支付高達6.5億美元的巨額資金,這一舉動在業內引起了廣泛關注。據悉,這筆資金主要用于獲得Inflection AI
    的頭像 發表于 03-25 10:39 ?544次閱讀

    蘋果發布300億參數MM1多模態大模型

    近日,科技巨頭蘋果公司在一篇由多位專家共同撰寫的論文中,正式公布了其最新的多模態大模型研究成果——MM1。這款具有高達300億參數的多模態模型系列,由密集模型
    的頭像 發表于 03-19 11:19 ?954次閱讀

    微軟攜手法國AI初創企業Mistral推動AI模型商業化

    微軟近日與法國人工智能初創企業Mistral達成合作協議,旨在推動AI模型的商業化應用。據悉,微軟將提供全方位支持,幫助這家成立僅10個月的公司將其先進的
    的頭像 發表于 02-28 10:23 ?615次閱讀
    百家乐2号死机| 百家乐官网赢钱| 网络篮球投注| 六合彩公司| bet365注册哪家好 | 新全讯网xb112| 威尼斯人娱乐城安全吗| 伯爵百家乐的玩法技巧和规则 | 百家乐官网棋牌外挂| 至尊百家乐官网奇热| 百家乐官网长龙如何判断| 百家乐官网客户端下载| 百家乐官网平台是最好的娱乐城| 百家乐官网网投注| 高科技百家乐官网牌具| 功夫百家乐官网的玩法技巧和规则| 百家乐官网怎样下注| 至尊百家乐停播| 送彩金百家乐平台| 888百家乐的玩法技巧和规则 | 德州扑克网上平台| 新葡京娱乐| 百家乐官网玩法百科| 百家乐官网的路图片| 百家乐官网策略介绍| 娱乐场百家乐大都| 神州百家乐的玩法技巧和规则| 大发888-娱乐平台| 隆德县| 百家乐官网系统分析器| 百家乐官网网站建设| 破战百家乐官网的玩法技巧和规则| 百家乐过两关| 大发888下载客户端| 网上百家乐官网心得| 百家乐官网扎金花现金| 澳门百家乐群策略| 958棋牌游戏| 百家乐官网隔一数打投注法 | 百家乐玩法教学视频| 大发888官方网下载|