衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

云知聲山海大模型位居全球大模型第一梯隊

云知聲 ? 來源:云知聲 ? 2024-09-12 14:41 ? 次閱讀

SuperCLUE發布《中文大模型基準測評2024上半年報告》,報告選取國內外有代表性的33個大模型在6月份的版本,通過多維度綜合性測評,對國內外大模型發展現狀進行觀察與思考。

報告顯示,云知聲山海大模型在本次半年度評測中取得總分72的優異成績,與360gpt2-pro、字節跳動豆包、月之暗面Kimi、百川智能Baichuan4并列國內大模型第四,穩居全球大模型第一梯隊。

SuperCLUE作為國內權威通用大模型綜合性測評基準,其前身可追溯至第三方中文語言理解評估基準CLUE(The Chinese Language Understanding Evaluation)。自2019年成立以來,CLUE基準一直致力于提供科學、客觀、中立的語言模型評測,其先后推出了CLUE、FewCLUE、KgCLUE、DataCLUE等多個被廣泛認可的評估標準。根據CLUE多年測評經驗,SuperCLUE基于通用大模型在學術、產業與用戶側的廣泛應用,構建了多層次、多維度的綜合性測評基準。

作為一個完全獨立的第三方評測機構,SuperCLUE采用自動化評測技術,有效消除人為因素帶來的不確定性,確保提供無偏倚的客觀評測結果。不同于傳統測評通過選擇題形式的測評,SuperCLUE納入開放主觀問題的測評,通過多維度多視角多層次的評測體系以及對話的形式,模擬大模型的應用場景,真實有效考察模型生成能力。與此同時,SuperCLUE根據全球的大模型技術發展趨勢,不斷升級迭代測評體系、測評維度和方法,以保證盡可能精準量化大模型的技術演進程度。

為進一步真實反映大模型能力,本次通用測評采用多維度、多層次的綜合性測評方案,由理科、文科和Hard三大維度構成:理科任務分為計算、邏輯推理、代碼測評集;文科任務分為知識百科、語言理解、長文本、角色扮演、生成與創作、安全和工具使用七大測評集;Hard任務聚焦精確指令遵循測評集,未來將陸續推出復雜多步推理和高難度問題解決等評測。

從代表通用能力的一級總分來看,山海大模型得分72,與360gpt2-pro、字節跳動豆包、月之暗面Kimi、百川智能Baichuan4并列國內大模型第四,位居全球大模型第一梯隊。

具體到二級維度得分,山海大模型在理科和文科領域均表現優異——在理科能力方面,山海大模型以76分的高分緊隨GPT-4o、GPT-4-Turbo-0409之后,力壓一眾國內大模型,并列排名國內第一;文科能力以75分的成績并列國內第二,實力同樣不容小覷。

在SuperCLUE基于基礎能力和應用能力兩個維度構建的模型象限圖中,山海大模型被定位為“卓越領導者”。這一分類反映了山海大模型在基礎和場景應用能力上均達到了領先水平,持續引領國內大模型技術發展和創新。

此外,與GPT4-Turbo-0409的對戰勝率統計數據顯示,山海勝率為17.67%,和率為65.37%,位列國內大模型第五,整體實力依舊不俗。

自2023年5月問世以來,山海大模型已相繼在C-Eval全球大模型綜合性評測、OpenCompass大模型評測、MedBench評測等多個權威評測中屢創佳績,充分展現出業界一流的通用能力和領先于世界的行業大模型能力。

正如報告所言,隨著技術進步和應用場景拓展,2024年下半年國內外大模型市場競爭將持續加劇,推動技術創新和產業升級。接下來,云知聲將繼續保持大模型能力穩步提升,以山海為抓手,在產業側實現加速落地,致力成為真正助力各行各業的“新質生產力”。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 云知聲
    +關注

    關注

    0

    文章

    195

    瀏覽量

    8418
  • 字節跳動
    +關注

    關注

    0

    文章

    333

    瀏覽量

    9028
  • 大模型
    +關注

    關注

    2

    文章

    2545

    瀏覽量

    3164

原文標題:SuperCLUE 2024半年度報告:云知聲山海大模型位居全球大模型第一梯隊,理科能力國內并列第一,文科能力并列國內第二

文章出處:【微信號:云知聲,微信公眾號:云知聲】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    商湯科技位列GenAI IaaS領域第一梯隊

    國際權威咨詢機構IDC近日發布《中國智算服務市場(2024上半年)跟蹤》報告。報告顯示,2024年上半年,商湯科技作為國內領先的智算服務商,以13.3%的市場份額穩居GenAI IaaS市場Top3,位列GenAI IaaS領域第一梯隊
    的頭像 發表于 12-24 09:23 ?382次閱讀

    與英內物聯簽署戰略合作協議 探索基于山海模型的多元智慧場景

    ?? 12月6日,(上海)智能科技有限公司(以下簡稱““)與上海英內物聯網科技股份有
    的頭像 發表于 12-06 20:05 ?925次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b>與英內物聯簽署戰略合作協議 探索基于<b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>的多元智慧場景

    榮登2024大模型企業TOP50榜單

    近日,智領未來·向新而行—2024人工智能大模型產業大會在京召開,會上揭曉2024大模型企業TOP50榜單,榮登榜單,
    的頭像 發表于 11-29 17:52 ?575次閱讀

    商湯日日新·商量大模型位列國內大模型第一梯隊

    剛剛,中文大模型測評基準SuperCLUE發布《中文大模型基準測評2024年10月報告》。
    的頭像 發表于 11-08 15:38 ?464次閱讀

    山海模型多項能力全球領跑

    國內人工智能權威機構清華大學基礎模型研究中心發布SuperBench九月綜合榜單。本次評測選取海內外24個具有代表性的大模型,結果顯示,山海模型對齊、智能體、安全等多項能力
    的頭像 發表于 10-12 14:30 ?474次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>多項能力<b class='flag-5'>全球</b>領跑

    山海模型的訓練優化方法及應用實踐

    由AI大模型工場主辦的AI大模型生態暨算力大會在京舉行。作為國內最具影響力與最懂大模型的AI生態大會,此次大會以「AI NATIVE,生成未來」為主題,圍繞大模型、算力、數據產業、基礎
    的頭像 發表于 10-12 14:12 ?319次閱讀

    山海多模態大模型UniGPT-mMed登頂MMMU測評榜首

    近日,多模態人工智能模型基準評測集MMMU更新榜單,山海多模態大模型UniGPT-mMed
    的頭像 發表于 10-12 14:09 ?338次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>多模態大<b class='flag-5'>模型</b>UniGPT-mMed登頂MMMU測評榜首

    山海模型醫療專業能力全球第一

    近日,由上海AI實驗室和上海市數字醫學創新中心聯合推出的MedBench評測更新榜單,繼4月份奪冠后,山海模型醫療行業版(UniGP
    的頭像 發表于 09-19 15:47 ?411次閱讀

    山海模型助力司法領域智慧化升級

    近期,成功助力上海市徐匯區虹梅街道司法所打造基于山海模型的司法領域應用,極大提升了司法服務的可及性與便利性。這不僅是
    的頭像 發表于 09-12 14:44 ?647次閱讀

    推出山海多模態大模型

    在人工智能技術的浩瀚星海中,多模態交互技術正成為引領未來的新航標。繼OpenAI的GPT-4o掀起滔天巨浪后,以創新之姿,推出了其匠心獨運的山海多模態大
    的頭像 發表于 08-27 15:20 ?436次閱讀

    GenAI IaaS增速驚人,商湯科技躋身第一梯隊

    ,與火山引擎、阿里巴巴共同躋身2023年下半年中國GenAI IaaS服務廠商TOP 3,以顯著的市場份額優勢位居GenAI IaaS領域的第一梯隊
    的頭像 發表于 07-30 11:00 ?873次閱讀
    GenAI IaaS增速驚人,商湯科技躋身<b class='flag-5'>第一梯隊</b>

    在邊緣側大模型技術探索和應用

    解決的課題。 2024高工智能汽車開發者大會暨艙駕智能與跨域論壇上,智慧座艙解決方案中心總經理鮑晴峰以《邊緣側大模型帶來智能座艙交互新體驗》為題,分享了
    的頭像 發表于 06-29 15:30 ?895次閱讀

    曝華為Mate 70將迎重大突破,性能重回第一梯隊!

    會很明顯,將重回第一梯隊,而最快9月份發布。 此外,華為Mate 70系列的備貨量相比Mate 60系列將有顯著提升,預計增長幅度在40%至50%之間。 這意味著相較于Mate 60系列的供應緊張情況,Mate 70系列的市場供應壓力將大為緩解。 在這之前,就已經有消息稱,華為的新麒麟CPU已調試很好,
    的頭像 發表于 05-17 09:22 ?412次閱讀

    山海模型醫療行業版登頂上海AI實驗室權威大模型評測榜

    近日,上海AI實驗室和上海市數字醫學創新中心聯合推出的MedBench評測更新榜單,山海模型醫療行業版(UNIGPT-MED) 以綜
    的頭像 發表于 04-24 14:28 ?1908次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>醫療行業版登頂上海AI實驗室權威大<b class='flag-5'>模型</b>評測榜

    山海模型再赴港IPO

    智能科技股份有限公司(簡稱“”)于3月15日更新了招股書,繼續其在港交所主板上市的步
    的頭像 發表于 03-22 14:51 ?763次閱讀
    大发888网页版下载| 大发888下载删除| 金冠娱乐城怎么样| 36棋牌的深海捕鱼| 克拉克百家乐官网下载| 百家乐官网街机游戏下载| 百家乐官网唯一能长期赢钱的方法| 视频百家乐破解| 立博国际博彩公司| 线上百家乐官网开户| 钱隆百家乐官网破解版| 百家乐五湖四海娱乐网| 大发888公司赌场| 视频百家乐官网游戏| 网上百家乐的打法| 大赢家博彩网| 百家乐官网怎么完才能嬴| 百家乐投注平台| 大发888游戏平台hg dafa 888 gw| 六合彩最快开奖| 博彩网百家乐官网的玩法技巧和规则 | 利都百家乐国际娱乐场| 利来博彩通| 百家乐官网翻天qvod| 天格数16土人格24火地格数19水| 太阳城丝巾| 百家乐官网德州桌| 百家乐购怎么样| 汝州市| 网上百家乐注册彩金| bet365备用| 百家乐官网专用| 大发888娱乐城下| 百家乐官网龙虎台布| 在线百家乐策| 澳门百家乐官网是骗人的| 游艇会百家乐官网的玩法技巧和规则 | 大发888棋牌游戏| 百家乐官网最新庄闲投注法| 百家乐高科技出千工具| 浩博百家乐官网娱乐城|