兩大AI模型性能提升登上國際榜單

近日，由盛大AI團(tuán)隊(duì)研發(fā)的模型Watt-tool-70B和Newsbang/homer-72B，登上國際知名AI排行榜榜首。其中，Watt-tool-70B是由盛大旗下Watt團(tuán)隊(duì)研發(fā)的旗艦?zāi)Ｐ停壳拔涣蠦FCL Leaderboard總榜單第一。

據(jù)悉，榜單BFCL Leaderboard是由加州大學(xué)伯克利分校開發(fā)的評(píng)估LLM工具調(diào)用能力基準(zhǔn)測試平臺(tái)。作為目前大語言模型(LLM)最熱門的研究方向之一，工具調(diào)用(Function-Calling)是為了讓LLM理解，并能準(zhǔn)確使用API(應(yīng)用程序編程接口)，來執(zhí)行更復(fù)雜而具體的任務(wù)。在近期公布的最新一輪評(píng)估結(jié)果中，Watt的“多輪對話執(zhí)行能力”相較于排名第二的GPT-4o 領(lǐng)先11分，比排名第十的Gemini-1.5-Pro 領(lǐng)先近40分。

“這個(gè)模型將加速大模型落地‘融合’過程。”Watt有關(guān)負(fù)責(zé)人說，還有助于從底層數(shù)據(jù)標(biāo)注到人機(jī)交互的體系化建設(shè)，讓大模型初步實(shí)現(xiàn)從“光說不練”到“能文能武”。

此外，由盛大集團(tuán)NewsBang團(tuán)隊(duì)開發(fā)的Newsbang/homer-72B 模型位列Open LLM LeaderBoard v2榜單第一。Open LLM Leaderboard V2是由Hugging Face維護(hù)的開源語言模型評(píng)測平臺(tái)升級(jí)版本，采用更全面和嚴(yán)格評(píng)估標(biāo)準(zhǔn)，對各類開源大語言模型進(jìn)行多維度測試和排名。Newsbang/homer-72B重視提升模型在推理和思考方面的能力，通過搭配數(shù)據(jù)篩選機(jī)制等，在多個(gè)核心評(píng)測維度，該模型性能有了大幅提升。

據(jù)公開報(bào)道，2023年初，盛大集團(tuán)宣布All in AI戰(zhàn)略，去年10月，聯(lián)合多家高校發(fā)表了AI與長期記憶方面的論文，其自研的OMNE大模型多智能體框架登上GAIA 基準(zhǔn)測試排行榜榜首;其旗下的天橋腦科學(xué)研究院(TCCI)與國際學(xué)術(shù)雜志《Science》合作推出全球AI驅(qū)動(dòng)科學(xué)大獎(jiǎng)，舉辦和支持包括“AI+精神健康”在內(nèi)的各種高水平國際會(huì)議和夏校項(xiàng)目，助力培養(yǎng)跨學(xué)科青年AI人才等。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

AI

AI

+關(guān)注

關(guān)注
87

文章
31513

瀏覽量
270314
人工智能

人工智能

+關(guān)注

關(guān)注
1796

文章
47666

瀏覽量
240268
語言模型

語言模型

+關(guān)注

關(guān)注
0

文章
538

瀏覽量
10340

評(píng)論

相關(guān)推薦

商湯科技推出“日日新”融合大模型

剛剛，商湯正式推出“日日新”融合大模型，領(lǐng)先實(shí)現(xiàn)原生融合模態(tài)，深度推理能力與多模態(tài)信息處理能力均大幅提升，并在兩大權(quán)威評(píng)測榜單奪得第一，成為“雙冠王”。

發(fā)表于 01-10 15:59 ?270次閱讀

格陸博科技榮登兩大權(quán)威機(jī)構(gòu)榜單

近日，格陸博科技憑借其卓越的技術(shù)實(shí)力和市場表現(xiàn)力，榮登《2024年度中國智能電動(dòng)汽車核心零部件100強(qiáng)》和《2024創(chuàng)業(yè)邦100未來獨(dú)角獸》兩大權(quán)威機(jī)構(gòu)榜單。

發(fā)表于 12-26 09:18 ?325次閱讀

谷歌正式發(fā)布Gemini 2.0 性能提升近兩倍

在智能體時(shí)代，谷歌再次引領(lǐng)技術(shù)潮流，正式發(fā)布了其最新力作——Gemini 2.0。這款AI模型不僅在性能上實(shí)現(xiàn)了顯著提升，更是在多模態(tài)表現(xiàn)和原生工具應(yīng)用方面展現(xiàn)了前所未有的強(qiáng)大功能。

發(fā)表于 12-12 14:22 ?404次閱讀

云知聲榮登2024全球AIGC先鋒者系列榜單

近日，由PEC China、至頂科技、軟積木主辦的“2024 AI創(chuàng)新者大會(huì)暨PEC提示工程峰會(huì)”在北京舉行，會(huì)上發(fā)布“2024全球AIGC先鋒者系列榜單”，云知聲入選“2024全球AIGC先鋒50強(qiáng)”“2024全球AIGC大模型

發(fā)表于 11-21 14:14 ?288次閱讀

AI模型部署和管理的關(guān)系

AI模型的部署與管理是AI項(xiàng)目成功的兩大支柱，它們之間既相互獨(dú)立又緊密相連，共同推動(dòng)著AI技術(shù)從實(shí)驗(yàn)室走向?qū)嶋H應(yīng)用。

發(fā)表于 11-21 10:02 ?214次閱讀

NPU技術(shù)如何提升AI性能

隨著人工智能技術(shù)的飛速發(fā)展，深度學(xué)習(xí)作為AI領(lǐng)域的核心驅(qū)動(dòng)力，對計(jì)算能力的需求日益增長。NPU技術(shù)應(yīng)運(yùn)而生，為AI性能的提升提供了強(qiáng)大的硬件支持。 NPU技術(shù)概述 NPU是一種專門為深

發(fā)表于 11-15 09:11 ?697次閱讀

AI大模型的性能優(yōu)化方法

AI大模型的性能優(yōu)化是一個(gè)復(fù)雜而關(guān)鍵的任務(wù)，涉及多個(gè)方面和策略。以下是一些主要的性能優(yōu)化方法：一、模型壓縮與優(yōu)化

發(fā)表于 10-23 15:01 ?1011次閱讀

阿里國際發(fā)布翻譯大模型Marco

近日，阿里國際正式推出了其翻譯大模型——Marco。這款模型已在阿里國際AI官網(wǎng)Aidge上線，并向全球用戶開放使用。

發(fā)表于 10-17 16:07 ?345次閱讀

普強(qiáng)成功榮登兩大榜單

普強(qiáng)憑借其深厚的技術(shù)積累和創(chuàng)新能力，不斷推出高性能、高質(zhì)量的產(chǎn)品和解決方案，成功榮登兩大榜單，這是對普強(qiáng)卓越的技術(shù)實(shí)力和應(yīng)用層面的肯定。

發(fā)表于 09-13 10:34 ?1199次閱讀

ai大模型和ai框架的關(guān)系是什么

AI大模型和AI框架是人工智能領(lǐng)域中兩個(gè)重要的概念，它們之間的關(guān)系密切且復(fù)雜。 AI大模型的定義

發(fā)表于 07-16 10:07 ?4.9w次閱讀

AI大模型與小模型的優(yōu)缺點(diǎn)

在人工智能（AI）的廣闊領(lǐng)域中，模型作為算法與數(shù)據(jù)之間的橋梁，扮演著至關(guān)重要的角色。根據(jù)模型的大小和復(fù)雜度，我們可以將其大致分為AI大模型和

發(fā)表于 07-10 10:39 ?3589次閱讀

韓國兩大芯片公司尋求合并，以開發(fā)新一代AI芯片

在人工智能芯片設(shè)計(jì)領(lǐng)域，韓國兩大初創(chuàng)公司Rebellions Inc.和Sapeon Korea Inc.近日宣布計(jì)劃合并，共同開發(fā)新一代AI芯片，以在激烈的國際競爭中搶占先機(jī)。

發(fā)表于 06-18 16:10 ?663次閱讀

小米大語言模型獲備案，有望應(yīng)用于汽車、手機(jī)等產(chǎn)品

早在去年8月，小米公司的MiLM大模型便首次亮相C-Eval、CMMLU兩大模型測評(píng)榜單，在C-Eval總榜單中位列第十，同參數(shù)量級(jí)排名第一

發(fā)表于 05-16 14:32 ?399次閱讀

SCHURTER碩特波蘭子公司連續(xù)兩年登上《福布斯鉆石獎(jiǎng)》榜單

SCHURTERElectronics Sp. z o.o. (碩特波蘭子公司) 連續(xù)兩年登上《福布斯鉆石獎(jiǎng)》榜單, 并被列入2018-2022年公司價(jià)值增長最快的公司名單。由于該評(píng)審涵蓋了冠狀病毒時(shí)期及其后的恢復(fù)期，這也進(jìn)一步

發(fā)表于 04-11 17:37 ?640次閱讀

潞晨科技Colossal-AI + 浪潮信息AIStation，大模型開發(fā)效率提升10倍

的潞晨科技Colossal-AI系統(tǒng)，用戶可實(shí)現(xiàn)在本地算力平臺(tái)一鍵訓(xùn)練、微調(diào)、推理、部署大模型，將大模型開發(fā)效率提升10倍以上，并將算力效率提升

發(fā)表于 03-01 09:43 ?536次閱讀

愛云資訊
企業(yè)號(hào)

516 內(nèi)容 24w+ 閱讀 1 粉絲

我要咨詢關(guān)注

Hot 奧哲與數(shù)環(huán)通達(dá)成合作，共筑企業(yè)數(shù)字化一站式轉(zhuǎn)型新生態(tài)
Hot 顛覆性創(chuàng)新技術(shù)——特斯拉土壤修復(fù)機(jī)器人！
New 通信市場新突破，維諦技術(shù)（Vertiv）獲評(píng)中國電信集團(tuán)級(jí)戰(zhàn)略供應(yīng)商
New 記三維天地?cái)?shù)智化創(chuàng)新發(fā)展歷程：懷揣夢想駕輕舟、前路漫漫亦燦燦

精選推薦
更多

文章

資料

帖子

穿過幻覺荒野，大模型RAG越野賽

腦極體
8天前

2165 閱讀

春節(jié)返鄉(xiāng)，記得帶上這全國34個(gè)省的AI人脈……

腦極體
8天前

2179 閱讀

先進(jìn)電動(dòng)汽車的電壓轉(zhuǎn)換策略在48V電動(dòng)汽車供電網(wǎng)絡(luò)中部署區(qū)域架構(gòu)

Vicor
12天前

2841 閱讀

解析汽車拋負(fù)載Load Dump：load dump產(chǎn)生原因與TVS并聯(lián)保護(hù)方案

力特奧維斯Littelfuse
12天前

2777 閱讀

泰克示波器在直流充電樁電流紋波測試中的應(yīng)用

泰克科技
12天前

2661 閱讀

物聯(lián)網(wǎng)操作系統(tǒng)設(shè)計(jì)要領(lǐng)與資料集錦

Duke
700KB

3積分

260下載

正弦波逆變器的資料和電路圖免費(fèi)下載

o_dream
0.22 MB

免費(fèi)

163下載

CoreBlog一款優(yōu)雅的博客系統(tǒng)

康輔佑
19.71 MB

免費(fèi)

0下載

JDAvatarProgress頭像自定義工具

HCPcry
0.52 MB

2積分

1下載

Amiga 500無線測向選擇器

李晶
0.01 MB

2積分

2下載

RK3588 原廠設(shè)計(jì)資料首次公開（規(guī)格書+原理圖+設(shè)計(jì)說明+DDR參考），速搶

h1654155861.7375
20小時(shí)前

117 閱讀

【貝啟科技BQ3568HM開源鴻蒙開發(fā)板深度試用報(bào)告】2-上電體驗(yàn)

jf_36765885
20小時(shí)前

119 閱讀

推薦一款三相三線制電源模組

硬件設(shè)計(jì)小菜
20小時(shí)前

294 閱讀

rockchip rk3576開發(fā)設(shè)計(jì)資料

h1654155861.7375
20小時(shí)前

256 閱讀

反激開關(guān)電源工作原理

jf_84115621
20小時(shí)前

220 閱讀

推薦企業(yè)號(hào)
更多

衡阳派盒市场营销有限公司

搜索歷史

兩大AI模型性能提升登上國際榜單

評(píng)論

商湯科技推出“日日新”融合大模型

格陸博科技榮登兩大權(quán)威機(jī)構(gòu)榜單

谷歌正式發(fā)布Gemini 2.0 性能提升近兩倍

云知聲榮登2024全球AIGC先鋒者系列榜單

AI模型部署和管理的關(guān)系

NPU技術(shù)如何提升AI性能

AI大模型的性能優(yōu)化方法

阿里國際發(fā)布翻譯大模型Marco

普強(qiáng)成功榮登兩大榜單

ai大模型和ai框架的關(guān)系是什么

AI大模型與小模型的優(yōu)缺點(diǎn)

韓國兩大芯片公司尋求合并，以開發(fā)新一代AI芯片

小米大語言模型獲備案，有望應(yīng)用于汽車、手機(jī)等產(chǎn)品

SCHURTER碩特波蘭子公司連續(xù)兩年登上《福布斯鉆石獎(jiǎng)》榜單

潞晨科技Colossal-AI + 浪潮信息AIStation，大模型開發(fā)效率提升10倍

搜索歷史

兩大AI模型性能提升 登上國際榜單

評(píng)論

兩大AI模型性能提升登上國際榜單