衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

ChatGPT、Gemini、通義千問等一眾大語言模型,哪家更適合您?

話說科技 ? 來源:話說科技 ? 作者:話說科技 ? 2024-05-14 17:35 ? 次閱讀


隨著人工智能技術的飛速發展,大語言模型(Large Language Models, LLMs)在各行各業的應用日益廣泛,尤其是在軟件開發、數據分析、客戶服務等領域。蘑菇云創客空間[445期開放夜]就以“ChatGPT、Gemini、通義千問等一眾大語言模型,哪家更適合您”這樣的主題,開展了一次深度的大語言模型的測評。開放夜現場測評了十幾個國內外大語言模型,測評角度從邏輯、數學、翻譯、倫理等方面,深入探討和體驗了這些大語言模型的實際效能。

測評的大語言模型:

1.Kimi 智能助手:由月之暗面科技有限公司開發的先進AI

2.智譜清言:由智言科技開發的大語言模型,以深度學習和自然語言處理技術見長。

3.訊飛星火:科大訊飛推出的創新語言模型。

4.文心一言:百度的前沿語言模型,致力于理解和生成自然語言。

5.豆包:專注于提供個性化的智能對話服務。

6.通義千問:以廣泛的知識庫和靈活的對話能力著稱。

7.海螺AI:新興的語言模型,擅長處理復雜的語言任務。

8.騰訊混元助手:騰訊推出的多功能AI助手。

9.Sider: 是由日本公司Sider開發的大語言模型。

10.ChatGPT:由OpenAI開發,國際上廣受認可的更大規模、功能更全面的語言模型。

11.Claude:Anthropic開發的先進語言模型,注重安全性和可靠性。

12.groq:以其專為AI設計的硬件加速器而聞名。

13.Gemini: OpenAI 開發的較小規模的語言模型,旨在提供更高效的計算和資源利用。

14.Mixtral:開源人工智能初創公司 MistralAI開發的超越GPT-3.5的AI模型

測評問題一: 雞兔同籠的數學問題

雞兔同籠是一個經典的數學問題,通過觀察雞兔的頭和腳的數量關系,可以利用代數方程來解決問題,從而確定籠子里雞和兔子的數量。這個問題常常展示了代數方程組的應用。

針對雞兔同籠的問題,除了Gemini Pro沒有得出正確的結果,其余的大語言模型都可以給出正確結果。

測評問題二:翻譯(詩句中翻英)

詩人馬致遠的詩句“斷腸人在天涯”,描寫了“夕陽向西緩緩落下,只有孤獨的旅人漂泊在遙遠的地方。”詩句的翻譯涉及到文化差異和詩人獨特情感。Mixtral 的語言模型正確的解釋了詩句本身的含義,幫助翻譯者很好地理解這句詩句。 Claude的語言模型對于詩句的本身理解是不正確的。

這句詩翻譯家許淵沖翻譯為“Far, far from home is the heartbroken one.”由此可見,大語言模型可以幫助翻譯者分析這句詩基本的意思,但是涉及文化層面的深層含義,還是做不到意譯的。

開放夜也探討了如下涉及生活、工作的一些問題,比如:

過年福字要倒著貼,那為什么不直接生產倒過來的福字呢?

收到公司的裁員通知郵件,你應該怎么回復郵件來保住工作?

一個烏龜掉進了井里,井里有30米深。烏龜白天爬3米,晚上滑下2米。問這只烏龜需要多長時間才能爬出井口?

DFRobot AIGC小組主理人夏青在開放夜的現場測評了十幾個國內外大語言模型,通過多維度問題的測評,他認為:對于處理綜合性問題,OpenAI的ChatGPT 4.0邏輯清楚,能提供非常有用的信息。盡管在回答一些較為復雜的問題上略顯不足,但在大多數場合下,其性能仍然令人滿意。然而,ChatGPT 4.0在國內的使用成本是一個不容忽視的問題,不僅涉及訂閱費用,也包括使用的技術門檻。

與此同時,Gemini和Claude等海外語言模型,盡管在遵循指令方面略顯不足,但已達到了實用水平。令人驚喜的是,國內的Qwen1.5 72b開源模型在中文理解和特定任務,幾乎能與ChatGPT4.0匹敵此外,其他開源模型如Mixtral和新發布的LLaMA3雖在邏輯性上略遜于商業模型如ChatGPT,但總體表現已超越了ChatGPT 3.5。

綜合分析來看,盡管ChatGPT 4.0仍然是目前市場上最優秀的大語言模型,但不可忽視的是,無論是國際市場還是國內市場,其他廠商的模型均顯示出迅速的進步。開源模型的崛起也證明了開源社區在AI時代的巨大潛力。當前的大語言模型在處理理性問題方面表現一致,但通常無法提供情緒價值回應。例如,一些國內模型如“豆包”將展現其在情緒回應方面的潛力。這種能力的發展可能為未來陪伴型機器人的商業模型提供新的方向。

蘑菇云創客空間

蘑菇云創客空間是上海浦東的一家創客空間,是科技部授牌的首批國家級創客空間,由浦軟孵化器提供場地支持、上海智位機器人提供硬件及技術支持的一家為創客服務的開放式創客空間。擁有獨立的加工室、公共協作區域以及儲物、耗材商店,為硬件愛好者、程序員、設計師、DIY 發燒友等各類創客,甚至包括進行創新研發的科創團隊提供一個開放式的社區化會員空間。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • Gemini
    +關注

    關注

    0

    文章

    56

    瀏覽量

    7617
  • 語言模型
    +關注

    關注

    0

    文章

    538

    瀏覽量

    10342
  • ChatGPT
    +關注

    關注

    29

    文章

    1570

    瀏覽量

    8067
  • 通義千問
    +關注

    關注

    1

    文章

    25

    瀏覽量

    278
收藏 人收藏

    評論

    相關推薦

    阿里通義代碼模型全系列開源

    近日,阿里云通義模型團隊宣布了項重大決策:將通義代碼
    的頭像 發表于 11-14 15:26 ?443次閱讀

    通義三款主力模型再降價

    阿里云百煉平臺再次掀起降價風暴,三款通義主力模型——Qwen-Turbo、Qwen-Plus及Qwen-Max,繼5月首次大幅度降價后,再次迎來價格調整。此次降價力度空前,Qwen
    的頭像 發表于 09-20 16:46 ?1032次閱讀

    通義發布第二代視覺語言模型Qwen2-VL

    阿里巴巴旗下的通義近日宣布,其第二代視覺語言模型Qwen2-VL正式問世,并宣布旗艦模型Qw
    的頭像 發表于 09-03 16:31 ?619次閱讀

    【附實操視頻】聆思CSK6大模型開發板接入國內主流大模型(星火大模型、文心言、豆包、kimi、智譜glm、通義

    接入文心言、通義、豆包、智譜glm、kimi國內的大模型,但由于各家接口和數據格式不
    發表于 08-22 10:12

    智能硬件接入主流大模型做語音交互(附文心言、豆包、kimi、智譜glm、通義示例)

    接入文心言、通義、豆包、智譜glm、kimi國內的大模型,這個是必須可以的。但由于各家接
    發表于 08-21 19:13

    阿里通義Qwen2大模型發布并同步開源

    阿里巴巴集團旗下的通義團隊宣布,全新的Qwen2大模型正式發布,并在全球知名的開源平臺Hugging Face和ModelScope上同步開源。這
    的頭像 發表于 06-11 15:33 ?1136次閱讀

    阿里通義Qwen2大模型發布

    阿里巴巴最近發布了其通義系列的新成員——Qwen2大模型,并在Hugging Face和ModelScope兩大平臺上實現了同步開源。這
    的頭像 發表于 06-07 15:59 ?816次閱讀

    阿里云正式發布通義2.5,中文性能全面趕超GPT-4 Turbo

    通義模型發布周年之際,阿里云邁出了歷史性的步。近日,阿里云正式發布通義
    的頭像 發表于 05-13 11:16 ?1070次閱讀

    阿里云發布通義2.5

    阿里云近日正式發布了通義2.5,標志著其人工智能技術在中文語境下取得了重要突破。據阿里云智能集團首席技術官周靖人介紹,通義
    的頭像 發表于 05-10 09:57 ?591次閱讀

    阿里云發布通義2.5大模型,多項能力超越GPT-4

    阿里云隆重推出了通義 2.5 版,宣稱其“技術進步,全面超越GPT-4”,尤其是在中文環境中的多種任務(如文本理解、文本生成、知識問答及生活建議、臨時聊天及對話以及安全風險評估)方面表現出色,超越了GPT-4。
    的頭像 發表于 05-09 14:17 ?1039次閱讀

    通義開源千億級參數模型

    通義近日開源了其首個千億級參數模型Qwen1.5-110B,這是其全系列中首個達到千億級別的開源模型。Qwen1.5-110B
    的頭像 發表于 05-08 11:01 ?799次閱讀

    通義推出1100億參數開源模型

    通義近日震撼發布1100億參數的開源模型Qwen1.5-110B,這舉措標志著通義
    的頭像 發表于 05-06 10:49 ?636次閱讀

    聯發科天璣9300旗艦芯片搭載通義模型,成功實現

    通義模型可在離線環境下輕松應對多輪AI對話。此外,阿里云也承諾與聯發科進行深度合作,為全球手機制造商提供端側大模型解決方案。
    的頭像 發表于 03-28 16:35 ?874次閱讀

    聯發科天璣9300搭載通義模型,阿里云提供解決方案

    通義模型已開源多項版本,包括18億、70億、140億及720億參數版本伴隨視覺、音頻多模態能力提升。阿里云于去年10月發布的
    的頭像 發表于 03-28 09:55 ?674次閱讀

    阿里通義重磅升級,免費開放1000萬字長文檔處理功能

    近日,阿里巴巴旗下的人工智能應用通義迎來重磅升級,宣布向所有人免費開放1000萬字的長文檔處理功能,這創新舉措使得通義
    的頭像 發表于 03-26 11:09 ?876次閱讀
    百家乐澳门赌| 金傲皇冠网论坛| 澳门百家乐官网娱乐城送体验金| 百家乐交流群号| 德州扑克保险赔率| 二八杠分析仪| 百家乐官网娱乐城网站| 百家乐技巧娱乐博彩| 太阳城娱乐城下载| 百家乐官网路书| 顶级赌场连环夺宝ios下载| 百家乐官网官网网站| 网上百家乐看牌器| 澳门葡京赌场官网| 百家乐要怎么玩啊| 百家乐在线娱乐平台| 百家乐官网下注技术| 沙龙百家乐娱乐平台| 百家乐官网真人荷官| 赌场百家乐攻略| 百家乐官网视频交流| 百家乐赌场玩法技巧| 百家乐官网为什么庄5| 模拟百家乐下载| 宣汉县| 優博百家乐客服| 澳门百家乐官网娱乐城送彩金| 百家乐官网五湖四海娱乐| 威尼斯人娱乐城官方网址| 红宝石百家乐官网娱乐城 | 大发888游戏平台hplsj| 多台百家乐官网的玩法技巧和规则| 大发888下载娱乐场| 百家乐官网开闲几率| 大发888真钱游戏娱乐城下载| 百家乐官网最新分析仪| A8百家乐现金网| 百家乐官网赢钱皇冠| 威尼斯人娱乐代理注| 网上百家乐官网公司| 新民市|