7383棋牌线上游戏,www.3589.so,新皇冠官网旗舰店价格查询系统电话 (中国)·官方网站

隨著人工智能技術的飛速發展，大語言模型（Large Language Models, LLMs）在各行各業的應用日益廣泛，尤其是在軟件開發、數據分析、客戶服務等領域。蘑菇云創客空間[445期開放夜]就以“ChatGPT、Gemini、通義千問等一眾大語言模型，哪家更適合您”這樣的主題，開展了一次深度的大語言模型的測評。開放夜現場測評了十幾個國內外大語言模型，測評角度從邏輯、數學、翻譯、倫理等方面，深入探討和體驗了這些大語言模型的實際效能。

測評的大語言模型：

1.Kimi 智能助手：由月之暗面科技有限公司開發的先進AI。

2.智譜清言：由智言科技開發的大語言模型，以深度學習和自然語言處理技術見長。

3.訊飛星火：科大訊飛推出的創新語言模型。

4.文心一言：百度的前沿語言模型，致力于理解和生成自然語言。

5.豆包：專注于提供個性化的智能對話服務。

6.通義千問：以廣泛的知識庫和靈活的對話能力著稱。

7.海螺AI：新興的語言模型，擅長處理復雜的語言任務。

8.騰訊混元助手：騰訊推出的多功能AI助手。

9.Sider: 是由日本公司Sider開發的大語言模型。

10.ChatGPT：由OpenAI開發，國際上廣受認可的更大規模、功能更全面的語言模型。

11.Claude：Anthropic開發的先進語言模型，注重安全性和可靠性。

12.groq：以其專為AI設計的硬件加速器而聞名。

13.Gemini: OpenAI 開發的較小規模的語言模型，旨在提供更高效的計算和資源利用。

14.Mixtral：開源人工智能初創公司 MistralAI開發的超越GPT-3.5的AI模型

測評問題一: 雞兔同籠的數學問題

雞兔同籠是一個經典的數學問題，通過觀察雞兔的頭和腳的數量關系，可以利用代數方程來解決問題，從而確定籠子里雞和兔子的數量。這個問題常常展示了代數方程組的應用。

針對雞兔同籠的問題，除了Gemini Pro沒有得出正確的結果，其余的大語言模型都可以給出正確結果。

測評問題二：翻譯（詩句中翻英）

詩人馬致遠的詩句“斷腸人在天涯”，描寫了“夕陽向西緩緩落下，只有孤獨的旅人漂泊在遙遠的地方。”詩句的翻譯涉及到文化差異和詩人獨特情感。Mixtral 的語言模型正確的解釋了詩句本身的含義，幫助翻譯者很好地理解這句詩句。 Claude的語言模型對于詩句的本身理解是不正確的。

這句詩翻譯家許淵沖翻譯為“Far, far from home is the heartbroken one.”由此可見，大語言模型可以幫助翻譯者分析這句詩基本的意思，但是涉及文化層面的深層含義，還是做不到意譯的。

開放夜也探討了如下涉及生活、工作的一些問題，比如：

過年福字要倒著貼，那為什么不直接生產倒過來的福字呢？

收到公司的裁員通知郵件，你應該怎么回復郵件來保住工作？

一個烏龜掉進了井里，井里有30米深。烏龜白天爬3米，晚上滑下2米。問這只烏龜需要多長時間才能爬出井口？

DFRobot AIGC小組主理人夏青在開放夜的現場測評了十幾個國內外大語言模型，通過多維度問題的測評，他認為：對于處理綜合性問題，OpenAI的ChatGPT 4.0邏輯清楚，能提供非常有用的信息。盡管在回答一些較為復雜的問題上略顯不足，但在大多數場合下，其性能仍然令人滿意。然而，ChatGPT 4.0在國內的使用成本是一個不容忽視的問題，不僅涉及訂閱費用，也包括使用的技術門檻。

與此同時，Gemini和Claude等海外語言模型，盡管在遵循指令方面略顯不足，但已達到了實用水平。令人驚喜的是，國內的Qwen1.5 72b開源模型在中文理解和特定任務，幾乎能與ChatGPT4.0匹敵此外，其他開源模型如Mixtral和新發布的LLaMA3雖在邏輯性上略遜于商業模型如ChatGPT，但總體表現已超越了ChatGPT 3.5。

綜合分析來看，盡管ChatGPT 4.0仍然是目前市場上最優秀的大語言模型，但不可忽視的是，無論是國際市場還是國內市場，其他廠商的模型均顯示出迅速的進步。開源模型的崛起也證明了開源社區在AI時代的巨大潛力。當前的大語言模型在處理理性問題方面表現一致，但通常無法提供情緒價值回應。例如，一些國內模型如“豆包”將展現其在情緒回應方面的潛力。這種能力的發展可能為未來陪伴型機器人的商業模型提供新的方向。

蘑菇云創客空間

蘑菇云創客空間是上海浦東的一家創客空間,是科技部授牌的首批國家級創客空間,由浦軟孵化器提供場地支持、上海智位機器人提供硬件及技術支持的一家為創客服務的開放式創客空間。擁有獨立的加工室、公共協作區域以及儲物、耗材商店,為硬件愛好者、程序員、設計師、DIY 發燒友等各類創客,甚至包括進行創新研發的科創團隊提供一個開放式的社區化會員空間。

審核編輯黃宇

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

Gemini

Gemini

+關注

關注
0

文章
56

瀏覽量
7617
語言模型

語言模型

+關注

關注
0

文章
538

瀏覽量
10342
ChatGPT

ChatGPT

+關注

關注
29

文章
1570

瀏覽量
8067
通義千問

通義千問

+關注

關注
1

文章
25

瀏覽量
278

阿里通義千問代碼模型全系列開源

近日，阿里云通義大模型團隊宣布了一項重大決策：將通義千問代碼

發表于 11-14 15:26 ?443次閱讀

通義千問三款主力模型再降價

阿里云百煉平臺再次掀起降價風暴，三款通義千問主力模型——Qwen-Turbo、Qwen-Plus及Qwen-Max，繼5月首次大幅度降價后，再次迎來價格調整。此次降價力度空前，Qwen

發表于 09-20 16:46 ?1032次閱讀

通義千問發布第二代視覺語言模型Qwen2-VL

阿里巴巴旗下的通義千問近日宣布，其第二代視覺語言模型Qwen2-VL正式問世，并宣布旗艦模型Qw

發表于 09-03 16:31 ?619次閱讀

【附實操視頻】聆思CSK6大模型開發板接入國內主流大模型（星火大模型、文心一言、豆包、kimi、智譜glm、通義千問）

接入文心一言、通義千問、豆包、智譜glm、kimi等國內的大模型，但由于各家接口和數據格式不

發表于 08-22 10:12

智能硬件接入主流大模型做語音交互（附文心一言、豆包、kimi、智譜glm、通義千問示例）

接入文心一言、通義千問、豆包、智譜glm、kimi等國內的大模型，這個是必須可以的。但由于各家接

發表于 08-21 19:13

阿里通義千問Qwen2大模型發布并同步開源

阿里巴巴集團旗下的通義千問團隊宣布，全新的Qwen2大模型正式發布，并在全球知名的開源平臺Hugging Face和ModelScope上同步開源。這

發表于 06-11 15:33 ?1136次閱讀

阿里通義千問Qwen2大模型發布

阿里巴巴最近發布了其通義千問系列的新成員——Qwen2大模型，并在Hugging Face和ModelScope兩大平臺上實現了同步開源。這一

發表于 06-07 15:59 ?816次閱讀

阿里云正式發布通義千問2.5，中文性能全面趕超GPT-4 Turbo

在通義大模型發布一周年之際，阿里云邁出了歷史性的一步。近日，阿里云正式發布通義千

發表于 05-13 11:16 ?1070次閱讀

阿里云發布通義千問2.5

阿里云近日正式發布了通義千問2.5，標志著其人工智能技術在中文語境下取得了重要突破。據阿里云智能集團首席技術官周靖人介紹，通義千

發表于 05-10 09:57 ?591次閱讀

阿里云發布通義千問2.5大模型，多項能力超越GPT-4

阿里云隆重推出了通義千問 2.5 版，宣稱其“技術進步，全面超越GPT-4”，尤其是在中文環境中的多種任務（如文本理解、文本生成、知識問答及生活建議、臨時聊天及對話以及安全風險評估）方面表現出色，超越了GPT-4。

發表于 05-09 14:17 ?1039次閱讀

通義千問開源千億級參數模型

通義千問近日開源了其首個千億級參數模型Qwen1.5-110B，這是其全系列中首個達到千億級別的開源模型。Qwen1.5-110B

發表于 05-08 11:01 ?799次閱讀

通義千問推出1100億參數開源模型

通義千問近日震撼發布1100億參數的開源模型Qwen1.5-110B，這一舉措標志著通義

發表于 05-06 10:49 ?636次閱讀

聯發科天璣9300等旗艦芯片搭載通義千問大模型，成功實現

通義千問大模型可在離線環境下輕松應對多輪AI對話。此外，阿里云也承諾與聯發科進行深度合作，為全球手機制造商提供端側大模型解決方案。

發表于 03-28 16:35 ?874次閱讀

聯發科天璣9300搭載通義千問大模型，阿里云提供解決方案

通義千問大模型已開源多項版本，包括18億、70億、140億及720億參數等版本伴隨視覺、音頻多模態能力提升。阿里云于去年10月發布的

發表于 03-28 09:55 ?674次閱讀

阿里通義千問重磅升級，免費開放1000萬字長文檔處理功能

近日，阿里巴巴旗下的人工智能應用通義千問迎來重磅升級，宣布向所有人免費開放1000萬字的長文檔處理功能，這一創新舉措使得通義

發表于 03-26 11:09 ?876次閱讀

衡阳派盒市场营销有限公司

搜索歷史

ChatGPT、Gemini、通義千問等一眾大語言模型，哪家更適合您？

評論

阿里通義千問代碼模型全系列開源

通義千問三款主力模型再降價

通義千問發布第二代視覺語言模型Qwen2-VL

【附實操視頻】聆思CSK6大模型開發板接入國內主流大模型（星火大模型、文心一言、豆包、kimi、智譜glm、通義千問）

智能硬件接入主流大模型做語音交互（附文心一言、豆包、kimi、智譜glm、通義千問示例）

阿里通義千問Qwen2大模型發布并同步開源

阿里通義千問Qwen2大模型發布

阿里云正式發布通義千問2.5，中文性能全面趕超GPT-4 Turbo

阿里云發布通義千問2.5

阿里云發布通義千問2.5大模型，多項能力超越GPT-4

通義千問開源千億級參數模型

通義千問推出1100億參數開源模型

聯發科天璣9300等旗艦芯片搭載通義千問大模型，成功實現

聯發科天璣9300搭載通義千問大模型，阿里云提供解決方案

阿里通義千問重磅升級，免費開放1000萬字長文檔處理功能

搜索歷史

ChatGPT、Gemini、通義千問等一眾大語言模型，哪家更適合您？

評論

ChatGPT、Gemini、通義千問等一眾大語言模型，哪家更適合您？