衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌推出1.6萬億參數的人工智能語言模型,打破GPT-3記錄

hl5C_deeptechch ? 來源:DeepTech深科技 ? 作者:DeepTech深科技 ? 2021-01-18 17:16 ? 次閱讀

古諺道:“熟讀唐詩三百首,不會作詩也會吟。” 這句話放在目前的人工智能語言模型中也非常適用。

此前,OpenAI 的研究人員開發出 “GPT-3”,這是一個由 1750 億個參數組成的 AI 語言模型,堪稱有史以來訓練過的最大的語言模型,可以進行原始類比、生成配方、甚至完成基本代碼編寫。

如今,這一記錄被打破了。近日,谷歌研究人員開發出一個新的語言模型,它包含了超過 1.6 萬億個參數,這是迄今為止最大規模的人工智能語言模型,比之前谷歌開發的語言模型 T5-XXL 的規模大了 4 倍。

6735ad0e-584e-11eb-8b86-12bb97331649.png

參數是機器學習算法的關鍵所在,它們是從歷史訓練數據中學習到的模型的一部分。一般而言,在語言領域中參數的數量和復雜度之間的相關性非常好。這一點類似于 GPU晶體管的數量,在同樣的制程工藝下,晶體管越多其算力便越強,而語言模型包含的參數愈多就愈接近人類自然語言。

正如研究人員在一篇論文中指出的那樣,大規模的訓練是通向強大模型的有效途徑,在大數據集和參數計數的支持下,簡單的體系結構遠遠超過了更復雜的算法。但是,有效的大規模培訓在計算上非常密集。這就是為什么研究人員熱衷于他們所說的 “開關變壓器”,這是一種 “稀疏激活” 技術,它只使用模型權重的一個子集或者在模型中轉換輸入數據的參數。

“開關變壓器” 是早在 90 年代初首次提出的一種人工智能模型范例,大體意思是將多個專家或專門處理不同任務的模型放在一個更大的模型中,并有一個 “門控網絡” 來選擇為任何給定數據咨詢哪些專家。

在一項實驗中,研究人員使用 32 個 TPU 內核對幾個不同的 “開關變壓器” 模型進行了預訓練,這些 TPU 內核位于一個從 Reddit、Wikipedia 和其他網絡資源中搜集的 750GB 大小的文本數據語料庫中,任務則是讓這些模型預測段落中 15% 的單詞被遮住的缺失單詞,以及其他挑戰,比如檢索文本來回答一系列越來越難的問題。

研究人員稱,包含了 1.6 萬億參數和 2048 名專家的模型 Switch-C 顯示 “完全沒有訓練不穩定性”。然而,在桑福德問答數據集的基準測試中,Switch-C 的得分居然比僅包含 3950 億個參數和 64 名專家的模型 Switch-XXL 還要低一點,對此,研究人員認為是因為微調質量、計算要求和參數數量之間的不透明關系所致。

在這種情況下,“開關變壓器” 導致了一些下游任務的收益。例如,研究人員稱在使用相同數量的計算資源的情況下,它可以使訓練前的加速速度提高 7 倍以上。他們還證明 “稀疏激活” 技術可以用來創建更小、更密集的模型,這些模型可以對任務進行微調,其質量增益為大型模型的 30%。

對此他們表示:雖然這項工作主要集中在超大模型上,但我們也發現只有兩名專家的模型可以提高性能,同時很容易適應通用 GPU 或 TPU 的內存限制。另外,通過將稀疏模型提取為稠密模型,可以實現 10 到 100 倍的壓縮率,同時獲得專家模型約 30% 的質量增益。

在另一個測試中,“開關變壓器” 模型被訓練在 100 多種不同語言之間進行翻譯,研究人員觀察到 101 種語言的 “普遍改善”,91% 的語言受益于比基線模型快 4 倍以上的速度。未來,研究人員還計劃將 “開關變壓器” 應用于新的領域,比如圖像和文本。他們認為,模型稀疏性可以賦予優勢,在一系列不同的媒體以及多模態模型。

美中不足的是,研究人員的工作沒有考慮到這些語言模型在現實世界中的影響,比如模型通常會放大一些公開數據中的偏見。對此,OpenAI 公司指出,這可能導致在女性代詞附近放置 “淘氣”;而在 “恐怖主義” 等詞附近放置 “伊斯蘭” 等。根據米德爾伯里國際研究所的說法,這種偏見可能被惡意行為者利用,通過散布錯誤信息、造謠和謊言來煽動不和。

而路透社也曾報道稱,谷歌的研究人員現在被要求在研究人臉和情緒分析以及種族分類等話題之前,先咨詢法律、政策和公關團隊,性別或政治派別。

綜上所述,盡管谷歌訓練的 1.6 萬億參數的人工智能語言模型還沒辦法做到真正意義上的人工智能,存在一些不足之處需要完善和優化,但隨著在摩爾定律下電子設備算力的不斷提升,近些年 AI 語言模型參數量級呈指數倍發展,相信在不久的將來,或許真的會出現一個無限接近熟讀人類歷史所有文明記錄的超級模型,能夠和人類完全實現自然語言交流,不妨讓我們好好期待一下吧!

原文標題:GPT-3記錄被打破!谷歌推出1.6萬億參數的人工智能語言模型

文章出處:【微信公眾號:DeepTech深科技】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6195

    瀏覽量

    106016
  • 人工智能
    +關注

    關注

    1796

    文章

    47674

    瀏覽量

    240294

原文標題:GPT-3記錄被打破!谷歌推出1.6萬億參數的人工智能語言模型

文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    英偉達預測機器人領域或迎“GPT-3時刻”

    未來2-3年內,機器人基礎模型的研究將迎來重大突破,這一時刻被形象地比喻為機器人領域的“GPT-3時刻”。
    的頭像 發表于 09-20 17:05 ?856次閱讀

    Jim Fan展望:機器人領域即將迎來GPT-3式突破

    英偉達科學家9月19日,科技媒體The Decoder發布了一則引人關注的報道,英偉達高級科學家Jim Fan在近期預測,機器人技術將在未來兩到三年內迎來類似GPT-3語言處理領域的革命性突破,他稱之為機器人領域的“GPT-3
    的頭像 發表于 09-19 15:13 ?649次閱讀

    OpenAI發布最新人工智能模型——GPT-4o mini

    據國際媒體報道,OpenAI 在周四震撼發布了其最新的人工智能模型——GPT-4o mini,此舉標志著這家領先的AI初創公司在拓寬其廣受歡迎的聊天機器人應用領域方面邁出了重要一步。
    的頭像 發表于 07-19 15:24 ?766次閱讀

    中國電信發布全球首個單體稠密萬億參數語義模型

    近日,中國電信人工智能研究院(TeleAI)攜手北京智源人工智能研究院,共同推出了全球首個單體稠密萬億參數語義
    的頭像 發表于 06-20 10:50 ?707次閱讀

    OpenAI推出更快更便宜的大語言模型GPT-4o

    美國人工智能公司OpenAI于14日凌晨正式推出了一個更快、更便宜的人工智能模型來支持其聊天機器人ChatGPT。
    的頭像 發表于 05-15 15:12 ?661次閱讀

    OpenAI推出面向所有用戶的AI模型GPT-4o

    在周一的直播盛會上,OpenAI揭開了其最新的人工智能模型GPT-4o的神秘面紗。這款新模型旨在為其著名的聊天機器人ChatGPT提供更強大、更經濟的支持。
    的頭像 發表于 05-15 09:23 ?444次閱讀

    OpenAI推出新款人工智能模型GPT-4o

    人工智能領域的領軍者OpenAI在最近的春季更新活動中,重磅推出了全新升級的ChatGPT版本,它支持了GPT-4o這一強大的人工智能模型
    的頭像 發表于 05-14 10:52 ?593次閱讀

    微軟準備推出全新人工智能語言模型

    微軟近期傳出消息,正在秘密研發一款全新的人工智能語言模型,這款模型在規模上預計將具備與谷歌和OpenAI等業界巨頭相抗衡的實力。據悉,這款新
    的頭像 發表于 05-08 09:30 ?462次閱讀

    【大語言模型:原理與工程實踐】揭開大語言模型的面紗

    語言模型(LLM)是人工智能領域的尖端技術,憑借龐大的參數量和卓越的語言理解能力贏得了廣泛關注。它基于深度學習,利用神經網絡框架來理解和生
    發表于 05-04 23:55

    【大語言模型:原理與工程實踐】探索《大語言模型原理與工程實踐》

    《大語言模型》是一本深入探討人工智能領域中語言模型的著作。作者通過對語言
    發表于 04-30 15:35

    OpenAI有望在年中推出全新GPT-5模型

    近日,人工智能領域的領軍企業OpenAI傳來了令人振奮的消息。據悉,他們有望在今年的年中,大約是夏季時分,推出全新的GPT-5模型。這一消息引發了業界的廣泛關注與期待。
    的頭像 發表于 03-22 11:29 ?836次閱讀

    谷歌宣布在醫療保健領域推出人工智能計劃

    谷歌最近公布了一系列激動人心的計劃,將先進的人工智能模型引入醫療保健領域。據谷歌透露,其研究團隊正聯手旗下Fitbit公司,共同研發一項創新的人工智
    的頭像 發表于 03-21 10:54 ?694次閱讀

    谷歌模型軟件有哪些功能

    谷歌模型軟件通常指的是谷歌推出的一系列人工智能模型和軟件工具,其中最具代表性的是Google G
    的頭像 發表于 03-01 16:20 ?750次閱讀

    嵌入式人工智能的就業方向有哪些?

    。 國內外科技巨頭紛紛爭先入局,在微軟、谷歌、蘋果、臉書等積極布局人工智能的同時,國內的BAT、華為、小米等科技公司也相繼切入到嵌入式人工智能的賽道。那么嵌入式AI可就業的方向有哪些呢? 嵌入式AI開發
    發表于 02-26 10:17

    谷歌發布輕量級開源人工智能模型Gemma

    谷歌近日宣布推出開源人工智能(AI)模型系列Gemma,旨在為開發人員和研究人員提供一個負責任的AI構建平臺。這一舉措標志著自2022年OpenAI的ChatGPT引領AI聊天機器人熱
    的頭像 發表于 02-23 11:38 ?930次閱讀
    赌场百家乐的玩法技巧和规则| 百盛百家乐的玩法技巧和规则| 24山安葬择日| 玩网上百家乐官网的技巧| 百家乐官网看牌技巧| 六合彩查询| 东方太阳城租房| 永利百家乐赌场娱乐网规则| 百家乐博彩策略论坛| 百家乐官网真人游戏娱乐场| 百家乐官网分析软件骗人| 南和县| 澳门赌场筹码| 娱乐城首存| 大发888娱乐游戏下载 客户端| 榆次百家乐的玩法技巧和规则| 新葡京百家乐娱乐城| 奔驰百家乐可信吗| 24山向中那个向最好| 百盛百家乐官网的玩法技巧和规则 | 呼玛县| 宜宾县| 咸阳市| 秦安县| 真钱棋牌游戏| 米兰国际娱乐城| 新葡京| 金三角娱乐城| 99真人娱乐城| 333娱乐城| 兴义市| 武隆县| 湛江市| 百家乐官网赌博出千| 百家乐官网U盘下载| 巨鹿县| 百家乐官网视频免费下载| 乐九百家乐官网现金网| 百家乐官网送彩金平台| 兴安盟| 百家乐官网关键词|