衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NLP中的神經網絡設計與學習

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:深度學習自然語言 ? 2022-09-22 14:49 ? 次閱讀

神經網絡技術是現代人工智能的關鍵技術,在自然語言處理、圖像處理等領域表現出優異效果。來自東北大學自然語言處理實驗室、小牛翻譯團隊的肖桐教授、博士生李垠橋、李北在CCMT 2022會議所進行的《自然語言處理中的神經網絡設計與學習》演講報告,從神經網絡架構在自然語言處理中的發展、人工神經網絡設計和自動化架構設計三個方面對該領域技術發展進行了全面梳理,同時也對方向的未來發展進行了分析和探討。

近些年來,人工神經網絡方法已經成為了自然語言處理中最重要的范式之一。但是,大量依賴人工設計的神經網絡結構,導致自然語言處理領域的發展很大程度依賴于神經網絡結構上的突破。由于神經網絡結構設計大多源自研究人員的靈感和大量經驗性嘗試,如何挖掘這些神經網絡結構背后的邏輯,如何系統化的思考不同神經網絡結構之間的內在聯系,是使用這類方法時所需要深入考慮并回答的問題。甚至,可以想象,讓計算機自動設計神經網絡架構,也可以成為進一步突破人類思維限制的方向之一。

在《自然語言處理中的神經網絡設計與學習》中,講者們根據自身研究經驗對上述問題進行了回答,對神經網絡架構的基本發展脈絡、常用的神經網絡架構的設計理念進行分析,同時對神經網絡架構的自動設計方法進行整理。這些內容可以為相關研究者供模型架構設計上的一些思路,以及實踐中的參考。同時,講者在分享中也呼吁研究者更多地以系統化的思考方式來看待神經網絡方法在自然語言處理中的應用,而非簡單像“黑盒”一樣使用它們。

da9c0b0c-3a34-11ed-9e49-dac502259ad0.png

第一部分:神經網絡架構在自然語言處理中的發展

報告的第一部分內容由小牛翻譯聯合創始人、東北大學計算機學院博士生導師肖桐教授講述。首先回顧了自然語言處理中神經網絡的發展,從上世紀五十年代的感知機開始到如今的預訓練模型,為自然語言處理領域神經網絡的發展構建了一張脈絡圖。并以該圖為主線,梳理了自然語言處理領域里程碑級別的神經網絡模型及其影響,包括NNLM、Word2Vec、RNN、Seq2Seq、Attention、Transformer、預訓練模型等重要工作。接下來,以神經網絡架構設計思想為核心,介紹了從不同學科的視角看神經網絡,并以卷積神經網絡和Transformer作實例探討了隱藏在復雜模型背后的神經網絡設計靈感來源,包括卷積神經網絡與人類視覺系統感受野的關系、Transformer位置編碼和自注意力機制設計靈感來源。最后,列舉了設計神經網絡架構面臨的四個挑戰。

第二部分:基于人工先驗知識的神經網絡設計

報告的第二部分由東北大學博士生李北講述。本部分主要關注基于人工先驗的神經網絡設計,內容圍繞基于Transformer模型的網絡結構改進工作展開,包括基于跨層連接的結構優化、注意力機制的改進、多尺度建模、混合專家系統及應用數值理論提高參數高效性五方面工作。在每個方面,講者從方法的早期靈感開始介紹,并介紹了方法的發展脈絡和隨后的改進工作,對近年來結構優化相關的工作實現了大規模的覆蓋。其中詳細討論了關于模型對淺層信息利用不充分,深層網絡的訓練穩定性,深層網絡的深度退化問題,注意力的局部建模,多頭注意力的增強,注意力、架構、語義單元多尺度網絡,多分支網絡設計,顯性建模和隱性建模等問題。

第三部分:自動化設計神經網絡架構

報告的第三部分由東北大學博士生李垠橋講述。主要圍繞如何通過自動化地方式對神經網絡架構進行設計而展開。在該部分中講者首先介紹了什么是神經網絡架構的自動設計,對比了機器學習中三種不同的范式的差異,然后通過對神經網絡技術發展的歷史回顧切入,對自動化架構設計在其中扮演的角色進行了梳理。在此之后講者對自動化架構設計的整體框架進行細致的介紹,包括搜索空間、搜索策略以及性能評估,讓大家對這類方法本身具備清楚的認知。再后講者以自然語言處理任務為例介紹了如何應用自動化機器學習的方式對結構進行優化和設計,對自動化架構搜索在自然語言處理領域中所要解決的問題進行分析。最終,還對目前自動化架構設計中依舊存在的重要問題進行了探討,希望對讀者有進一步的幫助和啟發。

部分slides如下:

dab54cb6-3a34-11ed-9e49-dac502259ad0.png

dad82fe2-3a34-11ed-9e49-dac502259ad0.png

daf5da24-3a34-11ed-9e49-dac502259ad0.png

db05b638-3a34-11ed-9e49-dac502259ad0.png

db121464-3a34-11ed-9e49-dac502259ad0.png

db2f943a-3a34-11ed-9e49-dac502259ad0.png

db4db000-3a34-11ed-9e49-dac502259ad0.png

db6cc6ca-3a34-11ed-9e49-dac502259ad0.png

db8f8f5c-3a34-11ed-9e49-dac502259ad0.png

dbb0bff6-3a34-11ed-9e49-dac502259ad0.png

dbcf5b0a-3a34-11ed-9e49-dac502259ad0.png

dbfd08f2-3a34-11ed-9e49-dac502259ad0.png

dc1800ee-3a34-11ed-9e49-dac502259ad0.png

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4779

    瀏覽量

    101169
  • 自然語言處理

    關注

    1

    文章

    619

    瀏覽量

    13646
  • nlp
    nlp
    +關注

    關注

    1

    文章

    489

    瀏覽量

    22107

原文標題:CCMT講習班 | NLP中的神經網絡設計與學習|附338頁ppt與講解文章

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    詳解深度學習神經網絡與卷積神經網絡的應用

    在如今的網絡時代,錯綜復雜的大數據和網絡環境,讓傳統信息處理理論、人工智能與人工神經網絡都面臨巨大的挑戰。近些年,深度學習逐漸走進人們的視線,通過深度
    的頭像 發表于 01-11 10:51 ?2291次閱讀
    詳解深度<b class='flag-5'>學習</b>、<b class='flag-5'>神經網絡</b>與卷積<b class='flag-5'>神經網絡</b>的應用

    神經網絡教程(李亞非)

    源程序  5.3 Gaussian機  第6章自組織神經網絡  6.1 競爭型學習  6.2 自適應共振理論(ART)模型  6.3 自組織特征映射(SOM)模型  6.4 CPN模型  第7章 聯想
    發表于 03-20 11:32

    神經網絡資料

    基于深度學習神經網絡算法
    發表于 05-16 17:25

    【案例分享】基于BP算法的前饋神經網絡

    傳播的,不會回流),區別于循環神經網絡RNN。BP算法(Back Propagation):誤差反向傳播算法,用于更新網絡的權重。BP神經網絡思想:表面上:1. 數據信息的前向傳播,
    發表于 07-21 04:00

    【案例分享】ART神經網絡與SOM神經網絡

    ,同理,閾值越大,則容納的模式類也就越多----------以上純屬個人理解,如果有錯誤歡迎指正。ART比較好地緩解了競爭型學習的“可塑性-穩定性窘境”,其中可塑性指神經網絡要能夠學習
    發表于 07-21 04:30

    【AI學習】第3篇--人工神經網絡

    `本篇主要介紹:人工神經網絡的起源、簡單神經網絡模型、更多神經網絡模型、機器學習的步驟:訓練與預測、訓練的兩階段:正向推演與反向傳播、以TensorFlow + Excel表達訓練流程
    發表于 11-05 17:48

    如何構建神經網絡

    原文鏈接:http://tecdat.cn/?p=5725 神經網絡是一種基于現有數據創建預測的計算系統。如何構建神經網絡神經網絡包括:輸入層:根據現有數據獲取輸入的層隱藏層:使用反向傳播優化輸入變量權重的層,以提高模型的預測
    發表于 07-12 08:02

    基于BP神經網絡的PID控制

    最近在學習電機的智能控制,上周學習了基于單神經元的PID控制,這周研究基于BP神經網絡的PID控制。神經網絡具有任意非線性表達能力,可以通過
    發表于 09-07 07:43

    卷積神經網絡模型發展及應用

    network,DBN)[24], 從此拉開了深度學習大幕。隨著深度學習理論的研究和發展,研究人員提 出了一系列卷積神經網絡模型。為了比較不同模型 的質量,收集并整理了文獻模型在分
    發表于 08-02 10:39

    卷積神經網絡簡介:什么是機器學習

    抽象人工智能 (AI) 的世界正在迅速發展,人工智能越來越多地支持以前無法實現或非常難以實現的應用程序。本系列文章解釋了卷積神經網絡 (CNN) 及其在 AI 系統機器學習的重要性
    發表于 02-23 20:11

    NLP多任務學習案例分享:一種層次增長的神經網絡結構

    NLP 領域研究者們開始研究基于神經網絡的多任務學習。大多數方法通過網絡參數共享來學習任務間的關聯,提升各任務效果。
    發表于 01-05 16:10 ?4448次閱讀

    NLP的深度學習技術概述

    該項目是對基于深度學習的自然語言處理(NLP)的概述,包括用來解決不同 NLP 任務和應用的深度學習模型(如循環神經網絡、卷積
    的頭像 發表于 03-01 09:13 ?4870次閱讀
    <b class='flag-5'>NLP</b><b class='flag-5'>中</b>的深度<b class='flag-5'>學習</b>技術概述

    神經網絡神經網絡控制的學習課件免費下載

    本文檔的主要內容詳細介紹的是神經網絡神經網絡控制的學習課件免費下載包括了:1生物神經元模型,2人工神經元模型,3人工
    發表于 01-20 11:20 ?7次下載
    <b class='flag-5'>神經網絡</b>與<b class='flag-5'>神經網絡</b>控制的<b class='flag-5'>學習</b>課件免費下載

    什么是神經網絡?什么是卷積神經網絡

    在介紹卷積神經網絡之前,我們先回顧一下神經網絡的基本知識。就目前而言,神經網絡是深度學習算法的核心,我們所熟知的很多深度學習算法的背后其實都
    的頭像 發表于 02-23 09:14 ?3683次閱讀

    人工神經網絡和bp神經網絡的區別

    著重要作用。BP神經網絡(Back Propagation Neural Network, BPNN)是人工神經網絡的一種常見的多層前饋神經網絡
    的頭像 發表于 08-22 16:45 ?4671次閱讀
    大众百家乐的玩法技巧和规则| 绍兴市| 丽都百家乐官网的玩法技巧和规则| 大发888娱乐城下载地址| 新彩百家乐官网的玩法技巧和规则| 百家乐官网国际娱乐场开户注册| 大发888df登录| 利来百家乐官网的玩法技巧和规则| 网上娱乐城注册送现金| 百家乐游戏分析| 美国百家乐官网怎么玩| 同花顺百家乐的玩法技巧和规则 | 澳门百家乐网络游戏信誉怎么样| 百家乐官网赌博规| 大发888游戏平台寒怕| 什么风水适合做生意| 梨树县| 中国百家乐的玩法技巧和规则| HG百家乐官网大转轮| 网上娱乐城开户| 百家乐视频游戏界面| 百家乐官网视频游戏中心| 大发888投注大发娱乐| 百家乐官网翻天超清| 永和县| 威尼斯人娱乐中心老品牌| 风水罗盘24山| 博E百百家乐官网现金网| 水果机技巧规律| 百家乐赌的技巧| 奔驰百家乐官网可信吗| 大发888娱乐城下载lm0| 24楼层风水| 最新百家乐官网游戏机| 大发888真钱娱乐| 太阳城百家乐手机投注| 天地人百家乐官网现金网| 大发888黄金版娱乐场| 百家乐赌场高手| 济州岛百家乐官网的玩法技巧和规则 | 全讯网新2网址|