本研究設計了一種簡單有效的標簽系統將重疊和嵌套事件抽取轉換成了詞對關系分類的任務,觸發詞、論元以及其間的關系可以并行地同時被預測出來,達到非常快的抽取速度,在3個重疊或嵌套的事件抽取數據集上的實驗結果達到了SOTA。
一、動機介紹
1.1重疊和嵌套事件抽取
事件抽取(Event Extraction,EE)是自然語言處理領域的一項非常基本的任務,在社區長久以來一直得到廣泛的研究。EE的目標是從文本中抽取事件觸發詞和相關的論元。傳統的事件抽取關注于普通的事件,認為觸發詞和論元之間沒有重疊,忽視了復雜的事件模式,即重疊事件和嵌套事件:
Flat Event:觸發詞和論元之間沒有重疊;
Overlapped Event:多個事件的共享重疊的觸發詞或論元;
Nested Event:一個事件的論元是另外一個事件。
圖1:普通事件(a),重疊事件(b),嵌套事件(c)
以圖1為例,(b)中Investment事件和Share Transfer事件共享了”acquired”這一重疊觸發詞,以及”Citic Securities”,”Guangzhou Securities”是重疊的論元。(c)中Gene Expression事件是Positive Regulation的Theme論元。
1.2重疊和嵌套事件抽取方法
截止當前,重疊和嵌套事件抽取領域的主流方法大致有三類:
基于Pipleline的方法;
基于多輪QA的方法;
基于級聯網絡的方法。
這些方法都是Multi-stage的,用多個連續的階段分別抽取事件觸發詞和論元。其中,基于級聯網絡的方法CasEE是之前的SOTA,CasEE依次預測事件類型、抽取觸發詞、抽取論元。這些Multi-stage的方法后面階段的預測依賴于前面的預測結果,難以避免地帶來了誤差傳播的問題。
本研究關注于構建一種高效的EE框架,能夠在一個階段同時解決重疊和嵌套的事件抽取。
1.3本文的方法
傳統的事件抽取使用序列標注的方法無法解決重疊和嵌套的問題,現有的工作使用指針網絡分別識別觸發詞或論元的頭尾token;我們在針對重疊和嵌套事件的共性進行深入挖掘后,發現可以通過token-pair之間的關系分類進行統一建模。觸發詞和論元可以通過token-head和token-tail之間聯系,而論元的角色可以通過觸發詞和論元之間的關系建模,例如圖1(b)中觸發詞”acquired”和論元”Guangzhou Securities”表達了object關系。
根據上述觀察,本文將Overlapped and Nested EE任務轉化成一種詞對的關系分類任務,通過這種標簽體系能夠在一個階段內抽取出事件類型、觸發詞、論元以及論元的角色,在此基礎提出了一種新的EE框架(A One-Stage Framework for Fast Overlapping and Nested Event Extraction),名為OneEE。具體地,該框架的目標是將EE轉變為識別出觸發詞和論元中所蘊含的兩種類型的關系,即:
Span關系(S-T, S-A);
Role關系(R-*);
具體的詞對關系分類示例如圖2所示。其中S-T表示兩個詞是某個觸發詞的頭部和尾部,S-A表示兩個詞是某個論元的頭部和尾部(如”Citic”->”Securities”,Argument),R-*表示該詞作為觸發詞的事件中,另一個詞扮演了角色類型為*的論元(如“acquired”->“Citic Securities”,Subject)。
圖2:關系分類示例
二、模型框架
圖3給出了OneEE整體的框架結構。其整體可分為三層:輸入編碼層,自適應事件融合曾以及最后的聯合解碼層。其中解碼層是本論文的核心。
圖3:模型整體結構
2.1 編碼層
給定一個輸入句子,將每一個詞轉換成多個word piece,并將他們輸入預訓練的BERT模塊中。進過BERT計算后,使用最大池化操作將這些word piece表示重新聚合成詞表示。
2.2 自適應事件融合層
由于該框架的目標是預測目標事件類型的詞對之間的關系,因此生成高質量的事件感知的表示十分重要。因此,為了融合編碼器提供的事件信息和上下文信息,本論文設計了一個自適應事件融合層。其中注意力模塊用于建模不同事件類型之間的交互并獲得全局事件信息,兩個門融合模塊用于將全局事件信息和目標事件類型信息與上下文化的詞表示融合。
2.3 解碼層
在自適應事件融合層之后,獲得了事件感知的詞表示,用于預測詞對之間的Span關系和Role關系,對于每個詞對(w_i , w_j ),計算一個分數來衡量它們對于關系 s ∈ S 和 r ∈ R 的可能性。為了使預測層對于詞與詞之間的相對距離敏感,論文還引入了旋轉式的相對位置編碼,設計了距離感知的打分函數。損失函數部分本文使用了Circle Loss的變體,將交叉熵損失擴展到多標簽分類問題,并緩解了類別不均衡的問題。
在解碼階段,該模型通過將事件類型Embedding并行地插入自適應事件融合層來抽取所有事件。如圖 4 所示,一旦該模型在一個階段預測了某種事件類型的所有標簽,整個解碼過程可以概括為四個步驟:首先,獲得觸發詞或論元的開始和結束索引;其次,獲得觸發詞和論元的span;第三,根據 R-* 關系匹配觸發詞和論元;最后,將事件類型分配給該事件結構。
圖4:解碼示例
三、實驗結果
本文在3個重疊和嵌套的事件抽取數據集上(包括英文和中文)進行了實驗,分別是:
FewFC,一個中文金融事件抽取數據集,標注了10種事件類型和18種論元,有約22%的句子包含重疊事件;
Genia 11和Genia 13,兩個英文醫學領域數據集,有約18%的句子包含嵌套事件,Genia11 標注了9種事件類型和10種論元,而Genia13的數字是13和7。
表1-2分別展示了上述任務和數據集上與基線模型對比的結果。實驗結果表明,本文提出的基于詞對關系分類的One-Stage方法,可以同時解決重疊和嵌套的事件抽取,并在3個數據集上的效果都優于之前的工作,并且推理速度也是最快的。
表1:FewFC, 重疊事件抽取
表2:Genia 11和Genia 13, 嵌套事件抽取
圖5:重疊事件與嵌套事件抽取效果對比
圖6:觸發詞和論元不同距離論元角色抽取效果對比
通過進一步的消融實驗,我們探索了不同參數和部件對整體框架的影響。此外我們模型在相對較小的參數情況下,其訓練和推理速度超過了多個非連續實體識別模型。
表6:消融實驗
表 7:模型參數與效率對比
四、總結
在本文中,我們提出了一種基于詞-詞關系識別的新型單階段框架,以同時解決重疊和嵌套的事件抽取。詞對之間的關系被預定義為觸發詞或論元內的詞-詞關系以及跨越觸發詞-論元對。此外,我們提出了一個有效的模型,該模型由一個用于融合目標事件表示的自適應事件融合層和一個用于聯合識別各種關系的距離感知的預測層組成。實驗結果表明,我們提出的模型在三個數據集上實現了新的 SoTA 結果,并且比 SoTA 模型更快。
-
編碼器
+關注
關注
45文章
3667瀏覽量
135237 -
網絡
+關注
關注
14文章
7599瀏覽量
89246 -
框架
+關注
關注
0文章
403瀏覽量
17542 -
模型
+關注
關注
1文章
3305瀏覽量
49220
原文標題:COLING 2022 | 基于token-pair關系建模解決重疊和嵌套事件抽取的One-stage框架
文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論