基于詞句協同排序的單文檔自動摘要算法
大小:0.92 MB 人氣: 2017-11-30 需要積分:1
標簽:自動摘要(6177)
隨著Web2.0的迅猛發展,各種用戶原創內容爆炸式增長,造成了互聯網上嚴重的信息過載,使得有價值信息的獲取愈發困難。自動摘要技術能夠從海量文本中抽取出最為重要的語句,形成高度概括原文主旨的精煉短文,能夠有效地緩解信息過載。
總體而言,自動摘要分為基于抽象的自動摘要和基于抽取的自動摘要?;诔橄蟮淖詣诱苤朴谧匀徽Z言處理的瓶頸,實現相對困難。目前主要的研究和應用集中在基于抽取的自動摘要,又稱節錄式摘要,計算文檔中句子的權重并進行排序,從中抽取高權重語句生成摘要?,F有工作中對句子權重的計算主要分為兩種思路:通過詞的權重推測句子的權重或通過句子特征計算權重。事實上,文檔中的詞與句是不可分割的整體,充分考慮詞句之間的協同關系有助于進一步提高自動摘要的質量。本文面向單文檔自動摘要,將文檔建模為以句子為頂點、句子間的關聯為邊的句網絡圖,以圖排序算法為基礎,重新設計迭代過程,在計算句子權重時融入詞對句子權重評分的影響,提出一種詞句協同排序( Word-Sentence-Rank,WSRank)的自動摘要算法。實驗表明,詞的融入有助于進一步提高句子權重計算的準確性,提升摘要的質量。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%