600全讯网lm0,姚记娱乐场官网网上怎么找,博彩网站娱乐建设(中国)·官方网站

很多朋友在互聯網搜索問題的時候都會大贊引擎返回的結果，而不是丟給你一堆鏈接讓你自己去查找。各類搜索引擎會對問題進行有效的匹配，總能準確的告訴你世界上有多少個國家、中國的面積有多大，以及今年清明放幾天假。但是面對更為復雜的問題可能搜索引擎黔驢技窮了，比如你想要去把上周末貪心吃掉一大塊巧克力芝士蛋糕運動燃燒掉，無論是谷歌百度還是必應搜狗都沒辦法告訴你需要騎多久的車、走多遠的路才能燃燒你的卡路里。但是，任何一個人都可以從引擎返回的前面一兩條鏈接內容里找到自己的答案。

在如今這個信息爆炸的時代，無數的信息和知識文本讓我們目不暇接。讓機器替代我們去閱讀海量的文獻并為我們提供相關問題的答案在當今社會有著十分巨大的現實需求和重要的現實意義，機器閱讀理解和問答已經成為了自然語言處理領域的關鍵任務，這一能力將會實現像電影時光機器中那位知識淵博的圖書管理員一樣強大的智能 AI知識系統。

近年來，類似SQuAD和TriviaQA等大規模的問答數據集促進了這一領域的快速發展，龐大的數據集是的研究人員可以訓練更大更深更強的深度學習模型。通過這些龐大數據集驅動的算法已經可以通過在百科中搜尋合適的內容來回答很多隨機的問題，而無需人類親力親為尋找答案。

SQuAD數據集從超過500篇百科文章中收集了超過10萬個問題，文章的每一段都列出一系列獨立的問題和與之相對應段落內一段連續內容作為答案。這種方式又稱為“抽取式問答” 。

雖然這些數據集推動著這一領域飛速發展，但依然存在不可回避的問題。事實上研究人員發現模型并沒有理解問題的內涵，而更多地傾向于去對問題的答案進行模式匹配。

From Jia and Liang. 研究顯示模型只學會了匹配城市名字而不是理解問題和答案。

為了克服這些問題，斯坦福NLP組的研究人員們Peng Qi & Danqi Chen提出了兩個新的數據集。在這篇文章中，研究人員探索了如何拓展現有機器閱讀系統的能力，并基于這兩個新的數據集探索了在問答任務中機器“閱讀”與“推理”間的相關性，以突破機器以簡單的模式匹配方式來回答問題。

其中CoQA數據集集中于對話的角度，通過自然對話的形式引入與文本段落相關豐富的上下文信息來為問答系統提供對話角度的探索方向。而HotpotQA數據集則超越了段落內容，主要集中于解決需要綜合多個文本，并進行有效推理才能獲得答案的復雜挑戰。

CoQA數據集

絕大多數現存的問答系統局限于獨立的回答問題（類似于SQuAD）。盡管這也是一種問答方式，但對人人類來說更常見的做法是聽過一系列你問我答的具有相互關聯的交流對話來獲取有效信息。CoQA就是這樣一個機遇對話問答的數據集，其中包含了自七個領域的8千個對話過程，共十二萬七千個問答數據，可以有效解決現有AI問答系統中存在的上述問題。

CoQA主要包含了從各種來源收集的文章，以及關于文章內容的一系列相關對話。對話的每一輪包含一個問題及其答案，同時每一個問題都依賴于先前的問題。與SQuAD以及其他現存的數據集不同的是，這一數據集中對話歷史對于回答很多問題的答案是不可或缺的。例如在上面例子中的第二個問題，在沒有對先前回答歷史理解的情況下是無法回答的。此外在對話中人們的注意力中心會隨著對話的進行而轉移，例如前述例子中的從問題四中的他們，到問題五中的他再到問題六中的他們，對于機器來說要回答這類對話中心迅速變化問題充滿了調整，數據集中的問題需要機器能夠更加理解對話的上下文內容才能有效回答。

CoQA還具有很多不同于先前數據集的新特征:

首先這一數據集并不會像SQuAD一樣將答案限制在文章中一個連續地區域。研究人員認為一個問題的答案不僅僅局限于一個單一的部分，而是會分布在文章各處。此外研究人員希望這一數據集可以支持自動評價，問題的答案可以獲得人類的認同。所以數據集的標注者不僅標注出了文章中對應的部分（作為給出答案的理由），同時將這些部分編輯為了自然語言形式的回答。這些給出答案的理由將提升問答系統模型的訓練效果。

其次現存的QA數據集大都集中在單個領域，使得基于這些數據集訓練的模型不具有通過的泛化能力。為了解決這一問題CoQA數據集收集了來自兒童故事、文學、中學英語測試、新聞、百科、Reddit和科學等七個領域的不同材料，使得數據集具有了更為豐富的特性。

通過對數據集進行深度的分析，研究人員發現了一系列豐富的語言學現象。首先27.2%的問題需要進行實際的推理，包括常識和預測的輔助，而不能簡單的從文章內容中進行轉述。比如需要通過對于主人公動作的描寫來推測他的性格。只有29.8%的問題可以直接通過文本匹配來回答。此外研究人員發現有30.5%的問題并不依賴于討論歷史,49.7%的問題包含“它”、“他”、“她”等清晰的討論語言標志，額外19.8%的問題需要參考整個段落或事件來進行回答。