電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)如今大火的ChatGPT,得益于AIGC 背后的關(guān)鍵技術(shù)NLP(Natural LanguageProcessing,自然語(yǔ)言處理)得到突破。
NLP技術(shù)是一種自然語(yǔ)言處理技術(shù),用于計(jì)算機(jī)中模擬人類的對(duì)話和文本理解。主要源于AI大模型化的NLP技術(shù)突破是將深度學(xué)習(xí)技術(shù)與傳統(tǒng)的NLP方法結(jié)合在一起,從而更好地提高NLP技術(shù)的準(zhǔn)確性和效率。大模型化的NLP技術(shù)能夠更好地支持企業(yè)進(jìn)行大規(guī)模的語(yǔ)料內(nèi)容分析,并為企業(yè)更好地進(jìn)行文本分析提供幫助。
語(yǔ)言是人類區(qū)別其他動(dòng)物的本質(zhì)特性。在所有生物中,只有人類才具有語(yǔ)言能力。人類的多種智能都與語(yǔ)言有著密切的關(guān)系。人類的邏輯思維以語(yǔ)言為形式,人類的絕大部分知識(shí)也是以語(yǔ)言文字的形式記載和流傳下來(lái)的。因而,它也是人工智能的一個(gè)重要,甚至核心部分。
用自然語(yǔ)言與計(jì)算機(jī)進(jìn)行通信,這是人們長(zhǎng)期以來(lái)所追求的。因?yàn)樗扔忻黠@的實(shí)際意義,同時(shí)也有重要的理論意義:人們可以用自己最習(xí)慣的語(yǔ)言來(lái)使用計(jì)算機(jī),而無(wú)需再花大量的時(shí)間和精力去學(xué)習(xí)不很自然和習(xí)慣的各種計(jì)算機(jī)語(yǔ)言;人們也可通過(guò)它進(jìn)一步了解人類的語(yǔ)言能力和智能的機(jī)制。
自然語(yǔ)言處理是指利用人類交流所使用的自然語(yǔ)言與機(jī)器進(jìn)行交互通訊的技術(shù)。通過(guò)人為的對(duì)自然語(yǔ)言的處理,使得計(jì)算機(jī)對(duì)其能夠可讀并理解。自然語(yǔ)言處理的相關(guān)研究始于人類對(duì)機(jī)器翻譯的探索。雖然自然語(yǔ)言處理涉及語(yǔ)音、語(yǔ)法、語(yǔ)義、語(yǔ)用等多維度的操作,但簡(jiǎn)單而言,自然語(yǔ)言處理的基本任務(wù)是基于本體詞典、詞頻統(tǒng)計(jì)、上下文語(yǔ)義分析等方式對(duì)待處理語(yǔ)料進(jìn)行分詞,形成以最小詞性為單位,且富含語(yǔ)義的詞項(xiàng)單元。
自然語(yǔ)言理解的發(fā)展經(jīng)歷了幾個(gè)階段。在20世紀(jì)60年代,隨著計(jì)算機(jī)技術(shù)的發(fā)展,自然語(yǔ)言處理技術(shù)也進(jìn)一步提升。當(dāng)時(shí),美國(guó)國(guó)家科學(xué)基金會(huì)(NSF)成立了“自然語(yǔ)言處理研究計(jì)劃”,專門用于支持自然語(yǔ)言處理技術(shù)的研究。同時(shí),英國(guó)也成立了“自然語(yǔ)言處理研究室(Natural Language Processing Research Laboratory)”,專門致力于自然語(yǔ)言處理技術(shù)的研究與應(yīng)用。
在20世紀(jì)70年代,自然語(yǔ)言處理技術(shù)又迎來(lái)了一個(gè)新的發(fā)展階段。這一時(shí)期,自然語(yǔ)言處理技術(shù)發(fā)展到了語(yǔ)言學(xué)理論與計(jì)算機(jī)科學(xué)相結(jié)合的階段。其中,語(yǔ)義學(xué)和句法學(xué)等語(yǔ)言學(xué)理論成為自然語(yǔ)言處理技術(shù)研究的重要基礎(chǔ)。
在20世紀(jì)80年代,隨著人工智能技術(shù)的進(jìn)一步發(fā)展,自然語(yǔ)言處理技術(shù)也進(jìn)入了一個(gè)新的階段。這一時(shí)期,自然語(yǔ)言處理技術(shù)得到了廣泛應(yīng)用,并取得了一系列突破性成果。例如,英國(guó)語(yǔ)言工程研究所(LEL)在1983年成功開發(fā)出了世界上第一個(gè)基于人工智能的翻譯系統(tǒng),該系統(tǒng)能夠?qū)⒂⒄Z(yǔ)翻譯成法語(yǔ)。
在20世紀(jì)90年代,自然語(yǔ)言處理技術(shù)進(jìn)一步發(fā)展壯大。隨著互聯(lián)網(wǎng)的普及,自然語(yǔ)言處理技術(shù)在搜索引擎、社交媒體、客服機(jī)器人等領(lǐng)域得到廣泛應(yīng)用。此外,自然語(yǔ)言處理技術(shù)還進(jìn)入了深度學(xué)習(xí)階段,開始使用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行語(yǔ)言模型的建立和訓(xùn)練,從而提升自然語(yǔ)言處理技術(shù)的準(zhǔn)確性和效率。如今,自然語(yǔ)言處理技術(shù)已經(jīng)成為人工智能領(lǐng)域的重要組成部分,并在多個(gè)領(lǐng)域得到廣泛應(yīng)用。
比如,醫(yī)療健康面臨的困難之一是難以獲得。打醫(yī)生辦公室電話并一直等待的情況十分常見,與索賠代表聯(lián)系可能同樣困難。通過(guò)實(shí)施 NLP來(lái)訓(xùn)練聊天機(jī)器人是醫(yī)療健康行業(yè)的一項(xiàng)新興技術(shù),可以解決醫(yī)療專業(yè)人員的短缺問(wèn)題,并開創(chuàng)與患者的溝通渠道。
NLP的另一個(gè)重要的醫(yī)療健康應(yīng)用程序是生物醫(yī)學(xué)文本挖掘。鑒于生物文獻(xiàn)數(shù)量眾多,以及生物醫(yī)學(xué)出版速度不斷提高,自然語(yǔ)言處理是一個(gè)關(guān)鍵的工具,可以在已發(fā)表的研究中提取信息,推動(dòng)生物醫(yī)學(xué)領(lǐng)域的知識(shí)進(jìn)步。這非常有助于藥物研發(fā)和疾病診斷。
NLP是為金融服務(wù)公司構(gòu)建更好的聊天機(jī)器人和AI助理的關(guān)鍵組成部分。在眾多用于基于 NLP的應(yīng)用程序的語(yǔ)言模型中,BERT已成為機(jī)器學(xué)習(xí)領(lǐng)域 NLP 的領(lǐng)軍者及語(yǔ)言模型。例如,銀行可以使用NLP來(lái)評(píng)估信用記錄很少或沒(méi)有信用記錄的客戶信譽(yù)。
自然語(yǔ)言處理應(yīng)用在過(guò)去十年呈爆炸式增長(zhǎng),預(yù)計(jì)自然語(yǔ)言處理未來(lái)仍有望以幾何級(jí)數(shù)增長(zhǎng)。據(jù)相關(guān)調(diào)查顯示,在全球市場(chǎng)中,與自然語(yǔ)言處理相關(guān)的產(chǎn)品和服務(wù)將在2025年增長(zhǎng)到430億美元,而2017年時(shí),這一數(shù)字為30億美元。
-
AI
+關(guān)注
關(guān)注
87文章
31513瀏覽量
270326 -
nlp
+關(guān)注
關(guān)注
1文章
489瀏覽量
22107 -
ChatGPT
+關(guān)注
關(guān)注
29文章
1568瀏覽量
8057
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論