互聯(lián)網(wǎng)無(wú)疑成為我們生活、學(xué)習(xí)、工作不可缺少的平臺(tái)。而伴隨互聯(lián)網(wǎng)產(chǎn)生的搜索引擎,幾乎是每個(gè)人上網(wǎng)都會(huì)使用到的。搜索引擎自誕生以來(lái),依托于爬蟲、檢索排序、大數(shù)據(jù)處理、自然語(yǔ)言處理等多種技術(shù),為檢索用戶提供信息服務(wù)。
目前,隨著人工智能技術(shù)的快速發(fā)展,得益于自然語(yǔ)言理解、知識(shí)圖譜等技術(shù)的支撐,傳統(tǒng)的信息檢索正在向新一代智能搜索轉(zhuǎn)變?!靶乱淮阉鲗⒅饕譃閮蓚€(gè)方向,一個(gè)方向是從通用搜索進(jìn)入行業(yè)企業(yè),成為行業(yè)的智能決策支撐;另一個(gè)方向則在更遙遠(yuǎn)的未來(lái),搜索是在個(gè)人端的技術(shù)演進(jìn),成為個(gè)人智能信息助手。” 一覽群智CEO胡健表示。
那么,從傳統(tǒng)信息搜索到新一代智能搜索,底層技術(shù)有什么改變?從感知智能到認(rèn)知智能,企業(yè)又應(yīng)該從何入手?筆者近日采訪了一覽群智CEO胡健,就新一代智能搜索,以及其中涉及的人工智能技術(shù)進(jìn)行了深入探討。
傳統(tǒng)信息搜索的現(xiàn)狀與瓶頸
搜索技術(shù)的架構(gòu)和交互界面已經(jīng)有30年沒(méi)有改變過(guò)。由于搜索都是采用關(guān)鍵詞檢索的方法,無(wú)法做到完整的描述整個(gè)信息需求,因此,搜索系統(tǒng)不會(huì)主動(dòng)進(jìn)行交互和引導(dǎo),只是高度依賴用戶的表達(dá)能力,因此人們得到的信息也是千人一面。
此外,搜索的核心技術(shù)也有10年沒(méi)有重大進(jìn)步,傳統(tǒng)信息檢索與挖掘算法缺乏對(duì)底層數(shù)據(jù)與認(rèn)知基礎(chǔ)的理解,并沒(méi)有充分解決該領(lǐng)域核心問(wèn)題,導(dǎo)致搜索結(jié)果難以解釋,算法效率難以提升。
傳統(tǒng)的搜索是相對(duì)傻瓜化的通用決策引擎。搜索的本質(zhì)是整合了互聯(lián)網(wǎng)的海量、多源、異構(gòu)的數(shù)據(jù)理解網(wǎng)頁(yè)內(nèi)容,同時(shí)理解用戶的查詢需求,最終將兩方進(jìn)行匹配。在通用情況下,搜索引擎不會(huì)切分特別細(xì)致,這就造成交互形態(tài)是簡(jiǎn)單的。此外,由于通用搜索引擎對(duì)于效率要求高,對(duì)網(wǎng)頁(yè)理解也相對(duì)簡(jiǎn)單,因此,大家通過(guò)搜索引擎得到的結(jié)果也是近似的。
因此,搜索引擎需要升級(jí)轉(zhuǎn)型,下一代智能搜索應(yīng)運(yùn)而生。隨著人工智能技術(shù)的快速發(fā)展,新一代智能搜索正在成為可能。
新一代智能搜索加速探索
在一覽群智首席科學(xué)家文繼榮看來(lái),智能信息檢索與挖掘是搜索的發(fā)展方向,而其具體表現(xiàn)現(xiàn)實(shí)是智能信息助手,它將取代搜索引擎成為連接人與信息的新工具,用存儲(chǔ)、計(jì)算和智能拓展人的能力,構(gòu)建具有超級(jí)記憶力、知識(shí)能力和分析能力的“超級(jí)助手”,能夠隨時(shí)、隨地方便地獲取高質(zhì)量相關(guān)信息和知識(shí)。文繼榮不僅是一覽群智首席科學(xué)家,還是中國(guó)人民大學(xué)信息學(xué)院院長(zhǎng)、中國(guó)人民大學(xué)高瓴人工智能學(xué)院院長(zhǎng),他正在領(lǐng)導(dǎo)“智能信息檢索與挖掘”團(tuán)隊(duì),致力于做出“基于自然交互的個(gè)人智能信息助手”,取代傳統(tǒng)的搜索引擎,成為下一代信息獲取工具。并將在這個(gè)過(guò)程中,在理論基礎(chǔ)、算法模型、系統(tǒng)三個(gè)層面展開(kāi)研究,進(jìn)行源頭創(chuàng)新。
智能信息助手是可以有多重形態(tài),可以是機(jī)器人,也可以是無(wú)形的。它有大腦,可以理解人們所提出的需求,給予回應(yīng),并且這種對(duì)話可以是多輪深度的。但是,現(xiàn)如今還達(dá)不到智能信息助手的狀態(tài),因?yàn)?,智能信息助手要與人形成溝通,理解人說(shuō)話的意思,是需要有“腦子”。
“新一代搜索的另外一個(gè)形態(tài)我們將更快看到,那就是將通用搜索應(yīng)用在行業(yè)企業(yè)中。”胡健說(shuō),當(dāng)前的人工智能的智力是相當(dāng)于12歲的孩子,推理能力還相對(duì)較弱,但是其腦容量特別大,記憶力特別好,可以結(jié)合其優(yōu)勢(shì)來(lái)找到適合的場(chǎng)景,也就是智能決策引擎。
智能決策引擎不是簡(jiǎn)單的進(jìn)行搜索,而是將不同渠道、異構(gòu)的數(shù)據(jù)整合,將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化成結(jié)構(gòu)化數(shù)據(jù),再關(guān)聯(lián)企業(yè)業(yè)務(wù)流程,從而進(jìn)行分析預(yù)測(cè),輔助企業(yè)進(jìn)行決策。胡健強(qiáng)調(diào),一定要加上“輔助”二字,因?yàn)楝F(xiàn)階段,完全通過(guò)機(jī)器自動(dòng)完成還沒(méi)有實(shí)現(xiàn)。
目前,智能決策引擎可以替代中低端腦力勞動(dòng)工作者,例如公安和司法領(lǐng)域,智能決策引擎能夠更好的整合案情案件數(shù)據(jù)、結(jié)構(gòu)化視頻數(shù)據(jù),做好事前預(yù)警、事中跟蹤和事后研判。其次,可以將專家的經(jīng)驗(yàn)變成模型,用模型來(lái)替代偏分析判斷類、輔助決策類的工作,從而可以替代偏重復(fù)性或半重復(fù)性的中檔腦力勞動(dòng)者。
感知智能向認(rèn)知智能演進(jìn)
隨著移動(dòng)互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算等技術(shù)的快速發(fā)展,圖像、語(yǔ)音、視頻等與感知相關(guān)的感知能力在快速發(fā)展。目前,人工智能正在向能夠理解、思考、判斷、分析等認(rèn)知智能延伸。人工智能的發(fā)展到了由感知智能邁向認(rèn)知智能的界點(diǎn)。
如今的人工智能還是弱人工智能狀態(tài),沒(méi)有所謂的大腦,若想形成大腦,最核心的就是要有知識(shí)。將人類的各種經(jīng)驗(yàn)沉淀,形成模型,讓機(jī)器可以讀得懂并且使用,最終成為生產(chǎn)力,這就是認(rèn)知智能。認(rèn)知智能技術(shù)是智能信息助手實(shí)現(xiàn)基礎(chǔ)。
胡健表示,目前,認(rèn)知智能最大的難題就是構(gòu)建知識(shí)。如今知識(shí)有很多,可以構(gòu)建很多知識(shí)圖譜,但是開(kāi)放性知識(shí)圖譜還很難形成。原因有二:一是關(guān)聯(lián)密度不足;二是知識(shí)的干凈程度不夠。但是,在專用領(lǐng)域,可以通過(guò)人工校驗(yàn)的方式,來(lái)構(gòu)建相對(duì)較準(zhǔn)確的行業(yè)知識(shí)圖譜。
過(guò)去,構(gòu)建知識(shí)圖譜基本都是依靠人工,隨著數(shù)據(jù)的在線化,知識(shí)圖譜可以由機(jī)器以自動(dòng)的方式來(lái)進(jìn)行構(gòu)建,而機(jī)器構(gòu)建的知識(shí)圖譜的數(shù)量級(jí)也會(huì)更大。此外,圖數(shù)據(jù)庫(kù)的快速發(fā)展,也可以將知識(shí)圖譜中的圖數(shù)據(jù)進(jìn)行存儲(chǔ)。第三,得益于大數(shù)據(jù)的發(fā)展,海量數(shù)據(jù)的出現(xiàn)以及計(jì)算能力的提升,使得知識(shí)圖譜的構(gòu)建更加精準(zhǔn)。
胡健認(rèn)為,人工智能要形成閉環(huán),需要感知智能與認(rèn)知智能相結(jié)合才有價(jià)值。但是,現(xiàn)階段,認(rèn)知水平還有限,機(jī)器還不能完全像人一樣有大腦來(lái)進(jìn)行決策。因此,重復(fù)式的、推理要求較低、沒(méi)有歧義需求的封閉場(chǎng)景,是完全可以用認(rèn)知智能的技術(shù)來(lái)解決的。
一覽群智的“超”能力
除了在學(xué)術(shù)界有著超前的理論研究以外,一覽群智還將在現(xiàn)階段幫助用戶落地相關(guān)人工智能技術(shù)。
一覽群智于2015年11月成立,是一家以自然語(yǔ)言處理和知識(shí)圖譜等認(rèn)知智能技術(shù)為核心的人工智能公司,為客戶提供一站式AI產(chǎn)品和行業(yè)解決方案。在一覽群智公司里,除了有文繼榮教授帶領(lǐng)的技術(shù)研究團(tuán)隊(duì),為智能信息助手的未來(lái)發(fā)展奠定基礎(chǔ)以外,還有胡健帶領(lǐng)的產(chǎn)品應(yīng)用落地團(tuán)隊(duì),來(lái)確保行業(yè)智能決策引擎落地。
胡健將公司推出的四大產(chǎn)品稱作為智能搜索的四大底座,從感知智能到認(rèn)知智能形成閉環(huán)。基于自然語(yǔ)言處理平臺(tái)智語(yǔ)產(chǎn)品來(lái)理解用戶的意圖;知識(shí)圖譜構(gòu)建平臺(tái)智圖,讓機(jī)器學(xué)會(huì)知識(shí);交互式關(guān)聯(lián)分析平臺(tái)智策,復(fù)制行業(yè)專家級(jí)分析推理能力,從而達(dá)到人機(jī)有效協(xié)同工作;最后通過(guò)機(jī)器學(xué)習(xí)與智能標(biāo)注平臺(tái)智慧來(lái)進(jìn)行學(xué)習(xí),最終打造成Elens智能決策平臺(tái)。
胡健表示,未來(lái)的搜索可以在企業(yè)或者行業(yè)內(nèi)部來(lái)使用。但是,并不是每家企業(yè)都適用。首先,企業(yè)需要有數(shù)據(jù)。數(shù)據(jù)是一切的基礎(chǔ),沒(méi)有數(shù)據(jù)是無(wú)法構(gòu)建知識(shí)圖譜,也就無(wú)法形成企業(yè)內(nèi)部的搜索。第二,企業(yè)信息化程度要相對(duì)較高,如果企業(yè)信息化程度較低,很多業(yè)務(wù)流程還沒(méi)有完善,在企業(yè)信息化程度不高時(shí)做出來(lái)的搜索也是徒勞。第三是資金實(shí)力相對(duì)雄厚,畢竟構(gòu)建知識(shí)圖譜并不是一件便宜的事情,因此企業(yè)需要有一定的資金支持才能完成。
目前,依托于Elens智能決策平臺(tái),結(jié)合企業(yè)內(nèi)部以及行業(yè)公開(kāi)數(shù)據(jù),一覽群智打造出金融智能決策解決方案和政企智能決策解決方案,滿足金融行業(yè)和政企用戶的需求。
結(jié)語(yǔ)
現(xiàn)如今的人工智能屬于初級(jí)的探索階段,就像十年前的云計(jì)算,業(yè)界也出現(xiàn)很多做人工智能的公司,頗有百花齊放的狀態(tài)。胡健認(rèn)為,人工智能的技術(shù)都只是一個(gè)點(diǎn),人工智能企業(yè)需要通過(guò)這一個(gè)點(diǎn),幫助用戶打造完整的解決方案,從而幫助企業(yè)進(jìn)行數(shù)字化轉(zhuǎn)型升級(jí)。
的確,如今從事人工智能領(lǐng)域的公司眾多,都在圍繞不同場(chǎng)景幫助用戶提供服務(wù),而此階段的人工智能尚處于初級(jí)階段,無(wú)論是學(xué)術(shù)研究、還是服務(wù)提供商,乃至企業(yè)應(yīng)用,都需要攜手推進(jìn),加速人工智能技術(shù)的落地,才能產(chǎn)生出更大的價(jià)值。
責(zé)任編輯:ct
評(píng)論
查看更多