前不久,DeepMind放出大招AlphaFold。在“蛋白質(zhì)結(jié)構(gòu)預(yù)測奧運會”CASP13比賽中,力壓其他參賽者。
那么,DeepMind這項研究到底意味著什么?會帶來什么樣的影響?
作為業(yè)內(nèi)人士,哈佛醫(yī)學(xué)院系統(tǒng)生物學(xué)研究員Mohammed AlQuraishi對其進行了解讀。他博士畢業(yè)于斯坦福大學(xué),參加了CASP13,是AlphaFold大放異彩的見證者。
他認(rèn)為,AlphaFold有進步,但并沒有解決根本的問題。不過,它在生物化學(xué)中最重要的問題之一上取得了重大進展,大家應(yīng)該為此感到高興。
此外,AlphaFold推出之后,也引發(fā)了外界的質(zhì)疑,不少人都認(rèn)為這是一個高超的工程技術(shù),并不能稱得上是一個基礎(chǔ)的科學(xué)見解。 AlQuraishi認(rèn)為,AlphaFold兩者兼具。
解讀文章發(fā)表之后,引發(fā)了不小的關(guān)注。不少業(yè)內(nèi)人士發(fā)表評論稱,這是目前關(guān)于AlphaFold的最好的一篇解讀。
AlphaFold有進步,但沒有解決根本問題
從AlphaFold給CASP成績帶來的提升來看,的確是取得了進步。但這個進步,是學(xué)術(shù)研究的自然增長,還是AlphaFold依靠自身能力帶來的呢?這是一個非常容易忽視、且容易引發(fā)分歧的問題。
上圖中,呈現(xiàn)了每屆CASP第一名和第二名的成績,虛線代表著CASP13預(yù)期成績,是根據(jù)CASP10到12的平均改善率預(yù)測的。
在CASP 10之前,整個增長曲線10年來基本上是平緩的。CASP11的提升,是因為引入了協(xié)同進化的方法。CASP 12帶來的提升,是這些方法最終被證明了。即使沒有AlphaFold,CASP13的成績,也會因為在協(xié)同進化方法中廣泛應(yīng)用深度學(xué)習(xí),出現(xiàn)進一步的提升。
AlphaFold的意義,在于取得了更大幅度的提升。從圖中可以看出,第二好的方法,基本上和預(yù)計的差不多,而AlphaFold又在這個基礎(chǔ)上提升了不少。
因此,可以說AlphaFold取得了實質(zhì)性進展。
但這是否就意味著問題已經(jīng)解決了,或者說解決得差不多了呢?答案依舊是否定的。 AlQuraishi表示,AlphaFold的技術(shù)還沒有到達那一步。
如果按照AlphaFold這樣的發(fā)展勢頭,四年內(nèi)就能夠達到真正解決問題的地步。當(dāng)然,這是以發(fā)展勢頭能夠持續(xù)為前提的。但如果沒有新的概念突破,就沒有任何理由能夠證明,這個勢頭是可持續(xù)的。
一個有趣的假設(shè)是,如果其他有一個學(xué)術(shù)團體取得了與DeepMind相同的成果,會不會引發(fā)同樣大的關(guān)注?答案當(dāng)然是否定的。從CASP11→ CASP12的進步中就證明了這一點,當(dāng)時的進步并不比這一次差,但新聞報道寥寥無幾。
毫無疑問,DeepMind的影響力與受關(guān)注度,發(fā)揮了很大的作用,當(dāng)然,這對整個領(lǐng)域的發(fā)展也有很大的幫助。
此外,AlQuraishi認(rèn)為人們對DeepMind帶來的進步過于樂觀了,這是他們第一次進入這個領(lǐng)域,優(yōu)秀的工程附加價值可能不會重復(fù)出現(xiàn)。
但不論如何,DeepMind都給當(dāng)前的研究格局帶來了極大的沖擊。AlphaFold推出之后,CASP13上討論最多的一個問題就是,這是學(xué)科基礎(chǔ)的突破,還是DeepMind依賴高超的工程技術(shù)帶來的突破?
學(xué)科基礎(chǔ)的突破還是高超的工程技術(shù)?
AlQuraishi認(rèn)為,這個問題非常愚蠢,而且也會引起分歧。如果非要回答這個問題的話,兩者兼有。
從學(xué)科基礎(chǔ)突破方面來看,DeepMind有很多不錯的想法。
首先,他們不僅預(yù)測了這些氨基酸的化學(xué)鍵之間連接的角度與相互作用,還預(yù)測了成對的氨基酸之間的距離。
雖然說之前也有學(xué)者采用了相同的方法,但多重跡象表明,兩個團隊是獨立發(fā)展出這個想法的。至關(guān)重要的是,AlphaFold還進一步預(yù)測了距離分布。根據(jù)DeepMind官方博客的信息:
他們訓(xùn)練了一個神經(jīng)網(wǎng)絡(luò)來預(yù)測蛋白質(zhì)中每對殘基之間的距離分布。然后,將這些概率組合成一個分?jǐn)?shù),用來估計一個蛋白質(zhì)結(jié)構(gòu)的準(zhǔn)確度,又另外訓(xùn)練了一個單獨的神經(jīng)網(wǎng)絡(luò),基于所有距離的總和來評估初步給出的蛋白質(zhì)結(jié)構(gòu)與正確答案的接近程度。
其次,AlphaFold在進一步預(yù)測蛋白質(zhì)結(jié)構(gòu)的時候,還運用到了勢函數(shù)相關(guān)的知識。根據(jù)參考狀態(tài),把用神經(jīng)網(wǎng)絡(luò)生成的勢函數(shù)中的勢進行歸一化。再用另一個獨立運行的算法把它最小化,進而生成蛋白質(zhì)折疊。
雖然這些想法看上去非常簡單,但科學(xué)不就是用簡單的想法產(chǎn)生深遠的影響嗎?
當(dāng)然,DeepMind也利用了他們在機器學(xué)習(xí)方面深厚的專業(yè)知識。例如,分布預(yù)測的想法與他們在一年前發(fā)表的關(guān)于分布強化學(xué)習(xí)的論文有點相似。
這對AlphaFold有沒有影響不得而知。但可以確定的是,機器學(xué)習(xí)和蛋白質(zhì)兩個領(lǐng)域的專業(yè)知識結(jié)合對于實現(xiàn)這些進步有很大的幫助。
在工程方面自是不消多說,現(xiàn)在大家看到的任何“優(yōu)雅”的解決方案,都是多次試錯的結(jié)果,這很大程度上取決于計算能力和人力資源。
學(xué)術(shù)團體的危機:到底發(fā)生了什么?未來怎么辦?
很多相關(guān)的研究學(xué)者,尤其是參加CASP13的學(xué)者,看到DeepMind的研究成果,都有一種存在主義的焦慮感。
非常具有諷刺意義的是,這些學(xué)者的目標(biāo)就是要淘汰蛋白質(zhì)晶體研究者,現(xiàn)在也在擔(dān)心自己被淘汰。
AlQuraishi認(rèn)為,大多數(shù)人都經(jīng)歷了以下的幾個階段:
一開始,擔(dān)心DeepMind團隊?wèi){借著一些卓越的洞察力,加上頂尖的工程技術(shù),超越了我們所有人;
然后,看到他們的見解與大多數(shù)人的想法并沒有太多的不同,就松了一口氣;
進而開始貶低DeepMind的貢獻,并將其取得的成功,歸功于Alphabet掌握的資源。
撇開上述觀點的有效性不談,他們潛在的擔(dān)憂是,蛋白質(zhì)結(jié)構(gòu)預(yù)測作為一個學(xué)術(shù)領(lǐng)域,是否會像機器學(xué)習(xí)一樣,最好的研究將會在工業(yè)界的實驗室中誕生,而學(xué)術(shù)團體只能夠分食剩下的殘渣。
說實話,這個問題沒有答案。這個設(shè)想也是未來可能出現(xiàn)的情景。隨著DeepMind的加入,學(xué)術(shù)界的研究者這不得不考慮這一點。
關(guān)鍵是,學(xué)術(shù)研究團體,是否應(yīng)該就此放棄他們的蛋白質(zhì)結(jié)構(gòu)研究項目,轉(zhuǎn)向其他領(lǐng)域?換了新的領(lǐng)域,是不是還會有其他的科技公司進入,繼續(xù)壓迫他們的研究空間?就這些問題,AlQuraishi給出了自己的一些想法。
最重要的一點是,應(yīng)該意識到DeepMind的進入,是一件不可預(yù)測的好事。推動了整個科學(xué)界在生物化學(xué)最重要的問題上取得了重大進展。是誰取得了進展不重要,重要的是取得了進展。
而且,DeepMind的進入也表明了現(xiàn)在有了新的、世界一流的研究團隊在這個領(lǐng)域投入資源,并于現(xiàn)有最優(yōu)秀的團隊進行競爭。如果這樣的情況每十年發(fā)生一次,我們應(yīng)該張開雙臂歡迎。
我們也應(yīng)該鼓勵他們像學(xué)術(shù)團體一樣,公開分享他們的研究成果,學(xué)術(shù)團體也可以像他們學(xué)習(xí)如何改進工程實踐。
更何況,DeepMind也提高了蛋白質(zhì)結(jié)構(gòu)問題的知名度,也會激勵大量的人們進入這個領(lǐng)域。
面對DeepMind,最好的方法,就是的適應(yīng)。就像人工智能領(lǐng)域一樣,學(xué)術(shù)團體應(yīng)該把目光放在對資源要求較低,需要關(guān)鍵概念突破才能帶來進展的問題上。就蛋白質(zhì)結(jié)構(gòu)預(yù)測而言,這是一個多重的問題,真正解決這個問題,需要協(xié)同的方法。
此外,AlQuraishi也透露了DeepMind在AlphaFold上后續(xù)的動向,并表達了自己看法:
DeepMind已經(jīng)承諾了要發(fā)表一篇關(guān)于AlphaFold的論文,最終和確切的描述還要看他們的論文。不過,他們并沒有發(fā)布源代碼的計劃,短期內(nèi)也不太可能建立一個公開的預(yù)測服務(wù)器。
話雖如此,但他們在CASP13期間樂于討論他們的方法,并且似乎真的有興趣與社區(qū)分享這種方法,并希望其他學(xué)者能夠在此基礎(chǔ)上進一步發(fā)展。我的感覺是,他們是為了科學(xué)。
你怎么看?
-
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5516瀏覽量
121553 -
DeepMind
+關(guān)注
關(guān)注
0文章
131瀏覽量
10942
原文標(biāo)題:哈佛醫(yī)學(xué)院研究員解讀DeepMind大突破AlphaFold:有進步,但未解決根本問題
文章出處:【微信號:CAAI-1981,微信公眾號:中國人工智能學(xué)會】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論