衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習是許多生物學家用來分析數據的計算工具

姚小熊27 ? 來源:AI人工智能網 ? 作者:AI人工智能網 ? 2020-10-19 15:09 ? 次閱讀

機器學習是許多生物學家用來分析大量數據的計算工具,幫助他們識別潛在的新藥。麻省理工學院的研究人員現在已經在這些類型的機器學習算法中加入了一個新的特性,從而提高了他們的預測能力。

利用這種新的方法,計算機模型可以解釋他們分析數據的不確定性,麻省理工學院的研究小組發現了幾種有希望的化合物,這些化合物的目標是導致結核病的細菌所需的一種蛋白質。

這種方法以前曾被計算機科學家使用過,但尚未在生物學上得到應用,也可能在蛋白質設計和許多其他生物學領域有用,西蒙斯數學系教授、麻省理工學院計算機科學和人工智能實驗室(CSAIL)計算和生物學小組負責人邦尼·伯杰(Bonnie Berger)說。

“這項技術是已知的機器學習子領域的一部分,但人們還沒有把它引入生物學,”Berger說。“這是一個范式的轉變,絕對是生物探索的方式。”

Berger和Bryan Bryson是麻省理工學院的生物工程助理教授,也是MGH、MIT和哈佛的拉根研究所的成員,他們是這項研究的高級作者。細胞系統。麻省理工學院研究生BrianHie是論文的主要作者。

更好的預測

機器學習是一種計算機建模,在這種模型中,算法學習根據已經看到的數據進行預測。近年來,生物學家開始利用機器學習來搜索潛在藥物化合物的龐大數據庫,以找到與特定目標相互作用的分子。

這種方法的一個局限性是,當他們分析的數據與他們接受訓練的數據相似時,這些算法表現得很好,但它們并不擅長評估那些與他們已經看到的分子有很大不同的分子。

為了克服這一問題,研究人員使用了一種叫做高斯過程的技術,將不確定性值分配給算法所訓練的數據。這樣,當模型分析訓練數據時,他們也會考慮到這些預測的可靠性。

例如,如果進入模型的數據預測某一特定分子與目標蛋白質的結合程度,以及這些預測的不確定性,該模型可以利用這些信息對蛋白質-目標相互作用進行預測,這是它以前從未見過的。該模型還估計了自己預測的確定性。在分析新的數據時,模型的預測對于與訓練數據有很大不同的分子來說,其確定性可能較低。研究人員可以利用這些信息來幫助他們決定實驗測試哪些分子。

這種方法的另一個優點是該算法只需要少量的訓練數據。在這項研究中,麻省理工學院的研究小組用72個小分子及其與400多個蛋白質的相互作用(稱為蛋白激酶)對模型進行了訓練。然后,他們能夠使用這個算法分析近11000個小分子,這些小分子是從鋅數據庫中提取的,鋅數據庫是一個公開可用的儲存庫,含有數百萬種化合物。其中許多分子與訓練數據中的分子非常不同。

利用這一方法,研究人員能夠識別出與他們所加入的蛋白激酶具有非常強的結合親緣關系的分子。其中包括三種人類激酶,以及在結核分枝桿菌中發現的一種激酶。這種激酶,PknB,是細菌生存的關鍵,但不是任何一線結核病抗生素的目標。

研究人員隨后通過實驗測試了他們的一些最成功之處,以了解他們與目標的結合程度,并發現模型的預測非常準確。在模型給出的最確定的分子中,大約90%被證明是真正的命中--遠高于現有用于藥物篩選的機器學習模型的30%到40%的命中率。

研究人員還使用相同的訓練數據來訓練不包含不確定性的傳統機器學習算法,然后讓它分析相同的11000個分子庫。他說:“沒有不確定性,這個模型就會變得非常混亂,它提出了與激酶相互作用的非常奇怪的化學結構。”

然后,研究人員采取了一些最有前途的PknB抑制劑,并測試他們在細菌培養培養基中生長的結核分枝桿菌,并發現它們抑制細菌的生長。這些抑制劑也在感染細菌的人免疫細胞中起作用。

一個好的起點

這種方法的另一個重要因素是,一旦研究人員獲得額外的實驗數據,他們就可以將其添加到模型中,并對其進行再培訓,從而進一步改進預測。研究人員說,即使是少量的數據也能幫助模型變得更好。

Hie說:“每次迭代都不需要非常大的數據集。”“你可以用10個新的例子重新訓練這個模型,這是一個生物學家很容易產生的東西。”

布萊森說,這項研究是多年來首次提出新的分子,可以針對PknB,并且應該給藥物開發人員一個很好的起點,可以嘗試開發針對激酶的藥物。他說:“我們現在為他們提供了一些新的線索,超出了已經公布的范圍。”

研究人員還表明,他們可以利用同樣的機器學習來提高綠色熒光蛋白的熒光輸出,綠色熒光蛋白通常用于標記活細胞內的分子。它也可以應用于許多其他類型的生物學研究,Berger說,他現在正用它來分析推動腫瘤發展的突變。
責任編輯:YYX

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1796

    文章

    47680

    瀏覽量

    240297
  • 機器學習
    +關注

    關注

    66

    文章

    8439

    瀏覽量

    133087
收藏 人收藏

    評論

    相關推薦

    傳統機器學習方法和應用指導

    用于開發生物學數據機器學習方法。盡管深度學習(一般指神經網絡算法)是一個強大的工具,目前也非常
    的頭像 發表于 12-30 09:16 ?398次閱讀
    傳統<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    微流控技術的生物學應用

    微流控技術為在推動生物學眾多領域的強大工具做出了巨大貢獻。隨著用于微通道中流體的注射、混合、泵送和存儲的新器件和工藝的發展,近年來微流控系統在化學和生物化學中的應用越來越廣泛。 盡管微流控技術近年來
    的頭像 發表于 12-01 21:50 ?207次閱讀

    什么是機器學習?通過機器學習方法能解決哪些問題?

    計算機系統自身的性能”。事實上,由于“經驗”在計算機系統中主要以數據的形式存在,因此機器學習需要設法對
    的頭像 發表于 11-16 01:07 ?512次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    《AI for Science:人工智能驅動科學創新》第一章人工智能驅動的科學創新學習心得

    人工智能:科學研究的加速器 第一章清晰地闡述了人工智能作為科學研究工具的強大功能。通過機器學習、深度學習等先進技術,AI能夠處理和分析海量
    發表于 10-14 09:12

    【《時間序列與機器學習》閱讀體驗】+ 時間序列的信息提取

    本人有些機器學習的基礎,理解起來一點也不輕松,加油。 作者首先說明了時間序列的信息提取是時間序列分析的一個重要環節,目標是從給定的時間序列數據中提取出有用的信息和特征,以支持后續的
    發表于 08-14 18:00

    【「時間序列與機器學習」閱讀體驗】全書概覽與時間序列概述

    的應用也很廣泛,用機器學習為時間分析帶來新的可能性。人們往往可以通過過往的時間序列數據來預測未來,在各行各業中都有很好的應用與發展前景。 時間序列分類: 1.單維時間序列 單維時間序列
    發表于 08-07 23:03

    數據分析除了spss還有什么

    Sciences)是一款非常流行的統計分析軟件,但除了SPSS之外,還有許多其他數據分析工具和方法。 引言 數據分析是一個跨學科的領域,涉
    的頭像 發表于 07-05 15:01 ?713次閱讀

    數據分析工具有哪些

    數據分析是一個涉及收集、處理、分析和解釋數據以得出有意義見解的過程。在這個過程中,使用正確的工具至關重要。以下是一些主要的數據分析
    的頭像 發表于 07-05 14:54 ?1057次閱讀

    機器學習數據分析中的應用

    隨著大數據時代的到來,數據量的爆炸性增長對數據分析提出了更高的要求。機器學習作為一種強大的工具
    的頭像 發表于 07-02 11:22 ?811次閱讀

    名單公布!【書籍評測活動NO.35】如何用「時間序列與機器學習」解鎖未來?

    ,如何將機器學習、深度學習或者大模型技術應用在大規模的數據生產中,是一個非常關鍵的問題。 國內外已出版了許多關于
    發表于 06-25 15:00

    合成生物是什么-微流控芯片技術在合成生物學的應用前景

    合成生物其實就是一種“造物”的技術。它融合了生物學、化學和工程學等多種技術,以可再生生物質為原料,以生物體作為生產介質,旨在利用廉價原料,以菌群、細胞和酶為制造工廠,規模化發酵獲得目標
    的頭像 發表于 05-28 13:58 ?871次閱讀
    合成<b class='flag-5'>生物</b>是什么-微流控芯片技術在合成<b class='flag-5'>生物學</b>的應用前景

    北京大學在偏振結構光超分辨顯微技術方面獲得進展

    由于細胞的高度透明性,觀察其中的細胞器十分困難。通過熒光染色,生物學家可以標記特定的細胞器對其進行觀察。
    的頭像 發表于 05-21 09:22 ?595次閱讀
    北京大學在偏振結構光超分辨顯微技術方面獲得進展

    三郡科技:電化學生物傳感器電極與生物芯片的異同

    電化學生物傳感器電極 與 生物芯片 作為生物技術領域中的兩大重要工具,為現代生物分析和醫學診斷提
    的頭像 發表于 04-28 14:08 ?896次閱讀
    三郡科技:電化學<b class='flag-5'>生物</b>傳感器電極與<b class='flag-5'>生物</b>芯片的異同

    用于增強微生物物種間DNA轉移的新型液滴微流控平臺設計

    利用各種合成生物學工具和方法進行微生物工程已經取得了重大進展。
    的頭像 發表于 03-17 10:41 ?1151次閱讀
    用于增強微<b class='flag-5'>生物</b>物種間DNA轉移的新型液滴微流控平臺設計

    【量子計算機重構未來 | 閱讀體驗】+機器學習的終點是量子計算

    便對機器計算能力產生了興趣,雖然不是這個專業的,但是可以抽出閑魚的時間,來了解一下,可以通過學習來掌握一些技能。 目前也只有在閑暇之余做一些代碼的工作了。 希望以后能夠用的上。 其次大學期間也沒有學
    發表于 03-10 16:33
    新澳博百家乐的玩法技巧和规则| 财神真人娱乐城| 苏尼特右旗| 泰来百家乐导航| 大发888娱乐场 手机版| 百家乐官网出千方法技巧| 机器百家乐作弊| 百家乐官网投注网中国| 玩百家乐怎么才能赢| 澳门百家乐| 2024年九运的房屋风水| 大发888娱乐城 下载| 百家乐官网baccarat| 百家乐具体怎么收费的| 网络百家乐官网| 利来百家乐的玩法技巧和规则| 澳门百家乐官网网址多少| 杨氏百家乐必胜公式| 东至县| 百家乐小路单图解| 百家乐官网现金平台排名| 最新百家乐双面数字筹码| 百家乐官网交流群号| 百家乐分析网| 百家乐官网游戏软件出售| 百家乐五湖四海娱乐场开户注册 | 皇冠网百家乐啊| 百家乐官网网上真钱娱乐平台 | 百家乐官网金币游戏| 武汉百家乐赌具| 百家乐官网娱乐城博彩| 新锦江百家乐的玩法技巧和规则 | 百家乐官网怎么刷反水| 淘金百家乐的玩法技巧和规则| 澳门百家乐官网破解| 大发888娱乐平台| 新时代百家乐官网的玩法技巧和规则| 棋牌中心| 百家乐怎么玩呀| 百家乐官网冯氏坐庄法| 全讯网开奖直播|