衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌推出開源工具DeepVariant,用深度神經網絡識別基因變異

人工智能和機器人研究院 ? 2017-12-07 15:05 ? 次閱讀

Google今天推出了一個名叫DeepVariant的開源工具,用深度神經網絡來從DNA測序數據中快速精確識別堿基變異位點。

學科研究的革命性進展,特別是基因學上,需要依賴于新技術的出現。比如桑格發明了測序法之后,才實現了人類基因組的測序。

再比如DNA(微陣列)芯片技術的誕生,使得大規模的基因測序成為可能。這些技術讓我們能夠獲得大量遺傳信息,可以更廣泛地應用于健康、農業和生態上。

基因測序領域里,最革命性的技術當屬2000年初首次商用的高通量測序(縮寫為HTS)了。HTS可以大規模、低成本、快速地獲得任何生物的基因序列。

不過,HTS有個致命的問題在于,測序出來的結果不是完整的,而是碎片化的片段信息。

比如測的是人的基因序列的話(也就是說,信息量級為23對染色體上的30億對堿基排序),那么得到的測序結果是不到10億個短序列片段,一般每個短序列片段我們稱為讀取單位(reads)。

每個讀取單位含有100個堿基對(不同讀取單位的信息需要重疊,才能最后拼全),而每個堿基的錯誤率范圍是0.1%到10%。所以,一直以來,對于HTS來說,最大的挑戰是把碎片化的結果信息拼成一整段完整的序列信息。

瓶中基因組聯盟Genome in a Bottle Consortium(GIAB),和精準FDA平臺(美國藥監局做的基因組信息學社區和共享數據平臺)一樣,致力于提高基于HTS基因測序結果。他們能提供高精度的人體基準基因組序列信息。

把測序結果與基準基因序列一比對,就可以得到很多個堿基變異位點(就是上圖打星的地方),這些位點,可能是SNP單核苷酸多態性導致的,也可能是測序過程中復制出錯造成的。

今天,Google Brain團隊,聯合同屬于Alphabet旗下的生命科學兄弟公司Verily,用了兩年多時間,研發出了一個名叫DeepVariant的開源工具,專門用深度神經網絡來識別HTS結果中DNA測序數據里這些堿基變異位點。這個工具在準確率上和精確度上,比傳統的比對拼接方法都高出一大截。

DeepVariant,把工作量巨大的拼接問題(HTS碎片化的結果拼接成完整的基因序列),轉變成了一個典型的圖像分類問題。而圖像分類正是谷歌擅長的技術。

2016年,DeepVarient還在PrecisionFDA Truth Challenge中贏得了最高SNP性能獎(Highest SNP Performance)。在那之后,Google Brain團隊又將錯誤率降低了50%。

下面的四幅圖,分別代表實際測序的片段和基準序列的比對結果。

△A:單核苷酸多態性造成的堿基變異位點;
B:一條染色體上少了一個堿基;
C:兩條染色體上都少了一個堿基;
D:復制錯了的堿基變異位點。

在比對過程中,要回答的一個關鍵的問題是,怎么判斷比對后得到的堿基變異位點,是存在于兩條染色體中,還是只在一條里,還是都沒有。造成堿基變異位點的原因不只一種,最常見的三種可能是單核苷酸多態性,或多插了一個堿基,或少復制了一個堿基。

這些變異位點如果用視覺識別的算法就能快速找出來。大大提高HTS后的比對拼接的效率。

因為瓶中基因組聯盟Genome in a Bottle Consortium(GIAB)提供的人體基準基因組序列信息是高精度可信的,或者更嚴謹地說,是最接近真實序列的信息。

通過這個基準序列得到的復制數據,谷歌團隊可以拿它們來訓練基于Tensor Flow的圖像分類模型,所得到的DeepVariant,最后可以區別真實序列數據和復制數據。

盡管DeepVariant根本不懂什么是基因組序列,也不懂HTS,但是只用了一年,就已經贏得了PrecisionFDA Truth Challenge中的最高SNP性能獎(Highest SNP Performance)。而且到目前為止,把已有最優異的方法拼接錯誤率降低了50%多。

在發布開源代碼的同時,Google Brain還發布Google Cloud上的DeepVarient工作流,方便開發者用它來處理大型數據集。

最后,附上相關鏈接:

Google Research Blog介紹:https://research.googleblog.com/2017/12/deepvariant-highly-accurate-genomes.html

開源代碼:https://github.com/google/deepvariant

Google Cloud版:https://cloud.google.com/genomics/deepvariant


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6195

    瀏覽量

    106016
  • 人工智能
    +關注

    關注

    1796

    文章

    47674

    瀏覽量

    240294

原文標題:谷歌推出開源工具DeepVariant,用深度學習識別基因變異

文章出處:【微信號:gh_ecbcc3b6eabf,微信公眾號:人工智能和機器人研究院】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    卷積神經網絡的實現工具與框架

    卷積神經網絡因其在圖像和視頻處理任務中的卓越性能而廣受歡迎。隨著深度學習技術的快速發展,多種實現工具和框架應運而生,為研究人員和開發者提供了強大的支持。 TensorFlow 概述
    的頭像 發表于 11-15 15:20 ?328次閱讀

    FPGA在深度神經網絡中的應用

    隨著人工智能技術的飛速發展,深度神經網絡(Deep Neural Network, DNN)作為其核心算法之一,在圖像識別、語音識別、自然語言處理等領域取得了顯著成果。然而,傳統的
    的頭像 發表于 07-24 10:42 ?799次閱讀

    殘差網絡深度神經網絡

    殘差網絡(Residual Network,通常簡稱為ResNet) 是深度神經網絡的一種 ,其獨特的結構設計在解決深層網絡訓練中的梯度消失和梯度爆炸問題上取得了顯著的突破,并因此成為
    的頭像 發表于 07-11 18:13 ?1184次閱讀

    pytorch中有神經網絡模型嗎

    處理、語音識別等領域取得了顯著的成果。PyTorch是一個開源深度學習框架,由Facebook的AI研究團隊開發。它以其易用性、靈活性和高效性而受到廣泛歡迎。在PyTorch中,有許多預訓練的
    的頭像 發表于 07-11 09:59 ?814次閱讀

    PyTorch神經網絡模型構建過程

    PyTorch,作為一個廣泛使用的開源深度學習庫,提供了豐富的工具和模塊,幫助開發者構建、訓練和部署神經網絡模型。在神經網絡模型中,輸出層是
    的頭像 發表于 07-10 14:57 ?566次閱讀

    人工神經網絡模型的分類有哪些

    人工神經網絡(Artificial Neural Networks, ANNs)是一種模擬人腦神經元網絡的計算模型,它在許多領域,如圖像識別、語音識別、自然語言處理、預測分析等有著廣泛
    的頭像 發表于 07-05 09:13 ?1370次閱讀

    深度神經網絡與基本神經網絡的區別

    在探討深度神經網絡(Deep Neural Networks, DNNs)與基本神經網絡(通常指傳統神經網絡或前向神經網絡)的區別時,我們需
    的頭像 發表于 07-04 13:20 ?1061次閱讀

    如何使用MATLAB神經網絡工具

    神經網絡是一種模擬人腦神經元網絡的計算模型,廣泛應用于各種領域,如圖像識別、語音識別、自然語言處理等。在MATLAB中,可以使用神經網絡工具
    的頭像 發表于 07-03 10:34 ?2664次閱讀

    matlab神經網絡工具箱結果分析

    神經網絡是一種強大的機器學習技術,廣泛應用于各種領域,如圖像識別、語音識別、自然語言處理等。MATLAB提供了一個功能強大的神經網絡工具箱,可以幫助用戶快速構建和訓練
    的頭像 發表于 07-03 10:32 ?707次閱讀

    bp神經網絡深度神經網絡

    BP神經網絡(Backpropagation Neural Network)是一種常見的前饋神經網絡,它使用反向傳播算法來訓練網絡。雖然BP神經網絡在某些方面與
    的頭像 發表于 07-03 10:14 ?948次閱讀

    深度學習與卷積神經網絡的應用

    隨著人工智能技術的飛速發展,深度學習和卷積神經網絡(Convolutional Neural Network, CNN)作為其中的重要分支,已經在多個領域取得了顯著的應用成果。從圖像識別、語音
    的頭像 發表于 07-02 18:19 ?1051次閱讀

    卷積神經網絡的原理是什么

    卷積神經網絡(Convolutional Neural Network,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、語音識別、自然語言處理等領域。本文將詳細介紹卷積
    的頭像 發表于 07-02 14:44 ?807次閱讀

    深度神經網絡模型cnn的基本概念、結構及原理

    深度神經網絡模型CNN(Convolutional Neural Network)是一種廣泛應用于圖像識別、視頻分析和自然語言處理等領域的深度學習模型。 引言
    的頭像 發表于 07-02 10:11 ?9930次閱讀

    深度神經網絡模型有哪些

    深度神經網絡(Deep Neural Networks,DNNs)是一類具有多個隱藏層的神經網絡,它們在許多領域取得了顯著的成功,如計算機視覺、自然語言處理、語音識別等。以下是一些常見
    的頭像 發表于 07-02 10:00 ?1639次閱讀

    神經網絡架構有哪些

    神經網絡架構是機器學習領域中的核心組成部分,它們模仿了生物神經網絡的運作方式,通過復雜的網絡結構實現信息的處理、存儲和傳遞。隨著深度學習技術的不斷發展,各種
    的頭像 發表于 07-01 14:16 ?867次閱讀
    皇家百家乐的玩法技巧和规则| 钱隆百家乐官网的玩法技巧和规则 | 百家乐官网开户送百元| 现场百家乐官网能赢吗| 泸州市| 免费百家乐官网倍投工具| 百家乐赌场公司| 百家乐翻天粤语qvod| 百家乐永利娱乐平台| 功夫百家乐的玩法技巧和规则| 丽景湾百家乐的玩法技巧和规则 | 太阳城百家乐投注| 百家乐官网下载免费软件| 百家乐技术交流群| 奔驰百家乐官网游戏| 赌球赔率| 百家乐那个娱乐城信誉好| 百家乐官网路有几家| 峨边| 大发888官方网站| 百家乐自动下注| 百家乐连开6把小| 大发888游戏黄金之旅| 蓝盾百家乐赌城| 全讯网社区| 淘金盈开户| 百家乐官网怎么对冲打| 狮威百家乐官网娱乐| 至尊百家乐奇热网| 百家乐事一箩筐的微博| 棋牌王中王| 天地人百家乐官网现金网| 法拉利百家乐官网的玩法技巧和规则 | 百家乐视频桌球| 金字塔百家乐的玩法技巧和规则 | 网上百家乐官网真钱游戏| 百家乐币| 大发888开户注册哪家好| 凯时百家乐官网技巧| 实战百家乐官网的玩法技巧和规则| 打百家乐庄闲的技巧|