衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA DGX A100的DNA測序技術(shù)研究

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Harry Clifford ? 2022-04-06 14:18 ? 次閱讀

快速且經(jīng)濟(jì)高效的全基因組測序和分析可以迅速為患有罕見或未診斷疾病的危重患者提供答案。最近在加速臨床測序方面取得的進(jìn)展,例如創(chuàng)造世界紀(jì)錄 用于快速診斷的DNA測序技術(shù) ,使我們離在臨床環(huán)境中進(jìn)行全基因組基因診斷又近了一步。

斯坦福大學(xué)醫(yī)學(xué)院( Stanford University School of Medicine )、NVIDIA ( NVIDIA )、谷歌( Google )、 UCSC 和牛津納米孔技術(shù)( Oxford Nanopore Technologies , ONT )領(lǐng)導(dǎo)的一個團(tuán)隊(duì)最近使用這項(xiàng)技術(shù)來識別與疾病相關(guān)的基因變異,這些變異在短短 7 小時 18 分鐘內(nèi)就得到了診斷,結(jié)果于 2022 年 1 月發(fā)表在 新英格蘭醫(yī)學(xué)雜志 上。

這一創(chuàng)紀(jì)錄的端到端基因組工作流程依賴于創(chuàng)新技術(shù)和高性能計(jì)算。它利用長閱讀納米孔測序技術(shù)更好地分析結(jié)構(gòu)變體。這是在 48 個流動池中實(shí)現(xiàn)的,優(yōu)化的方法使孔占有率達(dá)到 82% ,在短短幾個小時內(nèi)快速生成 202 千兆堿基。對輸出的分析分布在一個谷歌云計(jì)算環(huán)境中,包括 16 個 4xV100 GPU 實(shí)例(總計(jì) 64 GPU 個)的基調(diào)用和對齊,以及 14 個 4xP100 GPU 實(shí)例(總計(jì) 56 GPU 個)的變體調(diào)用。

自一月 NEJM 發(fā)表以來,NVIDIA Clara 團(tuán)隊(duì)一直在優(yōu)化 DGX-A100 的全基因組工作流程,使臨床醫(yī)生和研究者能夠在八 A100 GPU 上部署與世界記錄方法相同的分析,而在 4H10M 中部署 60X 全基因組(圖 1 ;在 HG00 參考樣品上標(biāo)明)。

poYBAGJNMMWAX9TFAAVnUS9s298330.png

poYBAGJNMMWAX9TFAAVnUS9s298330.png

圖 1 。 NVIDIA DGX-A100 上優(yōu)化的納米孔測序工作流程

這不僅可以在本地運(yùn)行的單服務(wù)器( 8-GPU )框架中實(shí)現(xiàn)快速分析,還可以將每個樣本的成本降低三分之二,從 568 美元降至 183 美元。

基本呼叫和對齊

堿基調(diào)用是將原始儀器信號分類為基因組堿基 A 、 C 、 G 和 T 的過程。這是確保所有下游分析任務(wù)準(zhǔn)確性的計(jì)算關(guān)鍵步驟。這也是一個重要的數(shù)據(jù)縮減步驟,將生成的數(shù)據(jù)縮減約 10 倍。

以每堿基 340 字節(jié)為單位,一個單一的 60 倍覆蓋率的整個基因組在原始信號中很容易達(dá)到數(shù)萬億字節(jié),而在處理時則為數(shù)百千兆字節(jié)。因此,計(jì)算速度有利于與測序輸出速度相匹敵,這是非常重要的,通過 48 個流動單元的 128000 個孔,以每秒約 450 個堿基的速度進(jìn)行。

ONT 的 PromethION P48 測序儀在 72 小時的運(yùn)行中可以產(chǎn)生多達(dá) 10 個 Terabase ,相當(dāng)于 96 個人類基因組(覆蓋率為 30 倍)。

這項(xiàng)工作所需的快速分類任務(wù)已經(jīng)受益于深度學(xué)習(xí)創(chuàng)新和 GPU 加速。用于此目的的核心數(shù)據(jù)處理工具包 Guppy 使用遞歸神經(jīng)網(wǎng)絡(luò)( RNN )進(jìn)行基址調(diào)用,可以選擇更小(更快)或更大(更高精度)的遞歸層大小的三種不同架構(gòu)。

BaseCall 中的主要計(jì)算瓶頸是 RNN 內(nèi)核,它得益于 GPU 與 ONT 序列器的集成,例如桌面網(wǎng)格 Mk1 ,其中包括一個 V100 GPU 和手持 MinION Mk1C ,其中包括一個 Jetson 邊緣平臺。

比對是將合成的堿基 DNA 片段(現(xiàn)在是 As 、 Cs 、 Gs 和 Ts 的字符串形式)提取出來,并確定這些片段起源的基因組位置,通過大規(guī)模并行測序過程組裝完整基因組的過程。這基本上是從許多 100-100000 bp 長的讀取中重建全長基因組。就創(chuàng)造世界紀(jì)錄的樣本而言,總共有 1300 萬次閱讀。

在最初的世界記錄分析中, basecalling 和 alignment 分別在 Guppy 和 Minimap2 的不同實(shí)例上運(yùn)行。通過將其遷移到單服務(wù)器 DGX-A100 解決方案,并使用 Guppy 的集成 minimap2 aligner ,您可以立即節(jié)省 I / O 時間,并從 A100 用于 RNN 推斷的張量核心中獲益。通過在 DGX 上分別平衡八個 A100 GPU 和 256 CPU 線程的基址調(diào)用和對齊,這兩個進(jìn)程可以完全重疊,以便與基址調(diào)用同時對齊讀取,不會對總運(yùn)行時間造成影響(《 1 分鐘)。

這使 DGX-A100 上的 basecalling 和校準(zhǔn)步驟的運(yùn)行時間變?yōu)?2h 46m ,這也可以與測序本身重疊。這與 60 倍樣本的預(yù)期測序時間相似。

變異呼叫

變體調(diào)用是工作流的一部分,旨在識別新組裝個體基因組中與參考基因組不同的所有點(diǎn)。這包括掃描基因組的全部寬度,以尋找不同類型的變異。例如,這可能包括小的單堿基對變體,一直到覆蓋數(shù)千個堿基對的大結(jié)構(gòu)變體。世界紀(jì)錄管道使用胡椒粉作為小變體,使用嗅探作為結(jié)構(gòu)變體。

PEPPER Margin DeepVariant 方法旨在優(yōu)化小變異,以實(shí)現(xiàn)納米孔測序產(chǎn)生的長讀。

PEPPER 通過 RNN 識別候選變體, RNN 由兩個雙向、選通、循環(huán)單元層和一個線性轉(zhuǎn)換層組成。

Margin 然后使用隱馬爾可夫模型方法進(jìn)行一個稱為單倍型的過程,確定哪些變體是從母系或父系染色體一起遺傳的。它將此信息傳遞給 Google DeepVariant ,以最大限度地提高雜合子變體調(diào)用的準(zhǔn)確性。

DeepVariant 通過一個深度卷積神經(jīng)網(wǎng)絡(luò)對最終變體進(jìn)行分類,該網(wǎng)絡(luò)建立在 Inception v2 體系結(jié)構(gòu)之上,專門適用于 DNA 讀取堆積輸入圖像。

總的來說, PEPPER Margin DeepVariant 允許更快的 PEPPER 神經(jīng)網(wǎng)絡(luò)掃描整個基因組尋找候選基因,然后使用更大的 DeepVariant 神經(jīng)網(wǎng)絡(luò)對這些候選基因進(jìn)行高精度的變異調(diào)用。為了加速這條管道,世界紀(jì)錄工作流使用了 Parabricks DeepVariant ,這是一種 GPU 加速的實(shí)現(xiàn),比 CPU 上的開源版本快 20 倍以上(圖 2 )。

Clara 團(tuán)隊(duì)通過修改 PEPPER Margin 以集成方式運(yùn)行,按染色體分割數(shù)據(jù),并在 GPU 上同時運(yùn)行程序,進(jìn)一步加快了速度。 PEPPER 還針對批量大小、工作人員數(shù)量和呼叫者數(shù)量等管道參數(shù)進(jìn)行了優(yōu)化,并對 PyTorch 進(jìn)行了升級,以支持 NVIDIA 安培體系結(jié)構(gòu)加速 RNN 推理瓶頸。

對于結(jié)構(gòu)變量調(diào)用, Snifgles 升級為最近發(fā)布的 Snifgles 2 ,其效率要高得多,僅在 CPU 上的加速度為 38 倍。

所有這些改進(jìn)使 DGX-A100 的多變量調(diào)用階段的運(yùn)行時間達(dá)到 1h 24m 。

pYYBAGJNMMaADA9FAAAqFqdzUaE757.png

pYYBAGJNMMaADA9FAAAqFqdzUaE757.png

圖 2 。 Parabricks DeepVariant 支持在 ONT 數(shù)據(jù)上快速運(yùn)行

視頻 1 。危重病人超快速 DNA 測序技術(shù)的優(yōu)化

使用 NVIDIA DGX-A100 為實(shí)時測序供電

通過優(yōu)化 DGX A100 的世界記錄 DNA 測序技術(shù),NVIDIA Clara 團(tuán)隊(duì)為實(shí)時測序提供了動力,簡化了單個服務(wù)器上的復(fù)雜工作流,并且在達(dá)到最先進(jìn)性能的同時,將分析成本降低了 50% 以上。

關(guān)于作者

Harry Clifford:作為NVIDIA 基因組學(xué)的高級產(chǎn)品架構(gòu)師, Harry 致力于工程和產(chǎn)品開發(fā)之間的接口,利用NVIDIA 在人工智能、高性能計(jì)算( HPC )和數(shù)據(jù)分析堆棧方面的專業(yè)知識,以加速高精度解決方案解決基因組學(xué)工作流問題。他的背景是生物信息學(xué)和功能基因組學(xué),包括來自牛津大學(xué)的博士學(xué)位、生物制藥行業(yè)和劍橋大學(xué)的博士后經(jīng)驗(yàn)以及生物技術(shù)領(lǐng)域的創(chuàng)業(yè)經(jīng)驗(yàn)。哈里在與人共同創(chuàng)立精準(zhǔn)腫瘤公司 CCG 后,被列入福布斯“ 30 歲以下”榜單。 ai (被 Dante Labs 收購),一家由 Y Combinator 和默克加速器支持的初創(chuàng)公司,通過深度學(xué)習(xí)和高級分析軟件提供決策支持。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4779

    瀏覽量

    101172
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5076

    瀏覽量

    103724
收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA加速計(jì)算技術(shù)助力癌癥研究

    總部位于英國的維康桑格研究所的 DNA 測序實(shí)驗(yàn)室每年分析數(shù)以萬計(jì)的基因組,為癌癥的形成和治療效果提供洞察。
    的頭像 發(fā)表于 10-29 15:01 ?325次閱讀

    NVIDIA DGX B200首次面向零售市場:配備8塊B200 GPU

    10月13日最新消息,NVIDIADGX B200 AI服務(wù)器近期已在Broadberry上架,標(biāo)價515,410美元(相當(dāng)于約364.2萬元人民幣)。   自發(fā)布以來,Blackwell架構(gòu)就備受業(yè)界矚目,NVIDIA
    的頭像 發(fā)表于 10-14 14:34 ?818次閱讀

    PCB電路與結(jié)構(gòu)的EMC協(xié)同仿真技術(shù)研究

    電子發(fā)燒友網(wǎng)站提供《PCB電路與結(jié)構(gòu)的EMC協(xié)同仿真技術(shù)研究.pdf》資料免費(fèi)下載
    發(fā)表于 09-20 11:42 ?0次下載

    創(chuàng)業(yè)公司轉(zhuǎn)向RTX 4090因NVIDIA中國特供芯片價格高昂

    8月14日最新消息指出,據(jù)多方媒體報道,NVIDIAA100與H100等高端芯片因受限已有一年半之久,盡管公司隨后推出了專為中國市場設(shè)計(jì)的H20芯片,但這并未在中國創(chuàng)業(yè)圈內(nèi)引發(fā)廣泛熱情。
    的頭像 發(fā)表于 08-15 14:28 ?552次閱讀

    凌科喜獲“廣東省工程技術(shù)研究中心”認(rèn)定

    近日,廣東省科學(xué)技術(shù)廳正式公布了“2023年度廣東省工程技術(shù)研究中心認(rèn)定名單”。憑借在工業(yè)連接器領(lǐng)域卓越的技術(shù)創(chuàng)新與研發(fā)實(shí)力,凌科電氣的“高可靠高精密工業(yè)連接器(凌科)工程技術(shù)研究中心
    的頭像 發(fā)表于 05-25 08:13 ?407次閱讀
    凌科喜獲“廣東省工程<b class='flag-5'>技術(shù)研究</b>中心”認(rèn)定

    基于微流控技術(shù)DNA甲基化分析方法研究進(jìn)展綜述

    近年來,大量研究致力于開發(fā)DNA甲基化檢測方法。檢測方法的進(jìn)步可以促進(jìn)DNA甲基化在臨床醫(yī)學(xué)和科學(xué)研究方面的應(yīng)用。
    的頭像 發(fā)表于 05-21 09:08 ?914次閱讀
    基于微流控<b class='flag-5'>技術(shù)</b>的<b class='flag-5'>DNA</b>甲基化分析方法<b class='flag-5'>研究</b>進(jìn)展綜述

    OpenAI聯(lián)手Nvidia發(fā)布首臺Nvidia DGX H200

    OpenAI總裁兼聯(lián)合創(chuàng)始人Greg Brockman分享了他與山姆?阿爾特曼(Sam Altman)、黃仁勛以及自己的合影,他們的眼前正是這臺首次亮相的DGX H200。
    的頭像 發(fā)表于 04-25 13:50 ?492次閱讀

    英偉達(dá)戰(zhàn)略收購Run:ai,推進(jìn)產(chǎn)品戰(zhàn)略,整合資源至Nvidia DGX C

    4 月 25 日,英偉達(dá)正式推出新聞公告,宣布成功收購了 Run:ai 公司,以加快推進(jìn)其產(chǎn)品藍(lán)圖的實(shí)施,并將其與 Nvidia DGX Cloud 深度融合。關(guān)于此次收購的具體金額及完成日期尚未公布。
    的頭像 發(fā)表于 04-25 10:25 ?647次閱讀

    是德科技與NVIDIA攜手推進(jìn)6G研究云平臺發(fā)展

    是德科技近日宣布與現(xiàn)已開啟與全新NVIDIA 6G研究云平臺的合作,加速推進(jìn)6G技術(shù)研究。該平臺集成了NVIDIA Aerial Omniverse數(shù)字孿生
    的頭像 發(fā)表于 03-27 09:26 ?742次閱讀

    NVIDIA Blackwell DGX SuperPOD助力萬億級生成式AI計(jì)算

    全新 DGX SuperPOD 采用新型高效液冷機(jī)架級擴(kuò)展架構(gòu),基于 NVIDIA DGX GB200 系統(tǒng)構(gòu)建而成,在 FP4 精度下可提供 11.5 exaflops 的 AI 超級計(jì)算性能和 240 TB 的快速顯存,且可
    發(fā)表于 03-21 09:49 ?248次閱讀

    NVIDIA推出搭載GB200 Grace Blackwell超級芯片的NVIDIA DGX SuperPOD?

    NVIDIA 于太平洋時間 3 月 18 日發(fā)布新一代 AI 超級計(jì)算機(jī) —— 搭載 NVIDIA GB200 Grace Blackwell 超級芯片的 NVIDIA DGX Sup
    的頭像 發(fā)表于 03-21 09:49 ?810次閱讀

    NVIDIA 推出 Blackwell 架構(gòu) DGX SuperPOD,適用于萬億參數(shù)級的生成式 AI 超級計(jì)算

    基于先進(jìn)的 NVIDIA 網(wǎng)絡(luò)、NVIDIA 全棧 AI 軟件和存儲技術(shù),可將集群中 Grace Blackwell 超級芯片的數(shù)量擴(kuò)展至數(shù)萬個,通過 NVIDIA NVLink可將多
    發(fā)表于 03-19 10:56 ?479次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 Blackwell 架構(gòu) <b class='flag-5'>DGX</b> SuperPOD,適用于萬億參數(shù)級的生成式 AI 超級計(jì)算

    英偉達(dá)H200和A100的區(qū)別

    英偉達(dá)H200和A100兩款芯片在性能、架構(gòu)、內(nèi)存以及應(yīng)用場景等多個方面存在顯著的區(qū)別。
    的頭像 發(fā)表于 03-07 16:23 ?3945次閱讀

    英偉達(dá)H200和A100的差異

    英偉達(dá)H200和A100在多個方面存在差異。
    的頭像 發(fā)表于 03-07 16:18 ?2816次閱讀

    寬帶放大器在陣列渦流檢測技術(shù)研究中的應(yīng)用

      實(shí)驗(yàn)名稱:陣列渦流檢測技術(shù)研究   實(shí)驗(yàn)原理:渦流檢測基于在電磁感應(yīng)原理,僅適合用于導(dǎo)電材料的檢測。其檢測原理是:載有交變電流的檢測線圈靠近工件時,在工件中會感生出渦流,此渦流形成的同時也會形成
    發(fā)表于 02-28 16:04
    承德县| 百家乐官网赌场规则| 百家乐赌博详解| 百家乐官网打线| 德州扑克中文单机版| 波音百家乐现金网| 大发888娱乐场是真是假| 网上百家乐骗人的吗| 百家乐官网玩法最多的娱乐城| 大发888下载客户端| 百家乐赌博合作| 24岁掉牙齿 风水| 广东百家乐官网扫描分析仪| 利来国际| 大发888娱乐日博备用| 百家乐赢率| 百家乐官网博彩吧| 娱乐城百家乐官网可以代理吗 | 百家乐龙虎桌布| 扑克百家乐官网麻将筹码防伪| 至尊百家乐官网qvod| 澳门葡京赌场图片| 大发888扑克下载| 网上百家乐游戏玩法| 免佣百家乐的玩法| 澳门百家乐玩大小| 百家乐看单技术| 永利百家乐娱乐| 免费百家乐官网计划软件| 百家乐官网招商用语| 大发888赌场网址| 大地百家乐的玩法技巧和规则| 百家乐赌博分析网| 澳门百家乐官网www.bjbj100.com| 百家乐官网赌场软件| 百家乐官网信誉平台现金投注 | 百家乐预约| 百家乐五湖四海娱乐平台| 网页百家乐官网| 广州百家乐赌场娱乐网规则| 玩网上百家乐的技巧|