衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

PyTorch核心華人開發(fā)者透徹解讀PyTorch內(nèi)部機(jī)制

DPVg_AI_era ? 來源:lq ? 2019-05-19 09:21 ? 次閱讀

本文以內(nèi)部PyTorch核心開發(fā)者視角,非常詳細(xì)透徹的分析了PyTorch的內(nèi)部結(jié)構(gòu),為開發(fā)者提供一張地圖,告訴您“支持自動(dòng)區(qū)分的張量庫”的基本概念結(jié)構(gòu),并提供一些工具和技巧,以便找到適合代碼庫。對(duì)學(xué)習(xí)PyTorch、尤其是致力于參與PyTorch貢獻(xiàn)有非常大的意義。

PyTorch是一個(gè)開源的Python機(jī)器學(xué)習(xí)庫,基于Torch,已成為最受歡迎的機(jī)器學(xué)習(xí)框架之一。

相比Tensorflow,PyTorch的社區(qū)由更多專業(yè)機(jī)器學(xué)習(xí)開發(fā)人員、軟件架構(gòu)師和公司內(nèi)部程序員組成。

PyTorch也更多地用于數(shù)據(jù)分析和業(yè)務(wù)環(huán)境中的特殊模型中。

在PyTorch社區(qū)中,有更多的Python開發(fā)人員從事Web應(yīng)用程序。此外,這種Python向框架的多功能性,使得研究人員能夠以幾乎無痛的方式測試想法,使得它成為最先進(jìn)的尖端解決方案的首選框架。

對(duì)于準(zhǔn)備、正在學(xué)習(xí)PyTorch的讀者來說,了解其內(nèi)部機(jī)制能夠極大的提升學(xué)習(xí)效率、增進(jìn)對(duì)PyTorch設(shè)計(jì)原理和目的的了解,從而能夠更好的在工作學(xué)習(xí)中使用該工具。如果你立志參與到PyTorch后續(xù)的改進(jìn)中,那么更應(yīng)該深入的了解其內(nèi)部機(jī)制。

好消息是,F(xiàn)acebook Research Engineer、斯坦福博士生、PyTorch核心開發(fā)人員Edward Z. Yang為大家?guī)硪环軵yTorch內(nèi)部機(jī)制的詳解slides,新智元在此強(qiáng)力推薦給廣大讀者。正文約3500字,閱讀可能需要10分鐘。

由于微信的限制無法展示高清圖像,我們特意為大家在文末找來了可下載的高清完整版,預(yù)祝大家學(xué)習(xí)愉快!

這份內(nèi)部機(jī)制詳解是為誰準(zhǔn)備的?

主要針對(duì)使用過PyTorch的人,尤其是希望成為PyTorch貢獻(xiàn)者、但卻被PyTorch的龐大復(fù)雜的C++代碼庫嚇到的人。

最終目的是能夠?yàn)榇蠹姨峁┮粋€(gè)通關(guān)寶典,讓大家了解“支持自動(dòng)區(qū)分的Tensor庫”的基本概念結(jié)構(gòu),并提供一些工具和技巧,用來更容易的找到適合代碼庫。

讀者只需要對(duì)PyTorch有一個(gè)初步的了解,并且有過一定的動(dòng)手經(jīng)驗(yàn)即可。門檻還是非常低的。

全部內(nèi)容分為兩部分。首先介紹Tensor庫的概念。作者將從Tensor數(shù)據(jù)類型開始,更詳細(xì)地討論這種數(shù)據(jù)類型提供的內(nèi)容,以便讓讀者更好地了解它是如何實(shí)際實(shí)現(xiàn)的。布局、設(shè)備和dtype的三位一體,探討如何考慮對(duì)Tensor類的擴(kuò)展。

第二部分將討論P(yáng)yTorch實(shí)戰(zhàn)。例如使用autograd來降低工作量,哪些代碼關(guān)鍵、為什么?以及各種用來編寫內(nèi)核的超酷的工具。

理解Tensor庫的概念

Tensor

Tensor是PyTorch中的中心數(shù)據(jù)結(jié)構(gòu)。我們可以將Tensor視為由一些數(shù)據(jù)組成,然后是一些描述Tensor大小的元數(shù)據(jù),包含元素的類型(dtype),Tensor所依賴的設(shè)備(CPU內(nèi)存?CUDA內(nèi)存?)。以及Strides(步幅)。Strides實(shí)際上是PyTorch的一個(gè)顯著特征。

Tensor是一個(gè)數(shù)學(xué)概念。在計(jì)算機(jī)上最常見的表示是將Tensor中的每個(gè)元素連續(xù)地存儲(chǔ)在內(nèi)存中,將每一行寫入內(nèi)存,如上所示。

在上面的例子中,指定Tensor包含32位整數(shù),每個(gè)整數(shù)位于物理地址中,相互偏移四個(gè)字節(jié)。要記住Tensor的實(shí)際尺寸,還必須記錄哪些尺寸是多余的元數(shù)據(jù)。

假設(shè)我想在邏輯表示中訪問位置Tensor[0,1]處的元素。通過Stride我們應(yīng)該這樣做:

找出Tensor的任何元素存在的位置,將每個(gè)索引乘以該維度的相應(yīng)Stride,并將它們加在一起。

上圖中將第一維藍(lán)色和第二維紅色進(jìn)行了顏色編碼,以便在Stride計(jì)算中跟蹤索引和步幅。

以上是Stride的一個(gè)例子。Stride表示實(shí)際上可以讓你代表Tensor的各種有趣的方法; 如果你想玩弄各種可能性,請(qǐng)查看Stride Visualizer。

可能存在共享相同存儲(chǔ)的多個(gè)Tensor,但請(qǐng)記住一點(diǎn):有Tensor的地方,就有存儲(chǔ)。

存儲(chǔ)定義Tensor的dtype和物理大小,而每個(gè)Tensor記錄大小,步幅和偏移,定義物理內(nèi)存的邏輯解釋。

Tensor擴(kuò)展

有很多有趣的擴(kuò)展,如XLA張量,量化張量,或MKL-DNN張量,作為張量庫,我們必須考慮是如何適應(yīng)這些擴(kuò)展。

當(dāng)前的擴(kuò)展模型在張量上提供了四個(gè)擴(kuò)展點(diǎn)。首先,用三個(gè)參數(shù)用來確定張量是什么:

設(shè)備

張量的物理存儲(chǔ)器實(shí)際存儲(chǔ)在何處,例如在CPU上,NVIDIA GPU(cuda)上,或者可能在AMD GPU(hip)或TPU(xla)上的描述。設(shè)備的顯著特征是它有自己的分配器,不能與任何其他設(shè)備一起使用。

布局

布局用來描述我們?nèi)绾芜壿嫷亟忉屵@個(gè)物理內(nèi)存。最常見的布局是跨步張量,但稀疏張量具有不同的布局,涉及2個(gè)張量:一個(gè)用于索引、一個(gè)用于數(shù)據(jù)。

MKL-DNN張量可能具有更奇特的布局,例如阻擋布局,這不能僅使用步幅來表示。

dtype

描述了它實(shí)際存儲(chǔ)在張量的每個(gè)元素中的含義。這可以是浮點(diǎn)數(shù)或整數(shù),或者它可以是例如量化的整數(shù)。

順便說一下,如果你想為PyTorch張量添加一個(gè)擴(kuò)展名,請(qǐng)聯(lián)系PyTorch官方。

實(shí)戰(zhàn)技巧

了解你手里的武器

PyTorch有很多文件夾,CONTRIBUTING文檔有非常詳細(xì)的描述。但實(shí)際上,你真正需要了解的只有四個(gè):

torch/:包含導(dǎo)入和使用的實(shí)際Python模塊。Python代碼,很容易上手調(diào)試。

torch/csrc/:它實(shí)現(xiàn)了在Python和C++之間進(jìn)行轉(zhuǎn)換的綁定代碼,以及一些非常重要的PyTorch功能,如autograd引擎和JIT編譯器。它還包含C++前臺(tái)代碼。

aten/:“A Tensor Library”的縮寫(由Zachary DeVito創(chuàng)造),是一個(gè)實(shí)現(xiàn)Tensors操作的C++庫。存放一些內(nèi)核代碼存在的地方,盡量不要在那里花太多時(shí)間。

c10/:這是一個(gè)雙關(guān)語。C代表Caffe,10既是二級(jí)制的2,也是十進(jìn)制的10(英文Ten,同時(shí)也是Tensor的前半部分)。包含PyTorch的核心抽象,包括Tensor和Storage數(shù)據(jù)結(jié)構(gòu)的實(shí)際實(shí)現(xiàn)。

讓我們看看這種代碼分離在實(shí)踐中是如何分解的:

調(diào)用一個(gè)函數(shù)的時(shí)候,會(huì)經(jīng)歷以下步驟:

將Python翻譯成C

處理變量調(diào)度

處理設(shè)備類型/布局調(diào)度

我們有實(shí)際的內(nèi)核,它既可以是現(xiàn)代本機(jī)函數(shù),也可以是傳統(tǒng)的TH函數(shù)

值得一提的是,所有代碼都是自動(dòng)生成的,所以不會(huì)出現(xiàn)在GitHub的repo里,必須自己構(gòu)建PyTorch后才能看到。不過你也不必非常深刻地理解這段代碼在做什么,自動(dòng)生成的嘛。

從武器庫中挑選寫內(nèi)核的趁手兵刃

PyTorch為內(nèi)核編寫者提供了許多有用的工具。在本節(jié)中,我們將介紹其中比較趁手的工具。

要利用PyTorch帶來的所有代碼生成,需要為運(yùn)算符編寫schema。詳細(xì)介紹參見GitHub的README。

錯(cuò)誤檢查可以通過低階API(TORCH_CHECK)和高階API實(shí)現(xiàn)。高階API可以基于TensorArg元數(shù)據(jù)提供用戶友好的錯(cuò)誤消息。

要執(zhí)行dtype調(diào)度,應(yīng)該使用AT_DISPATCH_ALL_TYPES宏,用來獲取張量的dtype,并用于可從宏調(diào)度的每個(gè)dtype的lambda。通常,這個(gè)lambda只調(diào)用一個(gè)模板化的輔助函數(shù)。

如何提高工作效率

別編輯header!

編輯header會(huì)導(dǎo)致很長的重構(gòu)時(shí)間,盡量去編輯.cpp文件。

別直接用CI去測試

CI是一個(gè)直接可用的測試代碼的變動(dòng)是否有效的非常棒的工具,但如果你真的一點(diǎn)不都改設(shè)置恐怕要浪費(fèi)很長時(shí)間在測試過程中。

強(qiáng)烈建議設(shè)置ccache

它有可能讓你避免在編輯header時(shí)進(jìn)行大量重新編譯。而當(dāng)我們?cè)诓恍枰匦戮幾g文件時(shí)進(jìn)行了重新編譯,它還有助于掩蓋構(gòu)建系統(tǒng)中的錯(cuò)誤。

用一臺(tái)高性能的工作站

如果你建立一個(gè)帶有CPU和RAM的強(qiáng)大服務(wù)器,你將獲得更愉快的體驗(yàn)。特別是,不建議在筆記本電腦上進(jìn)行CUDA構(gòu)建。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲(chǔ)器
    +關(guān)注

    關(guān)注

    38

    文章

    7528

    瀏覽量

    164348
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8441

    瀏覽量

    133087
  • pytorch
    +關(guān)注

    關(guān)注

    2

    文章

    808

    瀏覽量

    13365

原文標(biāo)題:揭秘PyTorch內(nèi)核!核心開發(fā)者親自全景解讀(47頁P(yáng)PT)

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Pytorch模型訓(xùn)練實(shí)用PDF教程【中文】

    、模型權(quán)及損失函數(shù)的變化。本教程適用讀者:想熟悉 PyTorch 使用的朋友;想采用 PyTorch 進(jìn)行模型訓(xùn)練的朋友;正采用 PyTorch,但無有效機(jī)制去診斷模型的朋友;
    發(fā)表于 12-21 09:18

    PyTorch如何入門

    PyTorch 入門實(shí)戰(zhàn)(一)——Tensor
    發(fā)表于 06-01 09:58

    Facebook致力AI開源PyTorch 1.0 AI框架

    Facebook近日宣布,將于近期開源PyTorch 1.0 AI框架,據(jù)悉,該框架是PyTorch與Caffe 2的結(jié)合,可以讓開發(fā)者無需遷移就從研究轉(zhuǎn)為生產(chǎn)。
    的頭像 發(fā)表于 05-08 14:58 ?3447次閱讀

    Facebook致力AI 開源PyTorch1.0 AI框架

    導(dǎo)讀: Facebook近日宣布,將于近期開源PyTorch 1.0 AI框架,據(jù)悉,該框架是PyTorch與Caffe 2的結(jié)合,可以讓開發(fā)者無需遷移就從研究轉(zhuǎn)為生產(chǎn)。 Facebook近日宣布
    的頭像 發(fā)表于 06-18 10:30 ?3225次閱讀

    Facebook宣布發(fā)布深度學(xué)習(xí)框架 PyTorch 1.0開發(fā)者預(yù)覽版

    為了滿足這些需求,Google Cloud 也將為其眾多服務(wù)引入 PyTorch 支持。Facebook 在宣布這一消息的博客文章中稱,Google 與 Facebook 合作在為 PyTorch
    的頭像 發(fā)表于 10-08 14:36 ?3243次閱讀

    一文解構(gòu)PyTorch:深入了解PyTorch內(nèi)部機(jī)制

    PyTorch是一個(gè)較新的深度學(xué)習(xí)框架,主打動(dòng)態(tài)網(wǎng)絡(luò)模型。相比其他同類框架,PyTorch提供一種較低級(jí)別的方法,對(duì)于更具備數(shù)學(xué)背景的用戶來講靈活性更強(qiáng)。
    的頭像 發(fā)表于 03-01 08:47 ?4068次閱讀
    一文解構(gòu)<b class='flag-5'>PyTorch</b>:深入了解<b class='flag-5'>PyTorch</b><b class='flag-5'>內(nèi)部</b><b class='flag-5'>機(jī)制</b>

    一篇非常新的介紹PyTorch內(nèi)部機(jī)制的文章

    譯者序:這篇博文是一篇非常新的介紹PyTorch內(nèi)部機(jī)制的文章,作者Edward Z Yang來自于Stanford大學(xué),是PyTorch核心
    的頭像 發(fā)表于 12-26 10:17 ?2244次閱讀
    一篇非常新的介紹<b class='flag-5'>PyTorch</b><b class='flag-5'>內(nèi)部</b><b class='flag-5'>機(jī)制</b>的文章

    PyTorch 的 Autograd 機(jī)制和使用

    PyTorch 作為一個(gè)深度學(xué)習(xí)平臺(tái),在深度學(xué)習(xí)任務(wù)中比 NumPy 這個(gè)科學(xué)計(jì)算庫強(qiáng)在哪里呢?我覺得一是 PyTorch 提供了自動(dòng)求導(dǎo)機(jī)制,二是對(duì) GPU 的支持。由此可見,自動(dòng)求導(dǎo) (autograd) 是
    的頭像 發(fā)表于 08-15 09:37 ?1154次閱讀

    TensorFlow的衰落與PyTorch的崛起

    在采訪開發(fā)者、硬件專家、云提供商以及熟悉谷歌機(jī)器學(xué)習(xí)工作的人士時(shí),他們的觀點(diǎn)也是相同的。TensorFlow 在爭奪開發(fā)者人心的競爭中落敗。其中有些人甚至使用了令人難以理解的確切說法:“PyTorch 正在享用 TensorFl
    的頭像 發(fā)表于 11-04 14:23 ?1793次閱讀

    PyTorch教程11.4之Bahdanau注意力機(jī)制

    電子發(fā)燒友網(wǎng)站提供《PyTorch教程11.4之Bahdanau注意力機(jī)制.pdf》資料免費(fèi)下載
    發(fā)表于 06-05 15:11 ?0次下載
    <b class='flag-5'>PyTorch</b>教程11.4之Bahdanau注意力<b class='flag-5'>機(jī)制</b>

    沒有“中間商賺差價(jià)”, OpenVINO? 直接支持 PyTorch 模型對(duì)象

    隨著 OpenVINO 2023.0 版本的發(fā)布,OpenVINO 工具庫中預(yù)置了全新的 PyTorch 前端,為開發(fā)者們提供了一條全新的 PyTorch 模型支持路徑,帶來更友好的用戶
    的頭像 發(fā)表于 06-27 16:39 ?821次閱讀
    沒有“中間商賺差價(jià)”, OpenVINO? 直接支持 <b class='flag-5'>PyTorch</b> 模型對(duì)象

    15-PyTorch-Edge-在邊緣設(shè)備上部署AI模型的開發(fā)者之旅

    對(duì)于開發(fā)者而言,我們將整個(gè)ExecuTorch技術(shù)棧分為兩個(gè)階段。首先,我們從一個(gè)PyTorch模型開始,這在大多數(shù)情況下是一個(gè)torch.in.module。然后我們從中捕獲圖形,并將其lowering并序列化為額外的torch二進(jìn)制文件。
    的頭像 發(fā)表于 01-12 10:29 ?872次閱讀
    15-<b class='flag-5'>PyTorch</b>-Edge-在邊緣設(shè)備上部署AI模型的<b class='flag-5'>開發(fā)者</b>之旅

    解讀PyTorch模型訓(xùn)練過程

    PyTorch作為一個(gè)開源的機(jī)器學(xué)習(xí)庫,以其動(dòng)態(tài)計(jì)算圖、易于使用的API和強(qiáng)大的靈活性,在深度學(xué)習(xí)領(lǐng)域得到了廣泛的應(yīng)用。本文將深入解讀PyTorch模型訓(xùn)練的全過程,包括數(shù)據(jù)準(zhǔn)備、模型構(gòu)建、訓(xùn)練循環(huán)、評(píng)估與保存等關(guān)鍵步驟,并結(jié)合
    的頭像 發(fā)表于 07-03 16:07 ?1164次閱讀

    PyTorch的介紹與使用案例

    學(xué)習(xí)領(lǐng)域的一個(gè)重要工具。PyTorch底層由C++實(shí)現(xiàn),提供了豐富的API接口,使得開發(fā)者能夠高效地構(gòu)建和訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型。PyTorch不僅支持動(dòng)態(tài)計(jì)算圖,還提供了強(qiáng)大的自動(dòng)微分系統(tǒng),極大地簡化了深度學(xué)習(xí)任務(wù)的
    的頭像 發(fā)表于 07-10 14:19 ?465次閱讀

    PyTorch深度學(xué)習(xí)開發(fā)環(huán)境搭建指南

    PyTorch作為一種流行的深度學(xué)習(xí)框架,其開發(fā)環(huán)境的搭建對(duì)于深度學(xué)習(xí)研究開發(fā)者來說至關(guān)重要。在Windows操作系統(tǒng)上搭建PyTorch
    的頭像 發(fā)表于 07-16 18:29 ?1280次閱讀
    任你博百家乐官网现金网| 宜良县| 至尊百家乐节目单| 百家乐官网打大必赢之法| 百家乐三号的赢法| 百家乐官网长龙如何判断| 大发888游戏平台hgdafa888gw| 百家乐技巧心得| 百家乐官网娱乐分析软件v4.0| 澳门百家乐| 威尼斯人娱乐城老品牌值得信赖| 百家乐高人玩法| 百家乐官网翻天youtube | 电玩百家乐官网的玩法技巧和规则| 武宣县| 大发888官方网址| 澳门百家乐什么规则| 娱乐网百家乐官网补丁| 真人百家乐官网口诀| 永利高投注网哪个好| 真人百家乐导航| 玩百家乐官网免费| 玩百家乐官网最好方法| 威尼斯人娱乐场的微博| 新濠峰百家乐官网的玩法技巧和规则| 网上百家乐官网靠谱吗| 金宝博娱乐城返水| 网上百家乐试玩网址| 广州百家乐酒店用品制造有限公司| 百博百家乐官网的玩法技巧和规则| 百家乐官网账号变动原因| 娱乐城注册送彩金100| rmb百家乐的玩法技巧和规则| 喜达百家乐现金网| 百家乐官网b28博你| 百家乐官网永利娱乐城| 太阳城娱乐城管理网| 威尼斯人娱乐平台赌| 百家乐高返水| 凯旋门百家乐游戏| 莫斯科百家乐官网的玩法技巧和规则 |