我們在深度學(xué)習(xí)框架(4)-TensorFlow中執(zhí)行計(jì)算,不同激活函數(shù)各有妙用中學(xué)習(xí)了TensorFlow中執(zhí)行張量的計(jì)算,并重點(diǎn)討論一下不同的激活函數(shù)。
今天我們在TensorFlow中對(duì)Tensor進(jìn)行“拆”和“裝”。
說明
(1)張量創(chuàng)建、轉(zhuǎn)化請參考深度學(xué)習(xí)框架(3)-TensorFlow中張量創(chuàng)建和轉(zhuǎn)化,妙用“稀疏性”提升效率(2)張量計(jì)算請參考深度學(xué)習(xí)框架(4)-TensorFlow中執(zhí)行計(jì)算,不同激活函數(shù)各有妙用
1、矩陣運(yùn)算的必要性
(1)Tensor是基礎(chǔ)的數(shù)據(jù)結(jié)構(gòu)
我們在深度學(xué)習(xí)框架(1)-各顯神通提升Tensor效率,讓Tensor流動(dòng)還靠深度學(xué)習(xí)框架中討論過深度學(xué)習(xí)依賴Tensor運(yùn)算,我們再補(bǔ)充一點(diǎn)背景知識(shí)。
Tensor是深度學(xué)習(xí)中廣泛使用的數(shù)據(jù)結(jié)構(gòu),TensorFlow雖然形象的把它加入到命名中,但它并不是TensorFlow特有的,在Pytroch、PaddlePaddle等眾多深度學(xué)習(xí)框架中Tensor也是基本的數(shù)據(jù)結(jié)構(gòu)。
Tensor本質(zhì)上就是一個(gè)高維的矩陣,在深度學(xué)習(xí)領(lǐng)域中,以它作為基本數(shù)據(jù)結(jié)構(gòu)是出于實(shí)際應(yīng)用的需求。
深度學(xué)習(xí)當(dāng)前最成熟的應(yīng)用方向有計(jì)算機(jī)視覺(CV,Compute Vision)和自然語言處理(NLP,Natural Language Processing)兩大領(lǐng)域。其中CV對(duì)象主要是圖像和視頻,NLP的對(duì)象以語音和文本為主;CV的基礎(chǔ)模塊是卷積神經(jīng)網(wǎng)絡(luò)(CNN,Convolutional Neural Network),NLP的基礎(chǔ)模塊是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN,Recurrent Neural Network)。這兩個(gè)應(yīng)用中標(biāo)準(zhǔn)的輸入數(shù)據(jù)集都至少是三維以上,例如:
圖像數(shù)據(jù):包含三個(gè)維度,N×H×W,即樣本數(shù)×圖像高×圖像寬;如果是彩色圖像,那么還要增加一個(gè)通道C,變?yōu)镹×C×H×W;如果是視頻圖像,那么可能還要再增加一個(gè)維度T,N×C×H×W×T。
文本數(shù)據(jù):包含三個(gè)維度:N×L×H,即樣本數(shù)×序列長度×特征數(shù)。
源于應(yīng)用需要,深度學(xué)習(xí)模型的輸入數(shù)據(jù)結(jié)構(gòu)一般都要三維以上,而Tensor是好的選擇,用于支撐深度學(xué)習(xí)模型和訓(xùn)練時(shí)更為便利。
(2)矩陣運(yùn)算是基礎(chǔ)
我們在深度學(xué)習(xí)框架(4)-TensorFlow中執(zhí)行計(jì)算,不同激活函數(shù)各有妙用用TensorFlow中的不同函數(shù)執(zhí)行了加法、乘法等各種運(yùn)算。
加法:矩陣的加法只有同型矩陣之間才可以進(jìn)行加法,所謂同型矩陣是兩個(gè)矩陣的行數(shù)、列數(shù)必須相等。
轉(zhuǎn)置:把矩陣的行和列互相交換所產(chǎn)生的矩陣稱轉(zhuǎn)置矩陣。
乘法:兩個(gè)矩陣乘法的必要條件是,第一個(gè)矩陣A的列數(shù)和另一個(gè)矩陣B的行數(shù)相等時(shí)才能相乘。如矩陣A是m×n矩陣和B是n×p矩陣,它們的乘積C是一個(gè)m×p矩陣。
分解:矩陣分解是將一個(gè)矩陣分解為簡單的或具有某種特性的若干矩陣的和或乘積 ,矩陣分解法有三角分解、譜分解、奇異值分解、滿秩分解等。
我們可以把矩陣的各種操作想象為它在一定空間內(nèi),按照一定的規(guī)則進(jìn)行的運(yùn)動(dòng)(或變換)。比如一個(gè)向量和一個(gè)矩陣相乘,我們可以想象為在線性空間中,向量刻畫了對(duì)象,矩陣刻畫了對(duì)象的運(yùn)動(dòng),用矩陣與向量的乘法施加了運(yùn)動(dòng)。因此,“矩陣的本質(zhì)是運(yùn)動(dòng)的描述”,而想要執(zhí)行運(yùn)動(dòng)必須要要有約束,包括自身的形狀,運(yùn)動(dòng)的規(guī)則等等。
(3)從英偉達(dá)的Tensor Core了解Tenosr索引、重構(gòu)、切片的價(jià)值
我們在深度學(xué)習(xí)框架(1)-各顯神通提升Tensor效率,讓Tensor流動(dòng)還靠深度學(xué)習(xí)框架中討論過,為滿足深度學(xué)習(xí)激增的計(jì)算量,英偉達(dá)在volta架構(gòu)上推出了第一代TensorCore,以后每一代產(chǎn)品都對(duì)TensorCore不斷升級(jí)優(yōu)化。
TensorCore是專為深度學(xué)習(xí)而設(shè)計(jì)的,它在Tensor場景下算得更快,對(duì)于特定大小和精度的矩陣乘法實(shí)現(xiàn)了性能的突破,與前一代Pascal相比,Volta用于訓(xùn)練的峰值性能提升12倍,用于推理的峰值性能提升了6倍。
TensorCore改進(jìn)的方向就是針對(duì)矩陣乘法(GEMM,General Matrix Mulitiplicaiton)運(yùn)算進(jìn)行優(yōu)化。矩陣運(yùn)算是神經(jīng)網(wǎng)絡(luò)訓(xùn)練和推理的核心,下圖以4×4矩陣為例,每個(gè)TensorCore都在重復(fù)執(zhí)行以下操作 D = A×B + C
Tensor Core在執(zhí)行矩陣乘法和加法運(yùn)算時(shí)整個(gè)裝置可簡化為下圖,我們在前面幾章中討論的Tensor的convert,matual,add等操作這里均包含了,我們要注意的是,比如上圖D =A×B+C是以4×4矩陣為基礎(chǔ)的,那么在執(zhí)行這個(gè)指令前,矩陣必須通過裁剪或者整型成為一個(gè)4×4矩陣,標(biāo)準(zhǔn)的input才能在這個(gè)裝置結(jié)構(gòu)中完成指令。
Tensor的索引、切片、重構(gòu)、填充等操作非常常見,因?yàn)檎麄€(gè)計(jì)算系統(tǒng)中從實(shí)際應(yīng)用的輸入數(shù)據(jù)轉(zhuǎn)為了Tensor形式的數(shù)據(jù)結(jié)構(gòu),到轉(zhuǎn)化為適合放置于內(nèi)存中的數(shù)據(jù)模塊,再到轉(zhuǎn)化為計(jì)算裝置執(zhí)行計(jì)算指令的數(shù)據(jù)單元,這每個(gè)步驟中都涉及到了Tensor的“拆”和“裝”的操作。對(duì)Tensor進(jìn)行索引、重構(gòu)、切片都是程序員的必備技能。
2、如何對(duì)一個(gè)Tensor進(jìn)行“拆”和“裝”?
(1)導(dǎo)入TensorFlow,創(chuàng)建tensor
import tensorflow as tf importnumpyasnp rank_1_tensor = tf.constant([0, 1, 1, 2, 3, 5, 8, 13, 21, 34]) rank_2_tensor=tf.constant([[1,2], [3,4], [5,6]]) rank_3_tensor=tf.constant([ [[0, 1, 2, 3, 4], [5, 6, 7, 8, 9]], [[10, 11, 12, 13, 14], [15, 16, 17, 18, 19]], [[20, 21, 22, 23, 24], [25, 26, 27, 28, 29]],])
(2)索引(indexing)
通過索引我們可以在Tensor中提取數(shù)據(jù),包括單軸索、多軸索引等。
單軸索引(single-axis indexing)
print("First:", rank_1_tensor[0].numpy()) print("From 4 to the end:", rank_1_tensor[4:].numpy()) print("From2,before7:",rank_1_tensor[2:7].numpy())
打印結(jié)果>>>
First: 0 From 4 to the end: [ 3 5 8 13 21 34] From 2, before 7: [1 2 3 5 8]
多軸索引(muti-axis indexing)
print(rank_3_tensor[:,:,4])
打印結(jié)果>>>
tf.Tensor( [[ 4 9] [14 19] [24 29]], shape=(3, 2), dtype=int32)
(3)切片(Slice)
通過tf.slice()函數(shù)可以對(duì)不同維度的張量進(jìn)行切片,通過tf.gather_nd()函數(shù)可以從多個(gè)軸中提取切片。
Tensorslice
print(tf.slice(rank_3_tensor, begin=[1,1,0],size=[1,1,2]))
打印結(jié)果>>>
tf.Tensor([[[1516]]],shape=(1,1,2),dtype=int32)
Tensor gather
print(tf.gather_nd(rank_3_tensor,indices=[[2],[0]]))
打印結(jié)果>>>
tf.Tensor( [[[20 21 22 23 24] [2526272829]] [[ 0 1 2 3 4] [ 5 6 7 8 9]]], shape=(2, 2, 5), dtype=int32)
(4)形狀的整理變換(Reshaping)
通過tf.reshape()可改變張量形狀,重構(gòu)速度快,資源消耗低。
reshape matrix
var_x = tf.Variable(tf.constant([[1], [2], [3]])) print(var_x.shape.as_list) reshaped = tf.reshape(var_x, [1,3]) print(var_x.shape) print(reshaped.shape)
打印結(jié)果>>>
(3, 1) (1, 3)
reshape tensor
print(tf.reshape(rank_3_tensor,[3*2,5]),"n")
打印結(jié)果>>>
tf.Tensor( [[ 0 1 2 3 4] [ 5 6 7 8 9] [10 11 12 13 14] [15 16 17 18 19] [20 21 22 23 24] [25 26 27 28 29]], shape=(6, 5), dtype=int32)
reshape tensor
print(tf.reshape(rank_3_tensor,[3,-1]))
打印結(jié)果>>>
tf.Tensor( [[ 0 1 2 3 4 5 6 7 8 9] [10 11 12 13 14 15 16 17 18 19] [20 21 22 23 24 25 26 27 28 29]], shape=(3, 10), dtype=int32)
(5)數(shù)據(jù)的插入(insert)
通過tf.tensor_scatter_nd()可實(shí)現(xiàn)在不同維度的張量中插入數(shù)據(jù)。
insert data into vector
t1 = tf.constant([10]) indices = tf.constant([[1], [3], [5], [7], [9]]) data = tf.constant([2, 4, 6, 8, 10]) print(tf.scatter_nd(indices=indices, updates=data, shape=t1))
打印結(jié)果>>>
tf.Tensor([ 0 2 0 4 0 6 0 8 0 10], shape=(10,), dtype=int32)
insert data into tensor
t2 = tf.constant([[2, 7, 0], [9, 0, 1], [0, 3, 8]]) print(tf.tensor_scatter_nd_add(t2, indices=[[0,2],[1,1],[2,0]], updates=[6,5,4]))
打印結(jié)果>>>
tf.Tensor( [[2 7 6] [9 5 1] [4 3 8]], shape=(3, 3), dtype=int32)
今天我們學(xué)習(xí)了如何在TensorFlow中對(duì)Tensor進(jìn)行“拆”和“裝”,掌握對(duì)Tensor進(jìn)行索引、重構(gòu)、切片等操作非常重要。到這里我們張量部分知識(shí)討論了很多了,下一步我們學(xué)習(xí)如何使用TensorFlow中的變量
審核編輯:劉清
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4779瀏覽量
101167 -
tensorflow
+關(guān)注
關(guān)注
13文章
329瀏覽量
60630 -
nlp
+關(guān)注
關(guān)注
1文章
489瀏覽量
22107
原文標(biāo)題:深度學(xué)習(xí)框架(5)-TensorFlow中對(duì)Tensor進(jìn)行“拆”和“裝”
文章出處:【微信號(hào):Hardware_10W,微信公眾號(hào):硬件十萬個(gè)為什么】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評(píng)論請先 登錄
相關(guān)推薦
評(píng)論