隨著傳統(tǒng)的顯示-存儲(chǔ)-回放模式的監(jiān)控系統(tǒng)的普及,在已有監(jiān)控系統(tǒng)上提供增值服務(wù)的智能監(jiān)控技術(shù)成為行業(yè)發(fā)展的熱點(diǎn)。利用安裝在大型建筑、娛樂休閑場(chǎng)所、購(gòu)物設(shè)施等公共場(chǎng)所的監(jiān)控系統(tǒng),實(shí)現(xiàn)客流量的精確計(jì)數(shù)以及對(duì)人群密度進(jìn)行估計(jì),監(jiān)控人群活動(dòng),保證人群的安全性和分析客流分布規(guī)律等功能成為當(dāng)前監(jiān)控應(yīng)用中迫切需要的功能。
早期先后出現(xiàn)過(guò)光電監(jiān)測(cè)、紅外對(duì)射、紅外光幕客流量計(jì)數(shù)器,由于這些方法計(jì)數(shù)精度差、不能判斷客流行進(jìn)方向、易受外界干擾影響、而且維護(hù)成本高導(dǎo)致應(yīng)用受限。近年來(lái)為克服光照等影響計(jì)數(shù)精度的干擾因素,出現(xiàn)了主動(dòng)/被動(dòng)紅外成像客流量計(jì)數(shù)器,但由于其價(jià)格昂貴而限制了推廣。本文以傳統(tǒng)可見光攝像頭獲取的圖像為處理對(duì)象,在達(dá)芬奇系列處理器TMS320DM6437平臺(tái)上,提取HOG特征實(shí)現(xiàn)人頭檢測(cè),利用Mean-shift實(shí)現(xiàn)人員跟蹤和計(jì)數(shù),完成了客流量統(tǒng)計(jì)的嵌入式模塊化設(shè)計(jì)。
1 、客流量統(tǒng)計(jì)模塊硬件構(gòu)成
基于視頻的客流量統(tǒng)計(jì),按攝像頭放置位置與客流方向的關(guān)系有傾斜放置和垂直放置兩種。在進(jìn)出客流量較大時(shí),攝像頭傾斜放置時(shí)圖像中的人像之間不可避免會(huì)出現(xiàn)遮擋和重疊。為了解決遮擋和重疊問(wèn)題實(shí)現(xiàn)精確計(jì)數(shù),需要采用更復(fù)雜的計(jì)數(shù)算法,額外增加了較大的計(jì)算量。本文采用如圖1所示的攝像頭垂直放置,通過(guò)檢測(cè)和跟蹤人頭實(shí)現(xiàn)客流量的計(jì)數(shù),既避免了遮擋和重疊導(dǎo)致計(jì)數(shù)精度下降的問(wèn)題,又能使人頭檢測(cè)和跟蹤算法計(jì)算量適中。
1.1 TMS320DM6437芯片的特點(diǎn)
TMS320DM6437是TI公司首批支持達(dá)芬奇技術(shù)的純DSP器件,結(jié)合增強(qiáng)型TMS320C64X內(nèi)核與最新視頻處理子系統(tǒng)(VPSS),實(shí)現(xiàn)超強(qiáng)的視頻處理能力。 TMS320C64X采用第二代高性能超長(zhǎng)指令字(VLIW)的體系結(jié)構(gòu),2級(jí)存儲(chǔ)器/高速緩存和EDMA引擎,非常適合高強(qiáng)度的數(shù)學(xué)運(yùn)算;其內(nèi)核主頻高達(dá)600 MHz,峰值處理速度可達(dá)5 600 MIPS。內(nèi)核擁有兩級(jí)緩存結(jié)構(gòu),第一級(jí)緩存(L1)包括80 KB的數(shù)據(jù)緩存(L1D)和32 KB 的程序緩存(L1P),L1直接與CPU連接,數(shù)據(jù)寬度為128 bit。第二級(jí)緩存(L2)的容量大小為128 KB,可以被映射成緩存結(jié)構(gòu)也可被用作片內(nèi)存儲(chǔ)器。核內(nèi)部擁有兩個(gè)處理通路,每條通路包含4個(gè)功能單元,最高時(shí)可在一個(gè)時(shí)鐘并行處理8條指令;視頻處理子系統(tǒng)(VPSS),以D1分辨率實(shí)現(xiàn)高達(dá)H.264的視頻編碼。TMS320DM6437芯片還擁有豐富的外部接口,片內(nèi)包含4路視頻數(shù)模轉(zhuǎn)換芯片,可實(shí)現(xiàn)多種制式的模擬視頻信號(hào)輸出,為運(yùn)行客流量統(tǒng)計(jì)程序提供了一個(gè)高性價(jià)比的硬件平臺(tái)。
1.2 系統(tǒng)硬件構(gòu)成
系統(tǒng)主要由圖像采集、圖像數(shù)據(jù)存儲(chǔ)、圖像數(shù)據(jù)處理和圖像顯示等部分組成。圖像采集部分使用TI公司的TVP5150專用圖像采集器。TVP5150的主要作用是把輸入的模擬視頻信號(hào)轉(zhuǎn)換成符合ITU-R BT.656標(biāo)準(zhǔn)的4:2:2 YUV全數(shù)字視頻信號(hào)。運(yùn)行人頭檢測(cè)和跟蹤計(jì)數(shù)算法的處理器采用TI公司的高性價(jià)比媒體處理器TMS320DM6437。該處理器先從視頻轉(zhuǎn)換芯片TVP5150讀取數(shù)字視頻數(shù)據(jù),然后運(yùn)行人頭檢測(cè)和跟蹤計(jì)數(shù)程序,最后在檢測(cè)的人頭上加框后顯示統(tǒng)計(jì)的客流量。由于圖像數(shù)據(jù)量大,TMS320DM6437處理器運(yùn)行客流量統(tǒng)計(jì)程序時(shí),不可避免會(huì)將運(yùn)行的中間數(shù)據(jù)存儲(chǔ)在片外高速RAM中(片外RAM采用256 MB的DDR2 DRAM存儲(chǔ)器)。視頻顯示芯片采用Philips公司的視頻編碼芯片SAA7126H,實(shí)現(xiàn)視頻顯示。系統(tǒng)基本的硬件結(jié)構(gòu)如圖2所示。
2、 利用HOG特征實(shí)現(xiàn)人頭檢測(cè)
Dalal等人首先將HOG特征用于靜態(tài)圖像中的行人檢測(cè),其主要思想是利用局部區(qū)域的梯度方向直方圖來(lái)描述目標(biāo)特征。本文用HOG特征結(jié)合支撐向量機(jī)SVM(Support Vector Machine)分類器進(jìn)行頭部檢測(cè),分為SVM分類器訓(xùn)練和人頭檢測(cè)兩個(gè)階段。
2.1 HOG特征提取
提取目標(biāo)的HOG特征步驟如下:首先按照式(1)和式(2)計(jì)算灰度圖像的梯度幅值和梯度方向。
其中,Gx、Gy分別是(x,y)的水平和豎直梯度,梯度的方向設(shè)定為0~?仔。本文梯度的方向反映該像素點(diǎn)周圍的灰度變化的方向,梯度的幅度反映灰度變化的大小。
然后進(jìn)行子塊單元的劃分和方向直方圖統(tǒng)計(jì)。如圖3(a)所示,將圖像劃分為若干個(gè)圖像塊(BLOCK),每個(gè)塊劃分為若干個(gè)正方形圖像單元(CELL),圖像單元的邊長(zhǎng)記為CELLSIZE。圖3(a)中CELL的大小為8×8個(gè)像素,即CELLSIZE=8;一個(gè)BLOCK包含2×2個(gè)圖像單元CELLNUM=4。以一個(gè)圖像單元為單位,進(jìn)行方向梯度直方圖的統(tǒng)計(jì)。將梯度方向劃分為BIN個(gè)區(qū)間,對(duì)于各個(gè)區(qū)間的梯度相加,形成一個(gè)BIN維的向量來(lái)描述一個(gè)圖像單元。最后生成圖像的Hog描述子,對(duì)于每一個(gè)BLOCK對(duì)應(yīng)的BIN×CELLNUM維向量可以根據(jù)實(shí)際需要按式(3)進(jìn)行標(biāo)準(zhǔn)化:
最后所有CELL對(duì)應(yīng)的向量構(gòu)成整個(gè)圖像的Hog描述子,如圖3(b)所示,圖像由16個(gè)CELL組成。
2.2 SVM分類器的訓(xùn)練和人頭檢測(cè)
人頭檢測(cè)的分類器選擇高斯內(nèi)核的支撐向量機(jī)(SVM)。SVM分類器的訓(xùn)練分兩次進(jìn)行,第一次是使用人頭居中的正樣本和從不包含人頭對(duì)象的圖像(源負(fù)樣本)中取樣得到的負(fù)樣本中訓(xùn)練出基本分類器。第二次是采用基本分類器對(duì)所有源負(fù)樣本進(jìn)行密集掃面檢測(cè),將其中檢測(cè)錯(cuò)誤的子圖像歸為困難負(fù)樣本,然后將之前的正樣本和負(fù)樣本與困難樣本一起對(duì)基本分類器進(jìn)行二次訓(xùn)練。在對(duì)源負(fù)樣本進(jìn)行密集掃描時(shí),不僅掃描步長(zhǎng)要小,而且還要加入尺度的變化(尺度步長(zhǎng)可設(shè)為 1.5 或者2),盡可能地獲取源負(fù)樣本的局部信息和全局信息。這樣得到的負(fù)樣本才夠健壯,對(duì)二次訓(xùn)練后檢測(cè)器的效果也提升得更加全面。
SVM分類器的訓(xùn)練階段,訓(xùn)練用正樣本和負(fù)樣本的尺寸固定,大小為32×24。在人頭檢測(cè)階段,由于距離等因素,導(dǎo)致目標(biāo)(人頭)大小變化較大,本文采用訓(xùn)練模板大小不變而只縮放待檢測(cè)圖像的方法實(shí)現(xiàn)目標(biāo)的多尺度檢測(cè),檢測(cè)結(jié)果如圖4(a)所示。
3、 Mean-shift跟蹤計(jì)數(shù)
利用HOG特征,只能實(shí)現(xiàn)單幅圖像中人頭的檢測(cè)。要完成人員計(jì)數(shù),必須利用多幀圖像信息,既要檢測(cè)出圖像中新出現(xiàn)的目標(biāo),又要利用目標(biāo)跟蹤技術(shù),確定連續(xù)多幀圖像中的同一個(gè)目標(biāo),實(shí)現(xiàn)人員統(tǒng)計(jì)計(jì)數(shù)。
利用Mean-shift實(shí)現(xiàn)人員跟蹤計(jì)數(shù)具體步驟如下:
(1)將人頭檢測(cè)的結(jié)果作為初始的搜索窗口,確定窗口大小和位置。
(2)計(jì)算搜索窗口內(nèi)的灰度概率分布函數(shù),并用該分布函數(shù)反演下一幀的待搜索圖像。
(3)利用前一幀初始搜索窗口的大小和位置信息,確定當(dāng)前幀的搜索起點(diǎn)和范圍,并在計(jì)算選取搜索窗口中按照式(4)、式(5)計(jì)算零階矩和一階矩,并按照式(6)計(jì)算搜索窗口的質(zhì)心:
4 、試驗(yàn)結(jié)果
用圖像大小為384×307、30幀/s的實(shí)拍視頻流進(jìn)行測(cè)試實(shí)驗(yàn),測(cè)試視頻中行人只能從畫面的上下兩端進(jìn)入。為減小計(jì)算量,人頭檢測(cè)只在圖像的上下1/4區(qū)域進(jìn)行檢測(cè),根據(jù)行人運(yùn)動(dòng)方向,在圖像的中間1/2 區(qū)域進(jìn)行搜索跟蹤技術(shù),完成客流量統(tǒng)計(jì)。實(shí)驗(yàn)結(jié)果如圖4(b)所示。在達(dá)芬奇系列處理器TMS320DM6437平臺(tái)上實(shí)測(cè)數(shù)據(jù)處理速度為28幀/s,客流量統(tǒng)計(jì)精度為97.8%。試驗(yàn)中測(cè)試發(fā)現(xiàn),HOG特征檢測(cè)人頭消耗了系統(tǒng)70%的計(jì)算量。為進(jìn)一步提高計(jì)算速度,對(duì)人頭檢測(cè)算法進(jìn)行優(yōu)化:利用積分圖計(jì)算HOG特征,采用Cascade結(jié)構(gòu)組合SVM分類器。優(yōu)化后,在不影響客流量統(tǒng)計(jì)精度的情況下實(shí)測(cè)處理速度達(dá)到了38幀/s。
本文在達(dá)芬奇系列處理器TMS320DM6437平臺(tái)上,設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)實(shí)時(shí)的嵌入式客流量統(tǒng)計(jì)模塊,實(shí)測(cè)表明,客流量統(tǒng)計(jì)精度高,數(shù)據(jù)處理速度快。在不改變已有監(jiān)控系統(tǒng)的結(jié)構(gòu),僅通過(guò)增加該模塊就可實(shí)現(xiàn)客流量統(tǒng)計(jì)等智能監(jiān)控功能,具有良好的市場(chǎng)前景。
責(zé)任編輯:gt
評(píng)論
查看更多