摘要:提出了一種基于小波和熵提取圖像字符特征的方法。該方法利用小波變換對圖像字符進行多尺度分解,用marr零交叉邊緣檢測算子提取邊緣;用基于判別熵最小化提取每一尺度圖像的邊界特征,小波的“數字顯微鏡”的優點與熵能確切地表達各類的交疊狀況且能直接表達錯誤率的特征相結合。與其它方法相比,該方法提取的特征向量穩定、識別率高、算法快,非常有利于分類,且特征提取的方法有人類視覺的特點。
在線簽名驗證是通過計算機采集和驗證個人簽名,從而實現無紙化辦公的一種技術[1]。其中,從采集到的視頻圖像中提取有效的字符特片是在線簽名驗證系統的核心步驟。
隨著計算機和模式識別技術的迅速發展,出現了很多提取字符特征的方案,最具代表性的有邊緣描述法和矩描述法[2]。描述邊緣形狀的方法可用曲線擬合和傅立葉描述子方法。傅立葉描述子雖較好地描述了一封閉的圖像輪廓,但其特征很多,噪聲和量化誤差對具有較低幅值的系數影響較大。當用FFT計算傅立葉系數,必須將其邊界點的長度修成2的整數次冪,且其描述不具有三個(方向、位置、大小)不變性,不能直接用于目標識別,必須進行復雜的變換。這些都影響了它的使用。矩描述法就是利用圖像灰度分布的各階矩描述圖像灰度分布的特征。矩特征是定義在整個圖像空間上的一個二重積分,它同樣不具有三個不變性,使用時必須進行歸一化處理。不變矩只是一種旋轉歸一化方法,必須結合大小,位置歸一化處理才有三個不變性。
圖1
雖然用這些特征進行圖像識別取得了較為滿意的效果,但是,這些特征的定義都是相當復雜的,運算量很大,并且與人類認知的機理也是完全不同的,不能直觀地理解。本文提出了一種將統計特征與結構特征相結合的新思路,對字符圖像進行小波多尺度分解,有效地抑制了圖像中的噪聲,充分反映了圖像結構的精細特征;用基于判別熵最小化進行特征提取能確切地表達各類的交疊狀況,且能直接表達錯誤率,從而有效地提高識別率。
1 小波多尺度分解
為了尋找空間的L2的基,先從L2的某個子空間出發,在這個子空間中先建立基底,然后利用簡單變換,把這個基底擴充到空間L2上,以形成一組基。這就是多尺度分析方法[3][4]。
對于二維的情況,設{V2J}jez是一個可分離的MRA:V2J=VjVj,其中{V2j}jez是L2(R2)的一個MRA,其尺度函數為¢是一維MRA{V2j}jez的實值尺度函數,小波母函數采用Dabuechies[6]小波;相應于二維尺度函數V2j=VjVj,定義三個函數:
構成子空間W2j的正交標準基,而它們的伸縮平移系(簡寫)為:
是L2(R2)的一個標準正交基。
在本系統中,通過與計算機相連的手寫板及電子筆將簽名采集到計算機并顯示在屏幕上。采集并輸入到計算機中的圖像是二維,本文中設要分解的圖像為f (x,y)ΕL2(R2)。為方便,設L2(R2)-V2N,即令fN是f在V2N的正交投影。這樣關于f的有限小波分解就是對fN的分解。由于:
假定{V2j}jez上的尺度函數Φj,Φj(x,y)=2jΦ(2jx,2jy)為二維MAR{V2j}jez的尺度函數,小波函數ψ(α)j, α=1,2,3已分別由式(1)和式(2)給出,并由陣列{CNk1,k2},(k1,k1ΕZ2),使得:
其中,Cn,k1,k2=
同樣,有:
式中(6),j=N-1,Λ,N-M。fj是fN在f2j上的低通濾波信號,而gαj, α=1,2,3是fN在W2j上的三個高通濾波細節。再設有限長序列{Pk1}、{Pk2}分別是平面(x,y)上x方向與y方向的高通濾波系數,{gk1}與{gk2}分別是x方向與y方向的低通濾波系數,則由式(6)得到:
上式中箭頭右部分是左部分的矩陣表示,其中CN是原始信號f(x,y)的分布陣列,Pr、Pc是分別對CN的行與列作低通濾波的算子,而Qr、Qc是分別對CN的行與列作高通濾波的算子。而進一步地第j次分解應為:
式(7)中,j=N-2, Λ,N-M。式(7)便是二維信號fN或CN的有限正交小波分解的Mallat塔式算法[5]。通過實驗,選用Daubechies 8小波能達到較好的分解效果。對采集進入計算機的真實簽名與偽造簽名進行小波分解,限于遍幅,本文只給出了真實簽名的一次分解圖,如圖書1所示。
通常在實驗中,借助Matlab6.5將真假簽名的字符圖像通過兩個互補濾波器即低通濾波器和高通濾波器分別得到圖像的相似和細節部分。相似子圖主要是原始圖像的全局、低頻成分,而細節子圖通常是原始圖像的局部、高頻成分。細節子圖又包括水平子圖、斜向子圖和垂直子圖三部分。其中細節子圖經過兩次濾波:水平方向允許低頻分量通過,而沿垂直方向允許高頻分量通過。這對橫向筆劃(灰度變化沿水平方向為低頻,沿垂直方向為高頻)是增強,而對豎筆劃(灰度變化沿水平方向為高頻,沿垂直方向為低頻)是平滑。垂直方向和斜方向的像素按同樣的道理分別在垂直子圖和斜子圖中被突出表示。這種方向選擇性與人眼視覺特性相吻合,使建立在此基礎上的特征提以算法具有類視覺特性。
圖2
2 零交叉邊緣算子
經典的邊緣檢測算子有Sobel算子、Laplace算子、Marr算子等,近年來又有學者提出了廣義模糊算子[7]、形態學邊緣算[8]等。而Marr邊緣檢測算子▽2G被譽為最佳邊緣監測器之一,所以本文采Marr算子。該算子的特點是利用高斯濾波器對圖像進行平滑。二維高斯濾波器的響應函數。設f(x,y)為二值圖像函數,由線性系統中卷積和微分的可交換性,得▽2{G(x,y)хI(x,y)}={ ▽2G (x,y)} хI(x,y),即:對圖像的高斯平滑濾波與拉普拉斯微分運算可結合成一個卷積子如下:
用上述算子卷積圖像,通過判斷符號的變化確定出零交叉點的位置,就是邊緣點。對小波一次分解后的真實簽名的處理結果如圖2所示。
通過圖2可以看出,Marr零交叉邊緣算子同時提取了強、弱邊緣,并且邊緣相對干凈,噪聲干擾少,連續性好。
3 基于判別熵最小化的特征提取
不同的類樣本占有不同的特征空間的區域,只要這些區域不相交疊,它們就可以分開。經常用樣本間的平均距離作為特征提取的判據函數。重要的距離有Minkowski度量ΔM、歐氏距離δE、Chebychev距離δr、平方距離δQ和非線性度量δN等。在不考慮各類的概率分布時,不能確切地表達各類的交疊狀況,且不能直接表達錯誤率。為此,應考慮概率距離,利用不確定性最小的分征進行分類是最有利的,故可用熵來度量后驗證概率分布的集中程序。
某此概率分布密度偏離給定標準分布的程度的度量,叫相對熵。本文假定經小波和Marr算子處理后的圖像函數?(xi,yj)的概率分布為P(xi,yj),給定標準分布ω(xi,yj),則兩者之間的相對熵為:
求和應在該特征所有可能的取值上進行。
相對熵越小,這兩類概率分布的差別就越大,當兩類概率分別完全相同時,相對熵達最大值(等于零)。因此可以定義判別熵W(p,q)來表征兩類分布p(xi,yj)和q(xi,yi)的差別大小。
在多類情況下,可以用ΣnΣmW(p(n),q(m))表示各類分布之間的分離程度。這里n,m代表類別號。
對特征提取來說,在給定維數d的條件下,求得這樣d個特征,它使上述判別熵最小。為了計算方便,本文用下列函數-U(p,q)= ΣiΣj(pi,j-qij)2≤0代替W(p,q),而不影響選取d個最優特征的結果。
在不對概率分布作估計的情況下,可以用經過歸一化處理的樣本特征值代替上式中的概率分布。
K是第一類樣本集中的樣本號,N1是第一類的樣本總數,i是特征號。由于,這樣做是合理的。而U取最小值的坐標系統工程是由矩陣A=G(1)-G(2)滿足一定條件的d個本征值相應的本征向量組成的。這里G(1)和G(2)分別是第一類樣本集和第二類本集的協方差矩陣。即將矩陣A的本征向量uk對應的本征值λk,k=1,2,ΛD排隊:
選取本征值對應的本征向量為所要求的坐標軸系統,在這個坐標系統中判別熵最小。在實驗中選取Shannon熵。表1和表2分別列出了真實簽名和偽造簽名分解后的各尺度圖像的最小判別熵。
由表1和表2的計算數據可以看出,通過小波一次分解后的最小判別熵的數據可以很明顯地對真假簽名進行鑒別。并且,相似圖形與細節圖形的最小判別熵相差甚遠,區別較大;而細節圖形中的水平子圖、斜向子圖和垂直子圖三部分的最小判別熵卻相差較小。因此,這樣提取的特征向量穩定性好、區別性大、正確性高。
表1 真實簽名最小判別熵
相似圖形 | 水平子圖 | 斜線子圖 | 垂直子圖 | |
相似圖形 | 0.0000 | 56.7827 | 58.371 | 60.5942 |
水平子圖 | 58.371 | 0.0000 | 1.5883 | 3.8115 |
斜線子圖 | 56.7827 | 1.5883 | 0.0000 | 2.2232 |
垂直子圖 | 60.5942 | 3.8115 | 2.2232 | 0.0000 |
表2 偽造簽名最小判別熵
相似圖形 | 水平子圖 | 斜線子圖 | 垂直子圖 | |
相似圖形 | 0.0000 | 101.5640 | 126.6594 | 149.2631 |
水平子圖 | 101.5640 | 0.0000 | 25.0954 | 47.6991 |
斜線子圖 | 126.6594 | 25.0954 | 0.0000 | 22.6037 |
垂直子圖 | 149.25631 | 47.6991 | 22.6037 | 0.0000 |
4 實驗結論
對120個不同的真實簽名進行了實驗,且每份真實簽名對應20個不同的偽造簽名,用小波分別對這些簽名圖像進行6次分解,各選取其中的256幅圖像,分別進行邊緣連接及最小化判別熵特征提取,鑒別率達到了98.7%,取得了令人滿意的結果。通過以上的理論分析和實驗驗證說明,用小波分解使原來單一的時域信號分解為不同頻率尺度下的信號不僅能獲得圖像在各尺度上的細節信息,且噪聲干擾少,邊緣清晰;在特征提取時用熵函數的期望值表征類別的分離程度,可以作為分類有效性的評價。該方法的優越性對提高在線簽名驗證的精確性具有重要的意義。
相關推薦
ORB_FPGA單層圖像金字塔的ORB特征提取方案分析


基于卷積神經網絡的雙重特征提取方法


多站低頻雷達運動人體微多普勒特征提取與跟蹤技術【論文干貨】
HOOFR-SLAM的系統框架及其特征提取
MATLAB中怎么對音頻信號頻譜圖中能量密度特征用數學形態學的方法進行特征提取?
分形特征的模擬電路故障診斷方法
基于局域判別基的音頻信號特征提取方法
如何提取顏色特征?
如何將脈沖耦合神經網絡,體視學等結合實現藥材顯微圖像的特征提取?
手背靜脈特征提取算法
模擬電路故障診斷中的特征提取方法
高分辨率合成孔徑雷達圖像的直線特征多尺度提取方法
基于改進ReliefF算法的主成分特征提取方法

基于已知特征項和環境相關量的特征提取算法

基于興趣點顏色及紋理特征的圖像檢索算法

基于DDCT與TCSVD的人臉特征提取與識別算法

基于DCT和KDA的人臉特征提取新方法

主成份分析在數字圖像特征提取中的應用

基于Fisher的Gabor特征提取方法

SISAR功率譜特征提取方法

基于廣義典型相關分析的仿射不變特征提取方法

基于融合邊緣檢測的SAR圖像線性特征提取算法

基于小波域NMF特征提取的SAR圖像目標識別方法

利用改進分形特征對SAR圖像目標檢測方法的研究

模式識別中的特征提取研究

KPL特征提取在心電識別中的應用研究

特征提取與模板匹配結合的圖像拼接方法

基于有效性評價機制的小波包特征提取技術

非線性PCA在表面肌電信號特征提取中的應用

基于子塊特征的遙感圖像邊緣灰提取

基于小波分析的車輛噪聲特征提取方法

故障特征提取的方法研究


小波變換在過零調制信號特征提取中的應用


基于EMD法的語音信號特征提取

多尺度Gabor小波變換在圖像檢索中的應用

紋理特征提取方法

基于Gabor變換的中文字符特征提取方法研究

基于奇異值分解的車牌特征提取方法研究

基于Gabor的特征提取算法在人臉識別中的應用

基于改進SIFT的圖像拼接算法

模擬電路故障診斷中的特征提取方法

一種對野值魯棒的紋理特征提取方法

顏色特征提取方法

具有SIFT描述的多尺度角點圖像配準

激光網格標記圖像特征提取

基于HSV色彩空間改進的多尺度顯著性檢測方法

基于三通道全連接層的卷積神經網絡特征提取

Curvelet變換用于人臉特征提取與識別


一種去冗余的SIFT特征提取方法

小波提取圖像特征方法研究


基于多尺度HOG的草圖檢索

基于眼底圖像三個彩色通道的出血特征提取方法

基于LBP的深度圖像手勢特征提取算法

基于生物視皮層機制的視頻運動特征提取方法

一種新的語音信號特征提取方法

基于主成分分析方向深度梯度直方圖的特征提取算法

無監督行為特征提取算法

基于小波脊線的特征提取算法

基于HTM架構的時空特征提取方法

液壓泵振動信號特征提取方法

如何提高愛好特征提取的效率詳細算法說明

圖像邊緣檢測和特征提取實驗報告的詳細資料說明

機器學習之特征提取 VS 特征選擇


改進多尺度三維殘差卷積神經網絡的高光譜圖像方法

改進多尺度三維殘差卷積神經網絡的高光譜圖像方法

基于注意力機制和多尺度特征融合的網絡結構

融合多尺度與多層級特征的立體匹配方法

利用FCN提取特征的紅外與可見光圖像融合方法

一種面向鐵路文本分類的字符級特征提取方法

一種基于信息熵與綜合函數特征提取

卷積神經網絡是怎樣實現不變性特征提取的?


為什么卷積神經網絡可以做到不變性特征提取?


多尺度卷積特征融合的SSD目標檢測

基于特征提取和密度聚類的鋼軌識別算法

基于特征的基圖像提取和重構方法

基于并行附加特征提取網絡的SSD地面小目標檢測模型

計算機視覺中不同的特征提取方法對比

高光譜圖像特征提取方法綜述


高光譜影像顯著性特征提取方法


bp神經網絡的原理 用BP神經網絡去識別圖片上的字符

評論