摘要:針對常規特征提取方法存在著問題不足,提出了基于BP神經網絡和基于互信息熵的特征提取方法,并通過特征提取實例加以說明。結果表明這兩種方法是可行和有效的。
隨著科學技術的發展,現代設備的結構日趨復雜,其故障類型越來越多,反映故障的狀態、特征也相應增加。在實際故障診斷過程中,為了使診斷準確可靠,總要采集盡可能多的樣本,以獲得足夠的故障信息。但樣本太多,會占用大量的存儲空間和計算時間,太多的特征輸入也會引起訓練過程耗時費工,甚至妨礙訓練網絡的收斂,最終影響分類精度。因此要從樣本中提取對診斷故障貢獻大的有用信息。這一工作就是特征提取。
特征提取就是利用已有特征參數構造一個較低維數的特征空間,將原始特征中蘊含的有用信息映射到少數幾個特征上,忽略多余的不相干信息。從數學意義上講,就是對一個n維向量X=[x1,x2,…,xn]T進行降維,變換為低維向量Y=[y1,y2,…,ym]T,m
特征提取的方法有很多,常用的方法主要有歐式距離法、概率距離法、統計直方圖法、散度準則法等。本文針對現有方法的局限性,研究基于BP神經網絡的特征提取方法和基于互信息熵的特征提取方法。
1 基于BP神經網絡的特征提取方法
要從N個特征中挑選出對診斷貢獻較大的n個特征參數(n
εij=|(аYi)/(аXj)|
采用三層BP網絡,輸入層n個單元對應n個特征參數,輸出層m個單元對應m種模式分類,取中間隱層單元數為q,用W B iq表示輸入層單元i與隱層單元q之間的連接權;用w O qj表示隱層單元q與輸出層單元j之間的連接權,則隱層第q單元的輸出Oq,為:
輸出層第j個單元輸出yj為:
式中j=1,2,…,m;εj為閾值。
則特征參數xi對模式類別yj的靈敏度為:
代入(1)式,則特征參數Xi的靈敏度εij和特征參數Xk的靈敏度εkj之差可整理為:
大量的試驗和研究表明,當網絡收斂后有:a1≈a2≈…≈aq。
從上式可以看出,如果:
則必有:εij>εki
即特征參數Xi對第j類故障的分類能力比特征參數Xk強。
將特征參數X和分類模式分類結果y組成的樣本集作為BP網絡的學習樣本,對網絡進行訓練。設Wiq和Wkq分別為與特征參數Xi和Xk對應輸入單元與隱層單元q之間的連接權系數,記:
│Wεi│=│Wi1│+|Wi2|+…+|Wiq|
│Wεk│=│Wk1│+|Wk2|+…+|Wkq|
如果│Wεi│>│Wεk│,則可以認為Xi的特征靈敏度εi比特征參數Xk的靈敏度εk大。這樣可知特征參數Xi的分類能力比特征參數Xk的分類能力強。
2 基于互信息熵的特征提取方法
由信息特征可知,當某特征獲得最大互信息熵,該特征就可獲得最大識別熵增量和最小誤識別概率,因而具有最優特性。特征提取過程就是在由給定的n個特征集X二{XI~X2,…,zn)所構成的初始特征集合情況下,尋找一個具有最大互信息熵的集合:X={X1,X2,…,Xk},k
在一定的初始特征集合下,識別樣本的后驗熵是一定的。在實現特征優化過程中,隨著特征的刪除,會有信息的損失,使得后驗熵趨于增加。因此后驗熵增值大小反應了刪除特征向量引起的信息損失的情況。當刪除不同特征及刪除特征數逐步遞增時,會對應有不同的后驗熵。按后驗熵由小到大排列,可獲得對應的特征刪除序列。其過程可描述為:
(1)初始化:設原始特征集合F={N個特征},令初始優化特征集合S=[K個特征,K=N];
(2)計算后驗熵;
(3)實現遞減:S=[K-1個特征],并計算相應的后驗熵;
(4)選擇優化特征集合:以多個遞減特征集合所對應的后驗熵為依據,選擇具有最小后驗熵增的特征向量集合為優化特征集合S[N-1個優化特征];
(5)返回(3),重新計算,直到滿足分類要求,選擇具有最小后驗熵的優化特征集合;
(6)輸出優化特征集合。
3 特征提取實例
在熱電廠的發電機組工作中,發電機組主軸經常遇到如喘振、流體激勵等故障。這些故障不僅會引起生產效率下降,而且會對機器造成嚴重危害,影響機組的安全運行。傳統的診斷方法是在主軸軸承處加傳感器進行振動測試,得到其頻譜圖;然后在頻域內分析,根據基于能量分布的故障診斷理論將振動信號功率譜密度按一定的規則進行量化,利用神經網絡等工具進行故障診斷。但是喘振、流體激勵等故障在頻域內通常表現為連續分布的有色噪聲帶,在頻域內分析難以區分,難以進行頻譜特征提取,全息譜分析方法也不甚有效。傳統方法增加了系統的開銷,診斷效果不理想。如果在時域內采用信息優化方法做預處理,再用傳統的診斷方法進行診斷,可以收到很好的效果。
本文采用時域內故障振動信號的方差、峭度、偏斜度等參數,分別利用BP神經網絡和后驗熵分析對其進行特征提取,研究如何從中找出最能反映故障的特征。
表1為主軸喘振、流體激勵故障時振動信號在垂直和水平方向的方差、峭度、偏斜度等6個參數的數據。
設原始特征集合F={x1,x2,x3,x4,x5,x6},其中x1、x2分別為垂直、水平方向的均方差,x3、x4分別為垂直和水平方向的峭度,x5、x6,分別為垂直和水平方向的偏斜度。
① 基于BP神經網絡的特征提取方法:采用表1中的數據作為BP神經網絡的輸入,編制程序對神經網絡進行訓練,訓練算法采用標準BP算法和Levenberg-Mar-quardt法兩種方法來訓練BP網絡,從而計算特征參數的特征靈敏度,確定出對結果影響最大的特征參數。
喘振:
│W1│={1.5874 1.6553 25.5320 25.1765 74.4724 40.4295}
流體激勵:
│W2│={1.5874 1.6553 25.5320 25.1765 74.4724 40.4295}
從結果可以看出:偏斜度對這兩種故障最為敏感,反映了低頻自激故障的主要特征。
② 基于互信息熵的特征提取方法:原始特征集合F={x1,x2,x3,x4,x5,x6}對應表1中的特征參數。在特征參數優化過程中,隨著特征的刪除,后驗熵變化較大。當刪除的特征中包含有x5、x6時,后驗熵明顯降低;如僅保留x5、x6時,后驗熵最小。說明偏斜度對這兩種故障最為敏感。
對比這兩種特征提取方法,可以看出它們得到的結論是一樣的。如果采用通頻全息譜法來進行分析,得到的結論相同,從而驗證了這兩種特征提取方法的有效性。
在實際的狀態監測和故障診斷中,可以重點監測系統的偏斜度,配合對振動信號的頻譜分析,可以快速地判斷故障類型和具體發生的時間。
表1 主軸故障的特征參數
序號
喘振
流體激勵
均方差
峭度
偏斜度
均方差
峭度
偏斜度
垂直
水平
垂直
水平
垂直
水平
垂直
水平
垂直
水平
垂直
水平
1
7.50
9.21
-0.02
-0.00
-0.22
-0.10
40.2
44.1
0.22
-0.42
-0.11
-0.08
2
26.1
15.2
-0.75
-0.92
-0.31
-0.21
70.1
20.5
3.82
1.78
0.00
0.16
3
13.8
9.21
-0.81
-0.72
-0.29
0.19
12.4
14.2
-0.38
-0.62
0.03
0.01
4
6.2
8.5
-0.01
-0.04
-0.22
-0.23
8.15
33.5
0.15
-0.14
0.07
0.10
5
36.1
11.2
-0.61
-0.01
-0.23
0.07
7.21
15.2
-0.41
-0.51
0.01
0.01
6
11.5
9.71
-0.81
-0.93
-0.31
-0.18
25.7
30.2
-0.37
0.19
-0.11
-0.06
7
33.1
28.2
-0.79
-0.85
-0.07
-0.45
71.2
25.3
3.81
1.85
0.01
0.16
8
37.2
26.8
-0.81
-0.87
-0.06
-0.41
8.11
35.2
-0.81
-0.13
0.01
0.11
評論
查看更多