虞卞雨萱 1,陸科林 1 ,符啟恩 1,張寧 2
?。?. 東南大學(xué)自動(dòng)化學(xué)院,南京 210096; 2. 北京機(jī)電工程研究所,北京 100074)
【引用格式】虞卞雨萱,陸科林,符啟恩,等。 基于神經(jīng)網(wǎng)絡(luò)和無(wú)跡卡爾曼濾波融合的天線罩誤差斜率估計(jì)方法[J]。戰(zhàn)術(shù)導(dǎo)彈技術(shù),2023(1):121-131.
DOI:10.16358/j.issn.1009-1300.20220183
摘 要為消除導(dǎo)引頭天線罩引入的瞄準(zhǔn)誤差對(duì)制導(dǎo)系統(tǒng)穩(wěn)定性和精度造成的負(fù)面影響,提出了一種基于神經(jīng)網(wǎng)絡(luò)和無(wú)跡卡爾曼濾波融合的天線罩誤差斜率估計(jì)方法??紤]先驗(yàn)?zāi)P椭R(shí),分別建立導(dǎo)引頭、自動(dòng)駕駛儀、彈目相對(duì)運(yùn)動(dòng)系統(tǒng)和彈體動(dòng)力學(xué)系統(tǒng)的動(dòng)態(tài)模型,選取真實(shí)視線角、視角和天線罩誤差斜率作為狀態(tài)變量,根據(jù)視線角觀測(cè)值建立測(cè)量模型??紤]到模型的不確定性,基于神經(jīng)網(wǎng)絡(luò)技術(shù)學(xué)習(xí)非線性濾波模型中的動(dòng)力學(xué)方程,結(jié)合無(wú)跡卡爾曼濾波技術(shù),根據(jù)所學(xué)習(xí)的代理模型和帶噪聲的系統(tǒng)量測(cè),對(duì)天線罩誤差斜率等狀態(tài)進(jìn)行實(shí)時(shí)在線估計(jì)。與傳統(tǒng)采用非線性濾波技術(shù)的天線罩誤差斜率估計(jì)方法相比,本方法基于數(shù)據(jù)驅(qū)動(dòng)思想,減少了對(duì)精確動(dòng)力學(xué)模型的依賴,能有效消除模型不確定性的影響。與單純采用離線訓(xùn)練構(gòu)造的神經(jīng)網(wǎng)絡(luò)相比,本方法結(jié)合貝葉斯濾波理論,對(duì)實(shí)時(shí)數(shù)據(jù)具有更強(qiáng)的適應(yīng)性。經(jīng)多次仿真實(shí)驗(yàn),證實(shí)該方法能夠有效控制預(yù)測(cè)誤差,具有較高精度。
1 引 言
現(xiàn)代戰(zhàn)爭(zhēng)中,出于人道主義和有效打擊的考量,精準(zhǔn)的點(diǎn)目標(biāo)打擊逐漸取代了大面積轟炸,如何實(shí)現(xiàn)精確制導(dǎo)成為各國(guó)學(xué)者關(guān)注的重點(diǎn)。雷達(dá)尋的導(dǎo)彈是精確制導(dǎo)武器的代表之一,它利用雷達(dá)導(dǎo)引頭獲得目標(biāo)的角度觀測(cè),并結(jié)合制導(dǎo)律實(shí)現(xiàn)目標(biāo)跟蹤,進(jìn)而精確打擊,這個(gè)角度觀測(cè)即為視線角(Line of Sight Angle,LOS)。 出于流線型的外形需求和防止氣流擾動(dòng)影響天線測(cè)量結(jié)果的考慮,雷達(dá)導(dǎo)引頭并非直接暴露在導(dǎo)彈頭部,而是罩有一個(gè)保護(hù)裝置:導(dǎo)引頭天線罩(Antenna Radome)[1]。但是天線罩會(huì)影響電磁波的傳輸[2],使電磁信號(hào)發(fā)生衰減、折射和反射等效應(yīng),從而造成瞄準(zhǔn)線誤差,形成天線罩誤差角,這種測(cè)量誤差將降低有效導(dǎo)航比,增大脫靶量[3]。更嚴(yán)重的是,這使得彈體姿態(tài)耦合到導(dǎo)引頭,在制導(dǎo)回路內(nèi)部形成一條寄生回路,嚴(yán)重影響制導(dǎo)系統(tǒng)的穩(wěn)定性[4],加大了控制難度。
為避免天線罩誤差帶來(lái)的負(fù)面影響,最直接的思路是對(duì)天線罩進(jìn)行精確建模,文獻(xiàn)[5]根據(jù)電磁波折射理論推導(dǎo)了波束指向偏移模型,創(chuàng)新地結(jié)合了相控陣天線陣列測(cè)角原理,成功定位了有天線罩時(shí)檢測(cè)角所對(duì)應(yīng)的最大波束指向角度,提升了檢測(cè)角誤差的準(zhǔn)確性,將誤差從1°降低到0.1°以下。 另一種思路是獲取天線罩誤差斜率估計(jì),從而對(duì)天線罩誤差進(jìn)行補(bǔ)償。常見的估計(jì)方法有傳統(tǒng)的非線性濾波估計(jì)、多模型算法和機(jī)器學(xué)習(xí)等。傳統(tǒng)的非線性濾波是對(duì)經(jīng)典的線性卡爾曼濾波(Kalman Filter,KF)的非線性變種,常見的有擴(kuò)展卡爾曼濾波(Extended Kalman Filter,EKF)、無(wú)跡卡爾曼濾波(Unscented Kalman Filter,UKF)等。
文獻(xiàn)[6]利用擴(kuò)展卡爾曼濾波方法,結(jié)合彈目相對(duì)運(yùn)動(dòng)和導(dǎo)引頭模型建立非線性濾波器,對(duì)天線罩斜率進(jìn)行估計(jì)并用于補(bǔ)償,顯著改善了導(dǎo)彈的穩(wěn)定性和制導(dǎo)精度。文獻(xiàn)[7]則在此基礎(chǔ)上進(jìn)行了三維模型下的濾波設(shè)計(jì):縱側(cè)向通道聯(lián)合估計(jì)視線角速率和天線罩誤差斜率的擴(kuò)展卡爾曼濾波器,進(jìn)一步提高了天線罩誤差影響下的制導(dǎo)精度。文獻(xiàn)[8]提出了一種基于無(wú)跡卡爾曼濾波的隔離度在線補(bǔ)償方法,首先建立了包含天線罩誤差的雷達(dá)導(dǎo)引頭隔離度模型,運(yùn)用該補(bǔ)償方法,在速度指向誤差和目標(biāo)常值機(jī)動(dòng)輸入下均能估計(jì)出天線罩誤差斜率,從而改善了制導(dǎo)性能,提高了制導(dǎo)精度。
文獻(xiàn)[9]基于擴(kuò)展卡爾曼濾波的方法通過(guò)建立雷達(dá)導(dǎo)引頭的寄生環(huán)模型,實(shí)現(xiàn)實(shí)時(shí)補(bǔ)償,提升導(dǎo)彈的穩(wěn)定性和制導(dǎo)精度,但是該方法也僅適用于能夠精確建模的情況。 利用多模型算法估計(jì)天線罩斜率的思路最早是由Yueh在文獻(xiàn)[10]中提出,其后有許多學(xué)者對(duì)該方法進(jìn)行了進(jìn)一步研究。例如,金鵬飛在文獻(xiàn)[11]中采用模型參考自適應(yīng)算法對(duì)天線罩誤差斜率進(jìn)行在線估計(jì),并針對(duì)算法中的參數(shù)選擇問(wèn)題,提出了改進(jìn)的參數(shù)自適應(yīng)調(diào)節(jié)律,實(shí)現(xiàn)了對(duì)天線罩誤差斜率準(zhǔn)確且快速的估計(jì)。
利用機(jī)器學(xué)習(xí)技術(shù)估計(jì)天線罩誤差,文獻(xiàn)[12]利用歷史數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)了離線補(bǔ)償。文獻(xiàn)[13]提出了一種基于機(jī)器學(xué)習(xí)和修正物理光學(xué)方法的天線罩雷達(dá)截面計(jì)算方法。利用多層感知器(Multilayer Perceptron, MLP)模型估計(jì)了天線隨機(jī)系統(tǒng)的散射機(jī)理,用函數(shù)擬合估計(jì)FSS層的頻率響應(yīng)與入射角、偏振度和頻率的關(guān)系,從而提高了天線罩表面電流計(jì)算的精度,但是該方法完全依賴于歷史模式,缺乏對(duì)實(shí)時(shí)數(shù)據(jù)的適應(yīng)性。 除此之外,考慮到傳統(tǒng)非線性濾波對(duì)模型精確性的高要求和機(jī)器學(xué)習(xí)對(duì)訓(xùn)練集外、實(shí)際情況中不可預(yù)測(cè)噪聲的適應(yīng)性問(wèn)題,近年來(lái),傳統(tǒng)濾波與機(jī)器學(xué)習(xí)相結(jié)合的估計(jì)方法也被廣泛關(guān)注。文獻(xiàn)[14]提出一種基于粒子濾波(Particle Filter, PF)與長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short Term Memory Network,LSTM)融合的在線預(yù)測(cè)方法。粒子濾波方法需要精確的狀態(tài)模型,而精確的轉(zhuǎn)移方程往往難以得到,文獻(xiàn)[14]利用歷史數(shù)據(jù)訓(xùn)練LSTM模型作為PF的狀態(tài)轉(zhuǎn)移方程,從而解決了PF的經(jīng)驗(yàn)方程依賴問(wèn)題,同時(shí)PF還能給出不確定性表達(dá)。研究結(jié)果表明,該方法模型更新簡(jiǎn)單有效,預(yù)測(cè)精度好。
學(xué)習(xí)數(shù)據(jù)構(gòu)建神經(jīng)網(wǎng)絡(luò)模型并配合序貫濾波器進(jìn)行估計(jì),這一方法在很多其他學(xué)科中廣泛應(yīng)用,如文獻(xiàn)[15]融合長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)與卡爾曼濾波,提出了一種混合模型KF-LSTM,其結(jié)果優(yōu)于LSTM模型和KF模型單獨(dú)使用的結(jié)果;文獻(xiàn)[16]中用多層前饋神經(jīng)網(wǎng)絡(luò)(Feedforward Neural Network,F(xiàn)NN)對(duì)測(cè)量建模,再通過(guò)卡爾曼濾波器進(jìn)行估計(jì),其結(jié)果更接近真實(shí)值;文獻(xiàn)[17]提出一種基于高階容積卡爾曼濾波(High Order Cubature Kalman Filter,HCKF)和神經(jīng)網(wǎng)絡(luò)的狀態(tài)估計(jì)算法,利用前饋神經(jīng)網(wǎng)絡(luò)建立狀態(tài)空間模型,然后采用HCKF對(duì)新狀態(tài)進(jìn)行更新,從而實(shí)現(xiàn)對(duì)狀態(tài)值的精確估計(jì)。為了使?fàn)顟B(tài)方程更好地預(yù)測(cè)狀態(tài)變量的走向,文獻(xiàn)[18]利用循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)學(xué)習(xí)歷史數(shù)據(jù),對(duì)狀態(tài)進(jìn)行建模,在此基礎(chǔ)上,利用集合卡爾曼濾波(Ensemble Kalman Filtering)進(jìn)行反演,得到的結(jié)果更為精確,實(shí)現(xiàn)聲速剖面波動(dòng)的追蹤。
綜上所述,只應(yīng)用傳統(tǒng)非線性濾波技術(shù)進(jìn)行估計(jì)的方法(如文獻(xiàn)[6-9]),可以根據(jù)系統(tǒng)觀測(cè)適應(yīng)實(shí)時(shí)情況,但其估計(jì)精度完全依賴于動(dòng)力學(xué)模型的準(zhǔn)確性,僅適用于能夠精確建模的情況。而僅使用離線訓(xùn)練構(gòu)造的神經(jīng)網(wǎng)絡(luò)的估計(jì)方法(如文獻(xiàn)[12-13]),從歷史數(shù)據(jù)中學(xué)習(xí)模式,缺乏對(duì)實(shí)時(shí)數(shù)據(jù)的適應(yīng)性。故本文參考文獻(xiàn)[14-18]的思想,綜合傳統(tǒng)非線性濾波技術(shù)和神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn),提出一種基于神經(jīng)網(wǎng)絡(luò)和無(wú)跡卡爾曼濾波的估計(jì)方法。 本文針對(duì)二維彈目相對(duì)運(yùn)動(dòng)模型中存在狀態(tài)方程部分未知的情況,提出利用神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)歷史數(shù)據(jù)建立狀態(tài)轉(zhuǎn)移方程,再結(jié)合無(wú)跡卡爾曼濾波進(jìn)行狀態(tài)的實(shí)時(shí)更新,從而得到天線罩誤差斜率估計(jì),是一種融合機(jī)器學(xué)習(xí)和傳統(tǒng)非線性濾波方法的天線罩誤差斜率估計(jì)方法。
2 系統(tǒng)建模
導(dǎo)彈制導(dǎo)控制系統(tǒng)的建模主要包括導(dǎo)引頭、比例導(dǎo)引、自動(dòng)駕駛儀、彈體動(dòng)力學(xué)環(huán)節(jié)和彈目相對(duì)運(yùn)動(dòng)五個(gè)部分。如圖1所示,為真實(shí)視線角,為視線角觀測(cè)值,為天線罩誤差斜率,表示比例導(dǎo)引系數(shù),為導(dǎo)彈速度,是制導(dǎo)律產(chǎn)生的控制指令,是彈體俯仰角。其中,是視線角速度中的耦合分量。這個(gè)分量使得彈體姿態(tài)耦合到導(dǎo)引頭中,在制導(dǎo)回路內(nèi)部生成一條寄生回路。指令加速度由理想的變?yōu)?/p>
▲ 圖1 制導(dǎo)控制系統(tǒng)▲ Fig.1 Guidance control system
(1)
式(1)中,姿態(tài)角速度也參與到指令加速度的生成,形成了姿態(tài)角速率反饋回路。誤差斜率為負(fù)時(shí),將導(dǎo)致姿態(tài)角速度正反饋,使姿態(tài)穩(wěn)定回路發(fā)散;而當(dāng)為正時(shí),會(huì)降低導(dǎo)彈有效導(dǎo)航比,導(dǎo)致響應(yīng)緩慢,造成較大的脫靶量。 綜上所述,天線罩誤差的存在破壞了原有的控制結(jié)構(gòu),嚴(yán)重影響了制導(dǎo)控制系統(tǒng)的穩(wěn)定性和制導(dǎo)精度。
2.1 導(dǎo)引頭
雷達(dá)波穿過(guò)天線罩會(huì)發(fā)生折射,此時(shí)根據(jù)導(dǎo)引頭觀測(cè)得到的視在目標(biāo)位置不是真實(shí)的目標(biāo)位置,如圖2所示,在真實(shí)視線和虛假視線之間存在一個(gè)誤差角,記作,即天線罩誤差角。
▲ 圖2 帶天線罩的導(dǎo)引頭示意圖▲ Fig.2 Seeker with radome 對(duì)于不同的視角,由于雷達(dá)波穿過(guò)天線罩罩壁位置的不同,折射情況不同,天線罩誤差也就不同,天線罩誤差一般為視角的函數(shù)。文獻(xiàn)[19]中給出天線罩瞄準(zhǔn)誤差的經(jīng)驗(yàn)公式:
(2)
式中,為天線罩瞄準(zhǔn)誤差的最大幅值,為一個(gè)正常數(shù),為周期。本文中取,,,此時(shí)天線罩誤差隨視角變化曲線如圖3所示。
▲ 圖3 天線罩誤差隨視角變化曲線▲ Fig.3 Radome error curve with angle of view 對(duì)式(2)求導(dǎo),得到天線罩誤差斜率的經(jīng)驗(yàn)公式:
(3)
天線罩誤差影響下二維彈目幾何關(guān)系如圖4所示,真實(shí)視線和參考方向的夾角為真實(shí)彈目視線角,真實(shí)視線與虛假視線的夾角為天線罩誤差角,彈體縱軸和參考方向的夾角為彈體姿態(tài)角,彈體縱軸與導(dǎo)彈速度的夾角為導(dǎo)彈攻角,導(dǎo)彈速度與參考方向的夾角為航跡角,那么視角可以表示為
(4)
▲ 圖4 天線罩誤差影響下彈目幾何關(guān)系▲ Fig.4 Geometric relations of projectiles affected by radome Errors 相應(yīng)地,實(shí)際測(cè)量的彈目視線角可以表示為
(5)
式(2)中,天線罩誤差是視角的非線性函數(shù),對(duì)天線罩誤差在視角為0處作泰勒展開,當(dāng)視角在較小范圍內(nèi)變化時(shí),利用中值定理余項(xiàng),實(shí)測(cè)彈目視線角可進(jìn)一步表示為
(6)
2.2 彈目相對(duì)運(yùn)動(dòng)
本文針對(duì)固定目標(biāo)制導(dǎo)過(guò)程中的天線罩誤差估計(jì)問(wèn)題進(jìn)行研究,假設(shè)目標(biāo)靜止,建立二維目標(biāo)接近運(yùn)動(dòng)關(guān)系。如圖5所示,為彈體坐標(biāo)系,,分別為導(dǎo)彈機(jī)動(dòng)加速度和導(dǎo)彈速度,導(dǎo)彈速度與參考方向的夾角為航跡角,為真實(shí)彈目視線角,R為彈目距離。
▲ 圖5 彈目相對(duì)運(yùn)動(dòng)示意圖▲ Fig.5 Projectile relative motion 假設(shè)目標(biāo)的速度是常數(shù),導(dǎo)彈和目標(biāo)之間的相對(duì)運(yùn)動(dòng)建模如式(7)和式(8),相應(yīng)的Simulink仿真模型如圖6所示。
(7)
(8)
▲ 圖6 彈目相對(duì)運(yùn)動(dòng)仿真模型▲ Fig.6 Simulation model of projectile relative motion
2.3 導(dǎo)引控制
比例導(dǎo)引律(是應(yīng)用最為廣泛的導(dǎo)引方法之一,其基本思想是使導(dǎo)彈速度向量的轉(zhuǎn)動(dòng)角速度正比于目標(biāo)視線的轉(zhuǎn)動(dòng)角速度,它能使導(dǎo)彈在目標(biāo)機(jī)動(dòng)時(shí)也能很好地實(shí)施攻擊。 根據(jù)PNG制導(dǎo)律,利用量測(cè)得到的彈目視線角得到控制指令:
(9)
式中,表示比例導(dǎo)引系數(shù),為彈目接近速度,根據(jù)式(6),可以推算得到視線角速度:
(10)
代入式(7)得
(11)
2.4 自動(dòng)駕駛儀
假設(shè)自動(dòng)駕駛儀為一階延時(shí)環(huán)節(jié),時(shí)間常數(shù)為,則環(huán)節(jié)傳遞函數(shù)為。輸入為制導(dǎo)控制模塊輸出的制導(dǎo)指令,輸出為實(shí)際控制指令。
2.5 彈體動(dòng)力學(xué)模型
彈體動(dòng)力學(xué)模型即機(jī)動(dòng)控制對(duì)彈體運(yùn)動(dòng)學(xué)物理量的作用方程。這里推導(dǎo)從控制指令到導(dǎo)彈姿態(tài)角(俯仰角)速率的傳遞函數(shù)。 首先,機(jī)動(dòng)加速度正交于導(dǎo)彈速度,可得航跡角速率:
(12)
彈體姿態(tài)角是彈體縱軸和參考方向的夾角,由圖4可知,可以表示為
(13)
導(dǎo)彈機(jī)動(dòng)性參數(shù)中的轉(zhuǎn)彎率時(shí)間常數(shù)的定義如下:
(14)
代入(13)得
(15)
對(duì)式(15)求導(dǎo)得到姿態(tài)角速率:
(16)
對(duì)式(16)進(jìn)行拉普拉斯變換最終得到彈體動(dòng)力學(xué)模型:
(17)
2.6 完整的系統(tǒng)建模
考慮比例導(dǎo)引的帶誤差雷達(dá)尋的制導(dǎo)系統(tǒng)建模如圖7所示,包括視線角量測(cè)、導(dǎo)引控制、自動(dòng)駕駛儀模塊和彈目相對(duì)運(yùn)動(dòng)、機(jī)體動(dòng)力學(xué)等模塊,至此仿真模型建立完畢。
▲ 圖7 考慮比例導(dǎo)引的帶誤差雷達(dá)尋的制導(dǎo)系統(tǒng)▲ Fig.7 Radar homing guidance system with error considering proportional guidance 將導(dǎo)彈速度和比例導(dǎo)引系數(shù)設(shè)為常數(shù),取真實(shí)視線角、視角和天線罩誤差斜率作為3個(gè)狀態(tài)變量,以視線角觀測(cè)值為觀測(cè)量,分別建立系統(tǒng)的狀態(tài)模型和觀測(cè)模型。本節(jié)先根據(jù)幾何關(guān)系建立觀測(cè)模型,隨后將利用神經(jīng)網(wǎng)絡(luò)建立狀態(tài)轉(zhuǎn)移模型。 令,根據(jù)式(4)和式(6),觀測(cè)方程可寫成:
(18)
3 基于神經(jīng)網(wǎng)絡(luò)和無(wú)跡卡爾曼濾波融合的天線罩誤差斜率估計(jì)方法
3.1 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)
神經(jīng)網(wǎng)絡(luò),也稱為人工神經(jīng)網(wǎng)絡(luò) (Artificial Neural Networks,ANN),是一種模仿動(dòng)物神經(jīng)網(wǎng)絡(luò)行為特征,進(jìn)行分布式并行信息處理的算法數(shù)學(xué)模型。其模型結(jié)構(gòu)大體可以分為前饋型網(wǎng)絡(luò)和反饋型網(wǎng)絡(luò)(也稱為Hopfield網(wǎng)絡(luò))兩大類。本文采用多層前饋神經(jīng)網(wǎng)絡(luò)擬合狀態(tài)預(yù)測(cè)方程。 前饋神經(jīng)網(wǎng)絡(luò)[20](Feedforward Neural Network,F(xiàn)NN),簡(jiǎn)稱前饋網(wǎng)絡(luò),是一種最簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò),在各行各業(yè)中應(yīng)用廣泛。 前饋神經(jīng)網(wǎng)絡(luò)采用一種單向多層結(jié)構(gòu),其中每一層包含若干個(gè)神經(jīng)元,各神經(jīng)元可以接收前一層神經(jīng)元的信號(hào),并產(chǎn)生輸出到下一層。其中,第0層為輸入層,最后一層為輸出層,其他中間層叫做隱藏層(或隱含層),隱藏層可以是一層,也可以是多層。 前饋神經(jīng)網(wǎng)絡(luò)中無(wú)反饋,信號(hào)從輸入層向輸出層單向傳播。一個(gè)典型的多層前饋神經(jīng)網(wǎng)絡(luò)如圖8所示,該神經(jīng)網(wǎng)絡(luò)模型共有4層,分別為輸入層、2層隱藏層和輸出層,各個(gè)層之間通過(guò)權(quán)系數(shù)進(jìn)行連接,輸入輸出層在兩端,中間隱藏層的節(jié)點(diǎn)數(shù)根據(jù)實(shí)際情況進(jìn)行選取。
▲ 圖8 前饋神經(jīng)網(wǎng)絡(luò)▲ Fig.8 Feedforward neural network 與傳統(tǒng)的解析建模相比,神經(jīng)網(wǎng)絡(luò)模型可以更好地利用數(shù)據(jù),直接學(xué)習(xí)到映射關(guān)系,而不需要進(jìn)行復(fù)雜的分析和推導(dǎo),避免了人工推導(dǎo)可能出現(xiàn)的錯(cuò)誤。另外,對(duì)于模型過(guò)于復(fù)雜或者模式未知的系統(tǒng),神經(jīng)網(wǎng)絡(luò)也可以進(jìn)行擬合。 因此,本文使用基于前饋神經(jīng)網(wǎng)絡(luò)的狀態(tài)預(yù)測(cè)網(wǎng)絡(luò)模型,輸入為一段時(shí)間內(nèi)狀態(tài)序列,輸出為整體后移一個(gè)時(shí)刻的狀態(tài)序列。 網(wǎng)絡(luò)模型結(jié)構(gòu)如圖9所示,網(wǎng)絡(luò)主體由2層節(jié)點(diǎn)數(shù)為16的Dense層構(gòu)成,輸出層為節(jié)點(diǎn)數(shù)為3的全連接層。網(wǎng)絡(luò)訓(xùn)練指標(biāo)為均方誤差(最?。?,優(yōu)化器為Adam優(yōu)化器。
▲ 圖9 網(wǎng)絡(luò)模型▲ Fig.9 Network framework
3.2 無(wú)跡卡爾曼濾波
無(wú)跡卡爾曼濾波的核心是無(wú)跡變換(Unscented Transform,UT),其主要思想是先產(chǎn)生一組一、二階矩與狀態(tài)變量的信息相同的Sigma點(diǎn),然后對(duì)每個(gè)Sigma點(diǎn)進(jìn)行非線性函數(shù)變換,最后用變換后的Sigma點(diǎn)集來(lái)確定輸出值的矩。UKF算法的預(yù)測(cè)步計(jì)算均是非線性的,可以避免線性化過(guò)程中產(chǎn)生的誤差,提高估算的準(zhǔn)確性。 UKF的具體流程為 (1)初始化狀態(tài)的初始均值和協(xié)方差。 (2)計(jì)算對(duì)應(yīng)的Sigma點(diǎn)集:
(19)
式中,n為狀態(tài)變量個(gè)數(shù),這里為3;σ為一個(gè)與n有關(guān)的系數(shù)。 (3)計(jì)算加權(quán)系數(shù):
(20)
?。?)預(yù)測(cè)步:
(21)
(22)
(23)
式中,是過(guò)程噪聲協(xié)方差。 (5)觀測(cè):
(24)
(25)
(26)
式中,為測(cè)量噪聲協(xié)方差。 (6)卡爾曼增益:
(27)
(7)更新結(jié)果:
(28)
(29)
3.3 基于神經(jīng)網(wǎng)絡(luò)和無(wú)跡卡爾曼濾波融合的估計(jì)方法
在本文研究的天線罩模型中,存在狀態(tài)方程部分未知的情況,這里利用神經(jīng)網(wǎng)絡(luò)基于歷史數(shù)據(jù)學(xué)習(xí)到完整狀態(tài)方程,再應(yīng)用無(wú)跡卡爾曼濾波,結(jié)合實(shí)時(shí)觀測(cè)得到狀態(tài)估計(jì)。該估計(jì)方法的流程示意圖如圖10所示,用預(yù)先訓(xùn)練好權(quán)重的前饋神經(jīng)網(wǎng)絡(luò)作為無(wú)跡卡爾曼濾波的預(yù)測(cè)方程f。
▲ 圖10 基于神經(jīng)網(wǎng)絡(luò)和無(wú)跡卡爾曼濾波融合的估計(jì)方法流程▲ Fig.10 Method based on neural network and unscented Kalman filter UT變換得到Sigma點(diǎn)集后,計(jì)算預(yù)測(cè)步如下:
(30)
結(jié)合加權(quán)系數(shù)得到預(yù)測(cè)步的均值和方差。隨后的觀測(cè)更新步與3.2節(jié)相關(guān)內(nèi)容相同,用導(dǎo)引頭觀測(cè)值更新狀態(tài)估計(jì),從而得到t時(shí)刻最終的估計(jì)結(jié)果:
(31)
(32)
然后利用這個(gè)估計(jì)結(jié)果進(jìn)行下一時(shí)刻的狀態(tài)預(yù)測(cè),迭代計(jì)算得到完整的狀態(tài)估計(jì)序列。
4 仿真結(jié)果及分析
因?yàn)楸疚慕鉀Q的實(shí)際問(wèn)題存在狀態(tài)方程部分未知的情況,只使用傳統(tǒng)非線性濾波技術(shù)無(wú)法完成估計(jì),這里僅與完全依賴歷史數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)估計(jì)方法設(shè)計(jì)對(duì)比實(shí)驗(yàn)。 考慮到卡爾曼濾波及其變種都是基于馬爾可夫模型,且兼顧實(shí)際模型本身的時(shí)序特性,僅利用神經(jīng)網(wǎng)絡(luò)技術(shù)和本文提出的估計(jì)方法都采用時(shí)序的輸入輸出進(jìn)行網(wǎng)絡(luò)訓(xùn)練。
▲ 圖11 神經(jīng)網(wǎng)絡(luò)序列訓(xùn)練與測(cè)試示意▲ Fig.11 Training and testing of FNN 具體地,僅用神經(jīng)網(wǎng)絡(luò)的估計(jì)方法的訓(xùn)練集輸入為當(dāng)前觀測(cè),輸出為狀態(tài)變量。而本文方法采用的訓(xùn)練集,以輸入為、輸出為為例,時(shí)間上向后預(yù)測(cè)一步。 本文取序列長(zhǎng)度為2生成訓(xùn)練集訓(xùn)練模型,然后用較長(zhǎng)的完整序列進(jìn)行測(cè)試。 設(shè)計(jì)64組狀態(tài)初值正態(tài)分布的訓(xùn)練集,狀態(tài)初值如表1所示。
▼ 表1 訓(xùn)練集初值設(shè)定▼ Table 1 Initial value of training set
設(shè)采樣時(shí)間為0.1 s,運(yùn)行30 s,生成長(zhǎng)度為300的序列,分別將上述長(zhǎng)序列分割為298個(gè)長(zhǎng)度為2的短序列,并打亂小序列間順序。按不同初值情況,重復(fù)以上步驟64次,并再次打亂,生成包含19072條短序列的數(shù)據(jù)集。設(shè)驗(yàn)證集比例為10%,測(cè)試集比例為10%,最終隨機(jī)取1908條序列為驗(yàn)證集,1907條序列為測(cè)試集,剩余80%的15257條短序列為訓(xùn)練集。對(duì)訓(xùn)練數(shù)據(jù)的各維度分別進(jìn)行最大最小值歸一化,即:
(33)
測(cè)試序列的初值如表2所示,長(zhǎng)度為300。
▼ 表2 測(cè)試序列初值設(shè)定▼ Table 2 Initial value of test sequence
僅用神經(jīng)網(wǎng)絡(luò)估計(jì)的狀態(tài)曲線如圖12所示,其中,圖12(a)為狀態(tài)的估計(jì)值和實(shí)際值對(duì)比,粗實(shí)線表示神經(jīng)網(wǎng)絡(luò)方法估計(jì)所得,細(xì)實(shí)線表示實(shí)際狀態(tài),可見估計(jì)的狀態(tài)與實(shí)際狀態(tài)偏差較大;圖12(b)為3個(gè)狀態(tài)估計(jì)值和實(shí)際值的誤差曲線。
▲ 圖12 僅用神經(jīng)網(wǎng)絡(luò)的狀態(tài)測(cè)試結(jié)果▲ Fig.12 State testing results of neural network 經(jīng)神經(jīng)網(wǎng)絡(luò)和無(wú)跡卡爾曼濾波融合的估計(jì)方法得到的狀態(tài)曲線如圖13所示,其中,圖13(a)為狀態(tài)的估計(jì)值和實(shí)際值對(duì)比,粗線表示本文方法估計(jì)所得,細(xì)線表示實(shí)際狀態(tài),可見估計(jì)的狀態(tài)與實(shí)際狀態(tài)較為接近;圖13(b)為3個(gè)狀態(tài)估計(jì)值和實(shí)際值的誤差曲線。
▲ 圖13 本文方法狀態(tài)測(cè)試結(jié)果▲ Fig.13 State testing results of the method 對(duì)比可見,本文提出的結(jié)合使用傳統(tǒng)非線性濾波技術(shù)和神經(jīng)網(wǎng)絡(luò)的方法,估計(jì)準(zhǔn)確度更高。 分別取多組隨機(jī)初值重復(fù)實(shí)驗(yàn),僅采用神經(jīng)網(wǎng)絡(luò)的估計(jì)方法和本文方法的估計(jì)誤差(這里用均方根誤差RMSE表示)分別如表3和表4所示,其中單純采用神經(jīng)網(wǎng)絡(luò)的方法得到的天線罩誤差斜率估計(jì)平均RMSE為,本文天線罩誤差斜率估計(jì)的平均RMSE更低,為。
▼ 表3 神經(jīng)網(wǎng)絡(luò)實(shí)驗(yàn)結(jié)果▼ Table 3 Experimental results of the neural network
▼ 表4 本文方法實(shí)驗(yàn)結(jié)果▼ Table 4 Experimental results of the method
5 結(jié) 論
針對(duì)導(dǎo)引頭天線罩誤差問(wèn)題,本文首先介紹了該誤差對(duì)制導(dǎo)系統(tǒng)的穩(wěn)定性和精度造成的負(fù)面影響,然后以估計(jì)天線罩誤差斜率為目標(biāo),提出了一種融合神經(jīng)網(wǎng)絡(luò)和無(wú)跡卡爾曼濾波的天線罩誤差斜率估計(jì)方法。分別以真實(shí)視線角、視角和天線罩誤差斜率為狀態(tài)變量,視線角為觀測(cè)變量,建立非線性濾波模型,其中,預(yù)測(cè)函數(shù)用預(yù)先訓(xùn)練完成的多層前饋神經(jīng)網(wǎng)絡(luò)代替,迭代過(guò)程中利用觀測(cè)實(shí)時(shí)更新狀態(tài),從而獲得精度較高的狀態(tài)估計(jì)。本方法無(wú)參數(shù)選擇需求,易于工程實(shí)現(xiàn),且對(duì)現(xiàn)實(shí)數(shù)據(jù)具有更好的適應(yīng)性。經(jīng)多次仿真實(shí)驗(yàn),證實(shí)該方法能夠有效控制預(yù)測(cè)誤差,具有較高精度。
編輯:黃飛
?
評(píng)論
查看更多