System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及航空發動機智能控制領域,尤其涉及一種基于航空發動機燃油計量閥容錯控制方法。
技術介紹
1、航空發動機燃油計量閥發生卡澀故障時,將導致燃油流量響應時滯時間增大,使控制系統的動態性能惡化出現超調甚至振蕩等現象,且這一類時滯故障難以通過控制器自身魯棒性消除影響。經典控制理論下的容錯控制方法需要依賴于精確的控制系統數學模型并針對具體的故障模式進行相應的調整,而航空發動機具有強非線性的特點,建立精確的數學模型相當困難,并且由于時滯故障的影響,使控制系統的復雜程度大大增加,時延環節對系統動態性能的復雜影響難以通過數學模型準確地進行描述。
技術實現思路
1、有鑒于此,本專利技術的目的在于提出一種基于ddpg的航空發動機燃油計量閥容錯控制方法,能夠實現燃油計量閥故障時的航空發動機被動容錯控制。
2、根據本專利技術的一個方面,提供一種基于ddpg的航空發動機燃油計量閥容錯控制方法,包括:燃油計量閥卡澀故障模式下,將渦扇發動機輸入輸出數據輸入一訓練完成的ddpg神經網絡模型,基于ddpg神經網絡模型輸出發動機控制策略;
3、所述ddpg神經網絡模型訓練方法包括如下步驟:
4、擇一仿真渦扇發動機模型作為被控對象;
5、模擬燃油計量閥卡澀故障模式,且當在該模式下時向渦扇發動機模型隨機注入故障;
6、隨機初始化燃油指令,利用燃油指令控制仿真渦扇發動機模型運行,運行時實時采集發動機輸入輸出數據,運行過程中隨機注入故障;
7、
8、在上述技術方案中,以t-mats仿真平臺中的某型渦扇航空發動機作為被控對象,針對燃油計量閥卡澀故障模式下的航空發動機容錯控制問題,提出了基于ddpg算法的航空發動機智能被動容錯控制方法。首先基于t-mats平臺的高逼真度發動機模型設計故障注入模塊模擬發動機發生燃油計量閥卡澀故障時的工作狀態,并作為強化學習模型的訓練平臺和環境。然后構建航空發動機強化學習控制模型,將燃油計量閥故障時的容錯控制問題轉換成強化學習模型中的求解最優控制策略問題。
9、并基于ddpg算法設計智能被動容錯控制器,設計控制器的動作網絡和評價網絡,使其與隨機發生故障的發動機模型進行數據交互,完成網絡參數的自整定,通過非線性擬合得到包含有故障和無故障情況下航空發動機的最優控制策略。通過設置仿真實驗驗證了智能被動容錯控制器的有效性,控制器可以在故障發生時根據發動機狀態數據自適應調節控制輸出;通過設置對比實驗證明智能被動容錯控制器在有故障和無故障的情況下各項性能指標都優于傳統pi控制器。
10、在一些實施例中,所述輸入輸出數據包括:低壓轉子轉速、高壓轉子轉速、燃油流量、壓氣機可調定子葉片角度、發動機排氣總溫、發動機氣路總壓、發動機喘振裕度。
11、在上述技術方案中,根據t-mats依據發動機的工作原理以及常用的經驗公式,通過編程實現部件的熱力學計算流程,搭建起某型渦扇發動機的高逼真度仿真模型。基于該模型搭建了強化學習智能體訓練環境,該模型提供了豐富的輸入輸出參數以及中間狀態變量,智能體可以很方便地通過觀測這些變量來獲取環境的狀態信息。在一些實施例中,在卡澀故障模式下向渦扇發動機模型隨機注入故障,具體地:
12、隨機數發生器產生隨機的時滯時間;
13、基于時滯時間延遲燃油指令到達發動機模型的時間。
14、在上述技術方案中,由于燃油計量閥卡澀故障將導致燃油計量閥的時滯時間增大,設計使用simulink中的時延模塊“transport?delay”對時滯現象進行模擬,實現故障的注入。考慮到卡滯故障的時滯時間具有隨機性的特性,再結合目標中對被動容錯的要求,因此應用隨機數發生器產生隨機的時滯時間,實現對燃油計量閥流量響應時滯時間隨機增大的模擬,更好的驗證故障注入實驗效果。
15、在一些實施例中,所述dpgg神經網絡的損失函數如下:
16、
17、公式中,n為每次從經驗池中批量采樣的訓練樣本數量,使用隨機梯度下降法更新動作估計網絡的參數θπ,通過最小化損失函數使q值最大化,確定性策略的q值函數關于參數θπ的損失梯度可以表示為下式:
18、
19、公式中,n為每次從經驗池中批量采樣的訓練樣本數量,s為對應時刻狀態,動作估計網絡的參數θπ,評價估計網絡參數θq。
20、在上述技術方案中,損失函數用來度量模型的預測結果與真實標簽之間的差異。一個好的模型應該能夠將損失降至最小,即預測結果與實際標簽盡可能接近,從而更準確地完成任務。
21、在一些實施例中,所述dpgg神經網絡的梯度信息如下:
22、
23、其中,目標價值yt由評價目標網絡給出,其中和分別表示動作目標網絡和評價目標網絡的參數,γ為衰減因子,具體表達式如下:
24、
25、公式中,rt為對應時刻獎勵值,s為對應時刻狀態,動作估計網絡的參數θπ,評價估計網絡參數θq。
26、在上述技術方案中,梯度信息為了更好的進行智能體訓練,穩定學習過程。
27、在一些實施例中,所述dpgg神經網絡的更新模式為以軟更新形式從估計網絡中進行復制,其中,ρ為更新率,ρ∈(0,1):
28、
29、公式中,動作估計網絡的參數θπ,評價估計網絡參數θq。
30、在上述技術方案中,ddpg算法為了改善智能控制器學習過程中q值不穩定的問題,借鑒了dqn中凍結參數和經典回放的思路,設計了估計網絡和目標網絡兩個并行的網絡采用不同的更新頻率對各自的參數進行更新,以減弱網絡間的耦合性,使智能體訓練達到更好的效果。
31、在一些實施例中,所述訓練方法包括模型端和智能體端,模型端在matlab/simulink環境下運行,智能體端在python環境下運行;兩者之間通過建立tcp連接以及利用本地磁盤進行數據交互。
32、在上述技術方案中,利用matlab高精度的物理模型以及python豐富的深度強化學習資源庫,使用tcp實現可靠的信號交互傳輸,讀取本地磁盤的數據進行智能體和控制器的訓練能夠保證實驗的高效快速。
33、根據本專利技術的另一個方面,提供一種基于ddpg的航空發動機燃油計量閥容錯控制裝置,基于上述的方法;包括依序連接的:
34、航空發動機模型,用于擇一仿真渦扇發動機模型作為被控對象;
35、故障注入模塊,用于模擬燃油計量閥卡澀故障模式,且當在該模式下時向渦扇發動機模型隨機注入故障;
36、控制模塊,用于利用燃油指令控制仿真渦扇發動機模型運行,運行時實時采集發動機輸入輸出數據,運行過程中隨機注入故障;
37、智能容錯控制器,用于將實時采集輸入輸出數據本文檔來自技高網...
【技術保護點】
1.一種基于DDPG的航空發動機燃油計量閥容錯控制方法,其特征在于,燃油計量閥卡澀故障模式下,將渦扇發動機輸入輸出數據輸入一訓練完成的DDPG神經網絡模型,基于DDPG神經網絡模型輸出發動機控制策略;
2.如權利要求1所述的一種基于DDPG的航空發動機燃油計量閥容錯控制方法,其特征在于,
3.如權利要求1所述的一種基于DDPG的航空發動機燃油計量閥容錯控制方法,其特征在于,
4.如權利要求1所述的一種基于DDPG的航空發動機燃油計量閥容錯控制方法,其特征在于,
5.如權利要求1所述的一種基于DDPG的航空發動機燃油計量閥容錯控制方法,其特征在于,
6.如權利要求1所述的一種基于DDPG的航空發動機燃油計量閥容錯控制方法,其特征在于,
7.如權利要求1所述的一種基于DDPG的航空發動機燃油計量閥容錯控制方法,其特征在于,
8.一種基于DDPG的航空發動機燃油計量閥容錯控制裝置,其特征在于,基于權利要求1-7任一項所述的方法;包括依序連接的:
9.一種基于DDPG的航空發動機燃油計量閥容錯
10.一種計算機可讀存儲介質,存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1至7中任一項所述的方法。
...【技術特征摘要】
1.一種基于ddpg的航空發動機燃油計量閥容錯控制方法,其特征在于,燃油計量閥卡澀故障模式下,將渦扇發動機輸入輸出數據輸入一訓練完成的ddpg神經網絡模型,基于ddpg神經網絡模型輸出發動機控制策略;
2.如權利要求1所述的一種基于ddpg的航空發動機燃油計量閥容錯控制方法,其特征在于,
3.如權利要求1所述的一種基于ddpg的航空發動機燃油計量閥容錯控制方法,其特征在于,
4.如權利要求1所述的一種基于ddpg的航空發動機燃油計量閥容錯控制方法,其特征在于,
5.如權利要求1所述的一種基于ddpg的航空發動機燃油計量閥容錯控制...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。