System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于飛機結構領域,具體而言,涉及一種基于強化學習的飛機機翼梁截面多目標優化設計方法。
技術介紹
1、飛機結構設計是航空領域的核心技術之一,而梁是飛機的主承力結構,其中懸臂梁結構廣泛應用于飛機機翼上,其設計質量關系到飛機的性能、安全和經濟效益等諸多方面。在梁結構設計中,梁截面的設計十分關鍵,它關系到梁的力學性能和重量。
2、傳統的飛機結構設計方法主要基于經驗和試錯的方法,這種方法耗時且費力,設計效率低下,很難保證設計結果最優。傳統優化算法也存在遷移性差、對不同設計需求需要重新迭代優化的缺點。而飛機設計是一個需要綜合各學科多種需求并反復迭代優化的過程,這將使得傳統優化所需的時間達到項目難以接受的程度,因此亟須一種結構快速設計方法。
3、近年來,強化學習作為一種新的智能算法,因其可以在不確定性的環境中自主學習和優化,在機器學習領域得到了廣泛的應用,強化學習通過試錯學習和反饋機制,不斷改進設計,可以有效提高設計效率和設計質量。
技術實現思路
1、針對以上缺陷,本專利技術提供了一種基于強化學習的飛機機翼梁截面多目標優化設計方法,包括空間定義、梁結構虛擬環境搭建和智能優化設計,具體包括以下步驟:
2、s1、根據梁截面的參數構成一個狀態向量,完成狀態空間的定義;
3、s2、根據狀態空間中的構成參數定義具體動作,完成動作空間的定義;
4、s3、根據設定的梁截面評價指標來設定設計評價值函數;
5、s4、基于狀態空間的定
6、s5、創建一個理解狀態和動作之間關系的梁結構智能設計體,用于在虛擬環境中學習和優化;
7、s6、對梁結構智能設計體進行訓練,用于預測不同狀態和動作結果;
8、s7、使用訓練后的梁結構智能設計體在虛擬環境中進行優化設計,生成新的設計方案;
9、s8、對步驟s7生成的設計方案根據實際情況進行評估,檢驗是否可行。
10、進一步地,所述步驟s1中的參數包括但不限于梁截面的寬度、高度、緣條厚度、腹板厚度、形狀和長度。
11、進一步地,所述步驟s3中的設計評價值函數如下:
12、;
13、上述式中, r為設計評價值函數, σ為結構最大應力, σ s為材料屈服強度,c為一個固定的懲罰值, a為截面面積,k為大于0的固定系數,當設計值超越了設計邊界值,便不對設計進行評價,直接給予一個固定的懲罰值c即可。
14、進一步地,根據所述步驟s3中設計評價值函數分別計算出設計更改前后的評價值 r和 r_,并計算當前動作的獎勵值 reward:
15、;
16、將更新后的狀態 s_和獎勵值 reward反饋給梁結構智能設計體。
17、進一步地,所述步驟s5具體包括以下步驟:
18、s5.1、建立所有狀態 s下每個設計動作 a的設計動作評價值表;
19、s5.2、建立動作選擇函數:
20、通過隨機方法選擇評價值最高的設計動作或一個隨機設計動作;
21、s5.3、建立根據當前設計狀態 s、設計動作 a、新設計狀態 s_及獎勵值 reward的設計動作評價值表更新方法:
22、;
23、上述式中,為減縮因子, lr為學習率。
24、進一步地,所述步驟s6具體包括以下步驟:
25、s6.1、設定步驟s1中梁截面的最大寬度、最大高度、最大緣條厚度、最大腹板厚度以及梁長度、材料屈服強度以及加載條件,并設置訓練次數和單次訓練步數;
26、s6.2、在每次訓練開始時,隨機生成初始的設計狀態;
27、s6.3、使用梁結構智能設計體生成當前設計狀態下的設計動作;
28、s6.4、將當前設計狀態以及做出的設計動作傳遞到步驟s4中搭建的梁虛擬環境,獲得更新后的新設計狀態以及對新設計狀態的評價值;
29、s6.5、根據步驟s5.3中的設計動作評價值表更新方法更新設計動作評價值表;
30、s6.6、將更新后的設計狀態設為當前設計狀態;
31、s6.7、重復步驟s6.3-步驟s6.6步驟直至達到設定的單次訓練步數;
32、s6.8、重復步驟s6.2-步驟s6.7步驟進行訓練,直至達到設定的訓練次數;
33、s6.9、保存設計動作評價值表。
34、進一步地,所述步驟s7具體包括以下步驟:
35、s7.1、載入步驟s6.9中訓練完成后的設計動作評價值表,設定設計嘗試次數和每次設計嘗試中的設計步數;
36、s7.2、隨機生成初始設計狀態;
37、s7.3、使用梁結構智能設計體生成設計更改動作;
38、s7.4、將當前設計狀態以及做出的設計動作傳遞到梁虛擬環境,獲得更新后的設計狀態以及對新設計狀態的評價值;
39、s7.5、將更新后的狀態設為當前狀態;
40、s7.6、重復步驟s7.3-步驟s7.5直到達到單次設計步數;
41、s7.7、重復步驟s7.2-步驟s7.6進行訓練,直至達到設定的設計嘗試次數;
42、s7.8、輸出評價值最高的設計。
43、本專利技術與現有技術相比具有以下有益效果:
44、通過采用強化學習的飛機機翼梁結構多目標優化設計方法,可以實現多目標優化,并且可以儲存設計經驗,今后可在此基礎上進一步拓寬設計空間,提高設計效率。此外,本專利技術通過簡單改進可以用于其他類型梁結構的設計,具有廣泛的應用價值。
本文檔來自技高網...【技術保護點】
1.一種基于強化學習的飛機機翼梁截面多目標優化設計方法,其特征在于:包括空間定義、梁結構虛擬環境搭建和智能優化設計,具體包括以下步驟:
2.如權利要求1所述的一種基于強化學習的飛機機翼梁截面多目標優化設計方法,其特征在于:所述步驟S1中的參數包括但不限于梁截面的寬度、高度、緣條厚度、腹板厚度、形狀和長度。
3.如權利要求1所述的一種基于強化學習的飛機機翼梁截面多目標優化設計方法,其特征在于:所述步驟S3中的設計評價值函數如下:
4.如權利要求3所述的一種基于強化學習的飛機機翼梁截面多目標優化設計方法,其特征在于:根據所述步驟S3中設計評價值函數分別計算出設計更改前后的評價值r和r_,并計算當前動作的獎勵值reward:
5.如權利要求1所述的一種基于強化學習的飛機機翼梁截面多目標優化設計方法,其特征在于:所述步驟S5具體包括以下步驟:
6.如權利要求5所述的一種基于強化學習的飛機機翼梁截面多目標優化設計方法,其特征在于:所述步驟S6具體包括以下步驟:
7.如權利要求1所述的一種基于強化學習的飛機機翼梁截面多目
...【技術特征摘要】
1.一種基于強化學習的飛機機翼梁截面多目標優化設計方法,其特征在于:包括空間定義、梁結構虛擬環境搭建和智能優化設計,具體包括以下步驟:
2.如權利要求1所述的一種基于強化學習的飛機機翼梁截面多目標優化設計方法,其特征在于:所述步驟s1中的參數包括但不限于梁截面的寬度、高度、緣條厚度、腹板厚度、形狀和長度。
3.如權利要求1所述的一種基于強化學習的飛機機翼梁截面多目標優化設計方法,其特征在于:所述步驟s3中的設計評價值函數如下:
4.如權利要求3所述的一種基于強化學習的飛機機翼梁截面多目...
【專利技術屬性】
技術研發人員:丁夢龍,孟莉,馮傳宴,宣金婷,汪雯,李海,任子杰,李道春,周堯明,屠展,
申請(專利權)人:天目山實驗室,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。