System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于機器人,具體涉及一種改進強化學習自適應融合的智能車輛路徑控制方法。
技術介紹
1、近年來,自動駕駛汽車(av)受到了極大關注,為提高道路安全、交通效率和燃油經濟性提供了一個前景廣闊的解決方案。因此,集定位、傳感、路徑規劃和路徑跟蹤于一體的自動駕駛技術在av中得到了廣泛應用。作為無需人工干預即可獨立完成任務的關鍵技術,路徑跟蹤在自動駕駛汽車中發揮著重要作用。這意味著,實現高精度路徑跟蹤對于確保智能交通系統的安全性至關重要。然而,現實世界往往是復雜、動態和不可預測的,這對現有方法實現魯棒性和精確跟蹤提出了挑戰。
2、作為一個經典的非線性系統,相關研究廣泛探討了解決與av相關的驅動不足問題的路徑跟蹤技術。為了提高路徑跟蹤性能,人們開發了多種控制方法。例如,pp因其簡單性在自主轉向控制中很受歡。然而,pp難以找到最佳前視距離。為解決這一難題,人們開發了其他基于模型的控制器,如lqr、smc和mpc方法,以實現精確跟蹤。然而,lqr并不考慮物理約束,這限制了其實際應用。為解決這一問題,線性mpc被用于通過在線優化進行av跟蹤。然而,線性模型在很大程度上依賴于精確建模,這在實際應用中很難實現。幸運的是,由于其輸入輸出非線性特,非線性mpc被廣泛應用于大曲率場景下的自動駕駛汽車路徑跟蹤。對mpc和nmpc的綜合分析表明,nmpc在定位誤差達到厘米級的情況下表現出優勢。盡管nmpc對非線性系統表現出更強的適應性,但它的實時性能依然較差。針對這一問題,研究人員采用遺傳算法對nmpc進行實時優化,增強了其解算時間能力。研究
3、為了在不同場景和狀態下實現精確跟蹤,組合方法是一種有效的解決方案。例如,研究人員以互補的方式將pp和pid結合起來。研究人員提出了一種集成mpc與混合pid和lqr的控制器,用于多模式跟蹤控制。然而,它只關注了路徑曲率,而沒有考慮不同跟蹤誤差的影響。為解決這一問題,研究人員將pp和mpc方法進行了整合,并在動態誤差條件下進行了測試。然而,如何適當調整不同算法的權重以適應動態場景仍是一項挑戰。這意味著跟蹤方法應根據場景和狀態進行優化,以有效執行。因此,一些研究人員研究了基于rl的組合方法,以提高在動態場景和狀態下的靈活性,同時保持跟蹤性能。例如,研究人員提出了一種將基線控制與rl結合起來的方法,但它沒有考慮不同的權重。隨后,研究人員提出了一種人機合作控制系統,將td3與最優預覽驅動模型和mpc相結合。不過,該論文部分依賴于從人類身上獲得的轉向角,因此需要大量的經驗數據集。此外,該論文使用的td3算法對超參數的選擇非常敏感。因此,研究人員提出了一種基于ppo的自適應權重調整方法,通過調整pid和pp之間的權重來平衡平滑性和準確性。然而,作為一種無模型算法,ppo在模型不確定的情況下根據單一狀態信息做出決策,這可能會增加復雜場景下的跟蹤風險。
4、雖然這些研究在一定程度上獲得了應用,但對于近端策略優化控制仍然存在著一定的挑戰,即收斂速度較慢,所需數據較多。特別是對于智能車輛自動控制,其路徑追蹤性能主要取決于轉向的實時控制,傳統的近端策略優化路徑追蹤方法在實際工程中動態性差,進而影響追蹤精度。因此,需要通過改進近端策略優化算法來提高路徑追蹤的實時性。
技術實現思路
1、為解決上述問題,本專利技術公開了一種改進強化學習自適應融合的智能車輛路徑控制方法,通過綜合自然對數與非線性模型預測控制,提高路徑追蹤精度并增強智能車輛在動態場景中的適應能力,減小跟蹤誤差的影響,提高強化學習的收斂速度,提升智能車輛跟蹤的實時性和穩定性。
2、為達到上述目的,本專利技術的技術方案如下:
3、一種改進強化學習自適應融合的智能車輛路徑控制方法,具體步驟如下:
4、步驟1、建立智能車輛的誤差模型:
5、
6、其中xe表述縱向誤差,ye表示橫向誤差,ψe表示車輛航向角誤差,l表示車輛軸距,v表示車輛速度,δ表示車輛前輪轉向角;
7、步驟2、設計智能車輛的快速自然對數滑模控制器,包括如下步驟:
8、(2.1)建立車輛的快速自然對數滑模面:
9、
10、其中ζ0、ζ1和ζ2都是正數,ln(·)表示自然對數函數。
11、(2.2)建立快速收斂的滑模面趨近律:
12、
13、其中c1、c2都是正數,且滿足0≤c1≤1、c2≥1。
14、(2.3)根據滑模面與趨近律,計算車輛滑模控制器轉向角:
15、
16、
17、步驟3、設計智能車輛的非線性模型預測控制器,包括如下步驟:
18、(3.1)建立非線性模型預測的預測模型:
19、
20、其中yte表示擬合曲線的橫向誤差,b為多項式曲線的二次項系數,z(t)=k/(1+k2),k為參考點的斜率。
21、(3.2)建立非線性模型預測的轉向約束:
22、δmin≤δ(k+n∣k)≤δmax?n=1,2…n?(7)
23、δδmin≤δδ(k+n∣k)≤δδmax?(8)
24、(3.3)建立非線性模型預測的目標函數
25、
26、(3.4)建立非線性模型預測的轉向角:
27、δ2(t)=δ2(t-1)+δδ2(t)?(10)
28、步驟4:建立智能車輛的近端策略優化融合控制器:
29、
30、其中δ1表示快速滑模控制的輸出轉向角,δ2表示非線性模型預測控制的輸出轉向角。
31、步驟5、利用近端策略優化算法快速求解步驟4中和的最優解,預測智能車輛未來時刻的最佳狀態,計算當前時刻最優參數
32、步驟6、將本文檔來自技高網...
【技術保護點】
1.一種改進強化學習自適應融合的智能車輛路徑控制方法,其特征在于:具體步驟如下:
2.根據權利要求1所述的一種改進強化學習自適應融合的智能車輛路徑控制方法,其特征在于,所述智能車輛為無人車。
3.根據權利要求1所述的一種改進強化學習自適應融合的智能車輛路徑控制方法,其特征在于,所述步驟5包括:
4.根據權利要求1所述的一種改進強化學習自適應融合的智能車輛路徑控制方法,其特征在于,所述步驟6包括:將近端策略優化算法得到的最優參數帶入融合控制算法,計算智能車輛當前時刻控制量:
【技術特征摘要】
1.一種改進強化學習自適應融合的智能車輛路徑控制方法,其特征在于:具體步驟如下:
2.根據權利要求1所述的一種改進強化學習自適應融合的智能車輛路徑控制方法,其特征在于,所述智能車輛為無人車。
3.根據權利要求1所述的一種改進強化學習...
【專利技術屬性】
技術研發人員:潘樹國,陳宗良,吳俁婷,高旺,陶賢露,趙慶,
申請(專利權)人:東南大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。