System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 毛片亚洲AV无码精品国产午夜,亚洲美免无码中文字幕在线,亚洲AV综合色区无码一区
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>
    當前位置: 首頁 > 專利查詢>東南大學專利>正文

    一種改進強化學習自適應融合的智能車輛路徑控制方法技術

    技術編號:44496426 閱讀:4 留言:0更新日期:2025-03-04 18:03
    本發明專利技術公開了一種改進強化學習自適應融合的智能車輛路徑控制方法,包括如下步驟:1、建立用于智能車輛的協同轉向模型,通過快速收斂的自然對數滑模控制與非線性模型預測控制實現協同控制;2、引入注意力機制,利用路徑誤差信息和曲率作為狀態輸入,設計改進的基于近端策略優化強化學習的控制策略,3、利用物理信息優化目標函數,快速獲得近端策略優化的最優解;4、根據改進近端策略優化控制方案與協調控制器控制量獲得智能車輛當前時刻控制量,控制智能車輛行駛。該方法通過綜合自然對數與非線性模型預測控制,提高路徑追蹤精度并增強智能車輛在動態場景中的適應能力,減小跟蹤誤差的影響,提高強化學習的收斂速度,提升智能車輛跟蹤的實時性和穩定性。

    【技術實現步驟摘要】

    本專利技術屬于機器人,具體涉及一種改進強化學習自適應融合的智能車輛路徑控制方法


    技術介紹

    1、近年來,自動駕駛汽車(av)受到了極大關注,為提高道路安全、交通效率和燃油經濟性提供了一個前景廣闊的解決方案。因此,集定位、傳感、路徑規劃和路徑跟蹤于一體的自動駕駛技術在av中得到了廣泛應用。作為無需人工干預即可獨立完成任務的關鍵技術,路徑跟蹤在自動駕駛汽車中發揮著重要作用。這意味著,實現高精度路徑跟蹤對于確保智能交通系統的安全性至關重要。然而,現實世界往往是復雜、動態和不可預測的,這對現有方法實現魯棒性和精確跟蹤提出了挑戰。

    2、作為一個經典的非線性系統,相關研究廣泛探討了解決與av相關的驅動不足問題的路徑跟蹤技術。為了提高路徑跟蹤性能,人們開發了多種控制方法。例如,pp因其簡單性在自主轉向控制中很受歡。然而,pp難以找到最佳前視距離。為解決這一難題,人們開發了其他基于模型的控制器,如lqr、smc和mpc方法,以實現精確跟蹤。然而,lqr并不考慮物理約束,這限制了其實際應用。為解決這一問題,線性mpc被用于通過在線優化進行av跟蹤。然而,線性模型在很大程度上依賴于精確建模,這在實際應用中很難實現。幸運的是,由于其輸入輸出非線性特,非線性mpc被廣泛應用于大曲率場景下的自動駕駛汽車路徑跟蹤。對mpc和nmpc的綜合分析表明,nmpc在定位誤差達到厘米級的情況下表現出優勢。盡管nmpc對非線性系統表現出更強的適應性,但它的實時性能依然較差。針對這一問題,研究人員采用遺傳算法對nmpc進行實時優化,增強了其解算時間能力。研究人員采用acado工具包求解非線性最優控制問題,提高了nmpc的收斂速度。由于求解速率的限制,nmpc的穩定性不足,跟蹤性能一般,尤其是在容易發生轉向不足的彎道場景中。因此,為了實現路徑跟蹤的快速收斂,滑模控制(smc)提供了一種有效的解決方案。由于性能穩定且易于實際應用,滑模控制被廣泛應用于自動駕駛汽車系統。然而,在線性smc(lsm)中,跟蹤誤差只能在無限時間內漸近收斂為零。為了提高收斂速度,引入了終端滑模(tsm)控制,它使用非線性滑動面。然而,tsm的一個主要局限是奇異性問題。此外,顫振仍是tsm/ntsm控制中的一個重大挑戰。幸運的是,研究人員提出了全局自然對數函數(lnsm),改善了系統顫振。然而,由于自然函數的特性,lnsm的收斂速度與lsm相比明顯較慢。由于收斂速度和顫振方面的限制,強化學習(rl)因其能夠與環境互動并根據行動反饋調整未來行為而被廣泛應用于路徑跟蹤控制中。雖然rl在適應動態環境方面表現出了巨大的潛力,但其應用受到了一些挑戰的限制,如依賴大量訓練數據和顯著跟蹤誤差的不穩定性。基于上述分析,不同算法的跟蹤性能各有特點。單個控制器要想有效跟蹤自動駕駛的各種場景和狀態,具有很大的挑戰性。

    3、為了在不同場景和狀態下實現精確跟蹤,組合方法是一種有效的解決方案。例如,研究人員以互補的方式將pp和pid結合起來。研究人員提出了一種集成mpc與混合pid和lqr的控制器,用于多模式跟蹤控制。然而,它只關注了路徑曲率,而沒有考慮不同跟蹤誤差的影響。為解決這一問題,研究人員將pp和mpc方法進行了整合,并在動態誤差條件下進行了測試。然而,如何適當調整不同算法的權重以適應動態場景仍是一項挑戰。這意味著跟蹤方法應根據場景和狀態進行優化,以有效執行。因此,一些研究人員研究了基于rl的組合方法,以提高在動態場景和狀態下的靈活性,同時保持跟蹤性能。例如,研究人員提出了一種將基線控制與rl結合起來的方法,但它沒有考慮不同的權重。隨后,研究人員提出了一種人機合作控制系統,將td3與最優預覽驅動模型和mpc相結合。不過,該論文部分依賴于從人類身上獲得的轉向角,因此需要大量的經驗數據集。此外,該論文使用的td3算法對超參數的選擇非常敏感。因此,研究人員提出了一種基于ppo的自適應權重調整方法,通過調整pid和pp之間的權重來平衡平滑性和準確性。然而,作為一種無模型算法,ppo在模型不確定的情況下根據單一狀態信息做出決策,這可能會增加復雜場景下的跟蹤風險。

    4、雖然這些研究在一定程度上獲得了應用,但對于近端策略優化控制仍然存在著一定的挑戰,即收斂速度較慢,所需數據較多。特別是對于智能車輛自動控制,其路徑追蹤性能主要取決于轉向的實時控制,傳統的近端策略優化路徑追蹤方法在實際工程中動態性差,進而影響追蹤精度。因此,需要通過改進近端策略優化算法來提高路徑追蹤的實時性。


    技術實現思路

    1、為解決上述問題,本專利技術公開了一種改進強化學習自適應融合的智能車輛路徑控制方法,通過綜合自然對數與非線性模型預測控制,提高路徑追蹤精度并增強智能車輛在動態場景中的適應能力,減小跟蹤誤差的影響,提高強化學習的收斂速度,提升智能車輛跟蹤的實時性和穩定性。

    2、為達到上述目的,本專利技術的技術方案如下:

    3、一種改進強化學習自適應融合的智能車輛路徑控制方法,具體步驟如下:

    4、步驟1、建立智能車輛的誤差模型:

    5、

    6、其中xe表述縱向誤差,ye表示橫向誤差,ψe表示車輛航向角誤差,l表示車輛軸距,v表示車輛速度,δ表示車輛前輪轉向角;

    7、步驟2、設計智能車輛的快速自然對數滑模控制器,包括如下步驟:

    8、(2.1)建立車輛的快速自然對數滑模面:

    9、

    10、其中ζ0、ζ1和ζ2都是正數,ln(·)表示自然對數函數。

    11、(2.2)建立快速收斂的滑模面趨近律:

    12、

    13、其中c1、c2都是正數,且滿足0≤c1≤1、c2≥1。

    14、(2.3)根據滑模面與趨近律,計算車輛滑模控制器轉向角:

    15、

    16、

    17、步驟3、設計智能車輛的非線性模型預測控制器,包括如下步驟:

    18、(3.1)建立非線性模型預測的預測模型:

    19、

    20、其中yte表示擬合曲線的橫向誤差,b為多項式曲線的二次項系數,z(t)=k/(1+k2),k為參考點的斜率。

    21、(3.2)建立非線性模型預測的轉向約束:

    22、δmin≤δ(k+n∣k)≤δmax?n=1,2…n?(7)

    23、δδmin≤δδ(k+n∣k)≤δδmax?(8)

    24、(3.3)建立非線性模型預測的目標函數

    25、

    26、(3.4)建立非線性模型預測的轉向角:

    27、δ2(t)=δ2(t-1)+δδ2(t)?(10)

    28、步驟4:建立智能車輛的近端策略優化融合控制器:

    29、

    30、其中δ1表示快速滑模控制的輸出轉向角,δ2表示非線性模型預測控制的輸出轉向角。

    31、步驟5、利用近端策略優化算法快速求解步驟4中和的最優解,預測智能車輛未來時刻的最佳狀態,計算當前時刻最優參數

    32、步驟6、將本文檔來自技高網...

    【技術保護點】

    1.一種改進強化學習自適應融合的智能車輛路徑控制方法,其特征在于:具體步驟如下:

    2.根據權利要求1所述的一種改進強化學習自適應融合的智能車輛路徑控制方法,其特征在于,所述智能車輛為無人車。

    3.根據權利要求1所述的一種改進強化學習自適應融合的智能車輛路徑控制方法,其特征在于,所述步驟5包括:

    4.根據權利要求1所述的一種改進強化學習自適應融合的智能車輛路徑控制方法,其特征在于,所述步驟6包括:將近端策略優化算法得到的最優參數帶入融合控制算法,計算智能車輛當前時刻控制量:

    【技術特征摘要】

    1.一種改進強化學習自適應融合的智能車輛路徑控制方法,其特征在于:具體步驟如下:

    2.根據權利要求1所述的一種改進強化學習自適應融合的智能車輛路徑控制方法,其特征在于,所述智能車輛為無人車。

    3.根據權利要求1所述的一種改進強化學習...

    【專利技術屬性】
    技術研發人員:潘樹國陳宗良吳俁婷高旺陶賢露趙慶
    申請(專利權)人:東南大學
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 无码孕妇孕交在线观看| 无码人妻一区二区三区免费n鬼沢 无码人妻一区二区三区免费看 | 精品无码久久久久久尤物| 无码精品尤物一区二区三区| 国产精品亚洲专区无码WEB| 亚洲av永久无码精品古装片| 亚洲中文字幕无码爆乳| 亚洲va无码专区国产乱码| 67194成是人免费无码| 久久久久亚洲AV无码网站| 精品无码久久久久久久动漫| 亚洲av永久无码天堂网| av无码免费一区二区三区| 中文字字幕在线中文无码 | 亚洲毛片无码专区亚洲乱| 久久久久亚洲AV无码观看| 国产精品无码专区在线播放| 人妻无码中文久久久久专区| 日韩a级无码免费视频| 亚洲精品一级无码鲁丝片 | 亚洲一区无码精品色| 久久亚洲精品无码av| 精品久久久久久久无码| 日韩精品无码一区二区中文字幕 | 久久青青草原亚洲AV无码麻豆| 狼人无码精华AV午夜精品| 亚洲国产成人无码AV在线| 亚洲av永久无码精品三区在线4| 亚洲桃色AV无码| 国产爆乳无码一区二区麻豆| 超清无码熟妇人妻AV在线电影| 天堂无码久久综合东京热| 本道天堂成在人线av无码免费| 国产成人年无码AV片在线观看 | 亚洲成a人在线看天堂无码| 亚洲国产91精品无码专区| 亚洲精品无码AV中文字幕电影网站| 亚洲国产91精品无码专区| 波多野42部无码喷潮在线 | 蜜芽亚洲av无码一区二区三区| AV无码精品一区二区三区|