基于學習的大擾流環境中機器人穩定跟蹤控制方法技術

技術編號：44244508 閱讀：10 留言：0更新日期：2025-02-11 13:42

本發明專利技術屬于機器人技術領域，涉及基于學習的大擾流環境中機器人穩定跟蹤控制方法。本發明專利技術針對擾流環境中的不確定性提出了基于學習的穩定控制策略，通過容忍誤差實現策略的結構變換，提高機器人在復雜多變的擾流環境中的適應性。相比現有技術，本發明專利技術不僅可以提高水下機器人軌跡跟蹤控制策略的魯棒性，而且由于策略與傳感數據的結合，可以提高實際的工程應用價值。

全部詳細技術資料下載

【技術實現步驟摘要】

本專利技術屬于機器人，涉及基于學習的大擾流環境中機器人穩定跟蹤控制方法。

技術介紹

1、水下機器人在海洋資源勘探、水下工程應用、海軍戰場監測以及水下精度制導等領域具有廣泛應用前景。大多數水下機器人都要求末端執行器與水下物體或環境進行接觸。尤其是面向擾流環境，在動力學高度非線性以及未知水動力效應存在的情況下，水下機器人的軌跡跟蹤控制仍然具有一定的挑戰性。然而，面向復雜的擾流環境，遙控操作需要具備較高的操作技能和經驗，存在一定的局限性。相比而言，穩定的跟蹤技術不僅可以使機器人精確地沿著預定的軌跡運動，而且能夠根據環境的變化進行自主調整，這也將大大提高機器人在動態擾流環境中的工作效率。

2、如今，面向水下機器人的穩定跟蹤控制，不少研究方法已經取得了一定的進展。一方面，針對簡易環境或簡易結構的機器人，基于傳統的物理建模方式對機器人所處的環境進行精確描述，能夠更準確地預測機器人的運動和環境變化。特別是，物理建模可以與傳感器數據融合，例如水下聲納、水下相機等，以進一步優化機器人的控制策略。另一方面，針對復雜的水下運行環境，數據驅動建模方法彌補了物理建模困難的缺陷。通過大量的實測數據建立模型，使得機器人能夠更靈活地適應各種復雜的水下環境，并處理非線性、非規則的水下運動和環境變化。此外，數據驅動建模方法能夠在大規模數據集上進行離線訓練，并在水下機器人運行時進行預測和推理。甚至，為了提高機器人在擾流環境中的適應性，通過模仿海洋生物的形態、運動機制和行為方式來提高跟蹤控制的效率和準確性。這些方法的改進為提高水下機器人的精準控制提供了新的思路和方法。

3、然而，擾流環境下的機器人控制系統相當復雜，具有多個強約束，包括數學模型的復雜性、末端執行器的控制難度以及水流的擾動等等。在設計控制方案時，可能會面臨一系列問題：環境可能是未知的，系統可能受到未知但有界的外部干擾，傳感器測量并不總是準確的。一些研究也可能存在環境條件、任務需求和目標因素的限制，僅僅在特定場景下效果顯著。特別是在動態擾流環境下，控制策略的收斂時間并不理想，甚至系統的收斂性難以保證。這些問題可能導致系統表現出不可預測的不穩定性，我們必須在設計控制器時考慮這些約束。而且，外部擾流使得控制器性能的快速退化加劇了操作任務的復雜性。因此，在動力學高度非線性以及未知水動力效應存在的情況下，水下機器人的跟蹤控制仍然具有一定的挑戰性。

4、專利cn112286227b提出一種基于微分跟蹤器和擾動觀測器的水下機器人軌跡控制方法及系統，通過構建水下機器人動力學模型與機器人擾動觀測器，獲得水下機器人軌跡跟蹤控制器和水下機器人位置控制器，從而實現水下機器人軌跡控制。

5、專利cn111240345a基于雙bp網絡增強學習框架實現水下機器人軌跡跟蹤，利用強化學習方法可以通過與環境的不斷交互，將強化學習與雙bp網絡結合起來，在線調節水下機器人的速度和航向。

6、專利cn110209152b提供一種智能水下機器人垂直面路徑跟隨的深度強化學習控制方法。針對智能水下機器人所處海洋環境復雜多變，傳統控制方法無法與環境主動進行交互的現象，使用確定性策略梯度通過分布式的方法來完成智能水下機器人的路徑跟隨控制任務。

7、專利cn107102644b提出一種基于深度強化學習的水下機器人軌跡控制方法及控制系統，獲取水下機器人當前時刻的狀態以及下一時刻的目標狀態，然后輸入至學習階段最終學習得到的決策神經網絡中，通過決策神經網絡計算出水下機器人當前時刻需要的推進力。

8、在現有技術中，基于物理建模的方法通常需要對環境進行復雜的建模和求解，這可能需要大量的計算資源和時間。甚至，物理建模可能無法完全捕捉到擾流環境的復雜性和不確定性。基于離線學習(如神經網絡等)與補償控制器的結合實現水下機器人的軌跡跟蹤控制。補償作用的大小難以精確計算，甚至實時性也難以保證。同時，由于機器人在擾流環境中狀態信息的誤差大，訓練過程可能面臨陷入局部最優或學習能力不足的問題。

技術實現思路

1、本專利技術旨在提出一種基于學習的穩定跟蹤控制策略，提高水下機器人在擾流環境中跟蹤控制的魯棒性。在視覺監測的輔助下，本專利技術直接以狀態誤差(包括跟蹤誤差和擾流誤差)進行策略設計，基于學習的方式處理擾流環境中的不確定性。通過分析擾流環境下的狀態誤差，實現跟蹤控制策略的設計。需要說明的是，本專利技術以狀態誤差直接對跟蹤系統進行建模，能夠使模型在不斷變化的環境中迅速適應新的數據和情況，而無需重新訓練整體模型。這種靈活性使得模型能夠及時捕捉到環境中的變化，進而提高控制策略的收斂性和穩定性。

2、本專利技術的技術方案：

3、基于學習的大擾流環境中機器人穩定跟蹤控制方法，具體步驟如下：

4、步驟1：采集示范數據；通過人工拖拽的方式采集機器人末端執行器在笛卡爾坐標系中的運行軌跡，包括實際軌跡和期望軌跡；

5、步驟1.1期望軌跡

6、機器人在三維空間中的期望軌跡狀態ξr(t)由期望位置ξr(t)和期望角度θr(t)組成，即ξr(t)＝[ξr(t),θr(t)]t，此時

7、ξr(t)＝[ξxr(t),ξyr(t),ξzr(t)]t?(1)

8、θr(t)＝[θxr(t),θyr(t),θzr(t)]t?(2)

9、其中，t表運行示時間索引，下角標x,y和z分別是x軸、y軸和z軸的符號標記，下角標r表示機器人的期望狀態，即，ξxr(t),ξyr(t)和ξzr(t)分別表示機器人的末端執行器在x軸、y軸和z軸上的期望位置，θxr(t),θyr(t)和θzr(t)分別表示機器人的末端執行器在x軸、y軸和z軸上的期望角度，上角標t表示矩陣轉置；機器人在三維空間中期望軌跡狀態的速度狀態表示為表示機器人在時刻t的期望速度，表示機器人在時刻t的期望角速度；

10、步驟1.2實際軌跡

11、機器人在三維空間中的實際軌跡狀態ξ(t)由實際位置狀態ξ(t)和實際角度狀態θ(t)組成，即ξ(t)＝[ξ(t),θ(t)]t，此時

12、ξ(t)＝[ξx(t),ξy(t),ξz(t)]t?(3)

13、θ(t)＝[θx(t),θy(t),θz(t)]t?(4)

14、式中，ξx(t),ξy(t)和ξz(t)分別表示機器人的末端執行器在x軸、y軸和z軸上的實際位置，θx(t),θy(t)和θz(t)分別表示機器人的末端執行器在x軸、y軸和z軸上的實際角度；此時，機器人在三維空間中實際速度狀態表示為表示ξ(t)在時刻t對應的速度狀態，表示θ(t)在時刻t對應的角速度狀態；

15、步驟1.3實際軌跡與期望軌跡之間的誤差

16、將跟蹤誤差與擾流誤差統一稱為狀態誤差e(t)，滿足關系

17、e(t)＝ξr(t)-ξ(t)?(5)

18、此時，狀態誤差的一階導數為速度誤差表示為

19、

20、設計一個適當的策略來計算速度校本文檔來自技高網...

【技術保護點】

1.基于學習的大擾流環境中機器人穩定跟蹤控制方法，其特征在在于，具體步驟如下：

【技術特征摘要】

1.基于學習的大擾流環境中機器人穩定跟蹤...

【專利技術屬性】
技術研發人員：歐勇盛，師寶，蔡海洋，曲光昱，陳翡，
申請(專利權)人：大連理工大學，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術