System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于機器人路徑規劃,具體涉及一種多機器人協同三維路徑規劃方法及系統,特別是融合博弈論和粒子群混合優化方法實現的路徑規劃。
技術介紹
1、近年來,博弈論被引入到多機器人合作問題中。wu基于勢博弈方法設計了一種新的分布式多智能體任務分配框架來解決動態多智能體任務分配問題,確保任何納什均衡都至少有50%的次優性,而最優納什均衡代表最優解。鄭彥斌在一種兩階段路徑規劃算法中,利用博弈論構建了多智能體之間的動態避障模型,并應用虛擬行動法解決了沖突點和多個納什均衡選擇中的博弈問題,從而降低了路徑總成本,提高了算法的收斂速度。然而,考慮所有可能場景的難度限制了達到納什均衡的成功率。這一限制反過來會影響路徑規劃的穩定性和可靠性。郭亞寧利用博弈論和多智能體強化學習算法實現了多智能體系統的協同路徑規劃。合作博弈框架將傳統的單智能體q學習算法擴展到多智能體系統。雖然該框架在特定場景下可能表現良好,但其泛化能力有限。此外,機器人之間頻繁依賴通信可能會導致通信延遲,從而影響系統的整體性能和響應速度。
2、此外,復雜環境下的機器人路徑規劃時,避免碰撞、降低風險和最優路徑識別至關重要。而傳統的基于網格和基于采樣的方法往往在動態、高維或受限空間的可擴展性和效率方面存在困難。相反,灰狼優化、差分進化、遺傳算法、粒子群優化、蟻群優化等智能優化算法得到了廣泛的關注。這些算法使用自然啟發的策略來增強對復雜尋路任務的全局搜索能力和魯棒性。與其他自然啟發的算法相比,pso擅長在較短的計算時間內找到穩定的全局解。然而,pso算法對初始條件和目標函數的變化
3、因此,本領域探索在復雜的三維環境下進行多機器人路徑規劃時,如何更高效地規劃出安全且高質量的機器人路徑是一直有待研究/解決的問題。
技術實現思路
1、本專利技術的目的是規劃出安全且高質量的機器人路徑,進而提供一種多機器人協同三維路徑規劃方法及系統,其中,本專利技術技術方案是融合博弈論和粒子群混合優化方法實現的路徑規劃。通過融合博弈論方法改進粒子群優化算法,即引入博弈論策略來調整粒子的空間位置,旨在解決機器人之間的沖突,增強多機器人之間的協調。其中,博弈論可以在全局層面優化多機器人系統的協作行為,在局部層面優化單個機器人的路徑規劃,從而可以更好地處理機器人之間的關系,使其能夠增強共享環境下路徑規劃的安全性和可行性,并保持多機器人系統的靈活性和適應性。
2、為此,本專利技術提供如下技術方案:
3、一方面,本專利技術提供的一種多機器人協同三維路徑規劃方法,包括以下步驟:
4、s1:獲取待規劃區域的地圖信息;
5、s2:引入球面矢量粒子群算法,并基于博弈論的粒子空間位置變換策略優化所述球面矢量粒子群算法;進而為每個機器人設置對應的粒子種群,所述粒子種群中每個粒子的粒子位置表征對應機器人的一個路徑,將路徑規劃問題轉換為多目標優化問題,以成本降低為優化目標,構建出表征成本的適應度函數,利用所述球面矢量粒子群算法進行迭代運算更新每個機器人對應的粒子位置,直至滿足迭代終止條件,得到每個機器人對應的最佳粒子位置,進而輸出多機器人協同規劃的無碰撞路徑;
6、其中,將機器人路徑拆分為由路徑節點構建的路徑段,進而使用路徑段的幅度、仰角、方位角構建路徑向量,用以表征粒子位置;
7、每次迭代運算過程為:先基于初始設定的適應度函數和粒子位置方程以及當前粒子位置更新粒子位置,再基于更新的粒子位置判斷所述多機器人之間是否存在碰撞沖突,若存在碰撞沖突,使用博弈論的粒子空間位置變換策略優化適應度函數、粒子位置方程,進而再次更新粒子位置;然后再進入下一次迭代運算;若不存在碰撞沖突,基于當前更新的粒子位置進入下一輪迭代運算。
8、在路徑規劃中,一般定義一個安全距離因子,當兩個機器人之間的距離小于這個預設的安全距離時,系統會判斷存在碰撞威脅。這種方法通過監測機器人之間的相對距離來判斷是否存在碰撞風險。
9、可選地,定義表征機器人的粒子i的粒子位置ωi和表征空間速度的增量矢量δωi表示為:
10、ωi=(ρi1,ψi1,φi1,ρi2,ψi2,φi2,...,ρil,ψil,φil),l=l-2
11、δωi=(δρi1,δψi1,δφi1,δρi2,δψi2,δφi2,...,δρil,δψil,δφil)
12、式中,l表示不包含起點和終點的路徑節點數,l為路徑總節點數;幅度ρ∈(0,路徑長度),仰角和方位角φ∈[-π,π];δρ、δψ、δφ分別對應幅度增量、仰角增量、方位角增量;下標i1,i2,il分別對應粒子i的第1、2、l個路徑段;
13、定義粒子i的第j個路徑段對應的位置(ρij,ψij,φij)表示為eij,速度(δρij,δψij,δφij)表示為δeij,對于一群m粒子,使用博弈論的粒子空間位置變換策略優化的所述粒子位置方程,更新粒子位置表示為:
14、
15、式中,分別表示粒子i的第j個路徑段在第k+1次迭代、第k次迭代的策略δsij,策略δsij由速度δeij轉換而來;wk為第k次迭代的探索權重w,c1,c2均為學習因子,分別表示第k次迭代的粒子i的全局最佳位置、局部最佳位置中第j個路徑段的位置參數;r1j,r2j為均勻概率分布中[0,1]內的兩個隨機樣本;為粒子i的第j個路徑段在第k次、第k+1次迭代的粒子位置eij。
16、可選地,使用博弈論的粒子空間位置變換策略優化適應度函數時,所述適應度函數為總博弈函數或由總博弈函數轉換而來,所述總博弈函數在代價函數基礎上引入機器人博弈時因策略而產生的避障收益;
17、其中,定義幅度ρ∈(0,路徑長度),仰角和方位角φ∈[-π,π];δρ′、δψ′、δφ′分別為幅度增量、仰角增量、方位角增量;粒子i的第j個路徑段對應的粒子位置(ρij,ψij,φij)表示為eij,速度(δρij,δψij,δφij)表示為δeij,粒子i的第j個路徑段的策略δsij由速度δeij轉換而來;
18、當p機器人與q機器人博弈時,由p機器人的策略δsij產生的位置變化所導致的避障收益vpq如下:
19、
20、p機器人的粒子i的總碰撞收益表示為:
21、
22、式中,δρ′ij,δ本文檔來自技高網...
【技術保護點】
1.一種多機器人協同三維路徑規劃方法,其特征在于:包括以下步驟:
2.根據權利要求1所述的方法,其特征在于:定義表征機器人的粒子i的粒子位置Ωi和表征空間速度的增量矢量ΔΩi表示為:
3.根據權利要求1所述的方法,其特征在于:使用博弈論的粒子空間位置變換策略優化適應度函數時,所述適應度函數為總博弈函數或由總博弈函數轉換而來,所述總博弈函數在代價函數基礎上引入機器人博弈時因策略而產生的避障收益;
4.根據權利要求2或3所述的方法,其特征在于:所述策略Δsij與所述速度Δeij的關系如下:
5.根據權利要求3所述的方法,其特征在于:所述代價函數的成本類型為安全約束成本、海拔成本、路徑代價以及平滑代價的全部組合或部分組合。
6.根據權利要求1所述的方法,其特征在于:每一次迭代過程中,迭代終止條件還包括:判斷所有機器人之間是否達到了納什均衡狀態,若未達到,進入下一輪迭代運算;若達到,判斷是否達到其他迭代終止條件,若不滿足其他迭代終止條件,再進入下一輪迭代運算;
7.根據權利要求1所述的方法,其特征在于:所述球面矢量粒
8.一種基于權利要求1-7任一項所述方法的多機器人系統,其特征在于:包括若干通訊連接的機器人以及協同控制子系統,所述機器人均與所述協同控制子系統連接,所述協同控制子系統包括:
9.一種計算機設備,其特征在于:至少包含:
10.一種計算機可讀存儲介質,其特征在于:
...【技術特征摘要】
1.一種多機器人協同三維路徑規劃方法,其特征在于:包括以下步驟:
2.根據權利要求1所述的方法,其特征在于:定義表征機器人的粒子i的粒子位置ωi和表征空間速度的增量矢量δωi表示為:
3.根據權利要求1所述的方法,其特征在于:使用博弈論的粒子空間位置變換策略優化適應度函數時,所述適應度函數為總博弈函數或由總博弈函數轉換而來,所述總博弈函數在代價函數基礎上引入機器人博弈時因策略而產生的避障收益;
4.根據權利要求2或3所述的方法,其特征在于:所述策略δsij與所述速度δeij的關系如下:
5.根據權利要求3所述的方法,其特征在于:所述代價函數的成本類型為安全約束成本、海拔成本、路徑代價以及平滑代價的全部組合或部分組合。
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。