System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)涉及一種多無人機在大壩異常環(huán)境巡檢中的覆蓋路徑規(guī)劃方法,用于多無人機在發(fā)生自然災(zāi)害后的壩區(qū)執(zhí)行巡檢任務(wù)時的覆蓋路徑規(guī)劃,屬于智慧水利。
技術(shù)介紹
1、巡檢對于大壩的安全運行具有重要意義。全面有效的大壩巡檢可以及時發(fā)現(xiàn)裂縫、滲漏等潛在的結(jié)構(gòu)問題,同時實時監(jiān)測自然災(zāi)害對水庫生態(tài)環(huán)境的影響。最近,無人機技術(shù)的飛速發(fā)展為大壩巡檢提供了新的思路。多無人機協(xié)同具有成本低、體積小、機動性強等優(yōu)點,有潛力在大壩巡檢中實現(xiàn)全面且高效的覆蓋。多無人機協(xié)同的關(guān)鍵技術(shù)是無人機覆蓋路徑規(guī)劃。
2、近年來,大量學(xué)者對無人機覆蓋路徑規(guī)劃進行了研究。無人機覆蓋路徑規(guī)劃模型主要被分為了二類。第一類是非自組織控制模型,包括協(xié)同控制和隨機控制。協(xié)同控制是指使多架無人機協(xié)同工作以完成一個共同目標(biāo)(如覆蓋一個區(qū)域)的策略。例如,為了解決無人機協(xié)同搜索中的協(xié)作機制和分布式策略問題,一些研究者開發(fā)了一種分布式在線啟發(fā)式方法。然而,協(xié)同控制的魯棒性有限。如果無人機集群中有少數(shù)無人機受損,則需要重新部署整個無人機網(wǎng)絡(luò)。隨機控制試圖通過隨機選擇路徑點來覆蓋目標(biāo)區(qū)域,從而減少計算開銷和時間延遲。例如,一些學(xué)者設(shè)計了一種集成隨機漫步、人工智能和覆蓋控制的策略,在目標(biāo)區(qū)域部署多架直升機型無人機。與協(xié)同控制相比,隨機控制進一步提高了魯棒性,但它暴露了覆蓋時間過長以及重疊覆蓋的問題。
3、針對這些問題,第二類無人機覆蓋路徑規(guī)劃模型被提出,稱之為自組織控制模型。該模型可以基于自主無人機的決策實現(xiàn)區(qū)域覆蓋任務(wù)。具體地,研究人員設(shè)計了一個多智能體drl(deep
4、然而,在大壩巡檢中,由于自然災(zāi)害的存在,壩區(qū)不可避免地處于異常環(huán)境中。大壩異常環(huán)境會引發(fā)兩個問題:1)雷暴、強風(fēng)和地震等自然災(zāi)害會干擾無線通信信號,導(dǎo)致無人機之間的通信障礙;2)在大壩異常環(huán)境中,無人機的覆蓋范圍和能耗是不可忽視的因素。例如,更大的無人機覆蓋范圍支持獲取更多的災(zāi)害信息。另外,自然災(zāi)害會破壞無人機的能源供應(yīng)裝置。無人機的低能耗保證了在有限的能源供應(yīng)下執(zhí)行長時間的巡檢任務(wù)。因此,實現(xiàn)覆蓋范圍和能耗的聯(lián)合優(yōu)化是十分必要的。目前,大多數(shù)自組織控制模型旨在探索正常環(huán)境下的大壩檢查。當(dāng)壩區(qū)發(fā)生自然災(zāi)害時,這些模型沒有考慮到以上兩個問題。這是本專利技術(shù)的研究動力所在。
技術(shù)實現(xiàn)思路
1、專利技術(shù)目的:針對現(xiàn)有技術(shù)存在的問題與不足,本專利技術(shù)提供一種性能好、實用性強的一種多無人機在大壩異常環(huán)境巡檢中的覆蓋路徑規(guī)劃方法。
2、技術(shù)方案:一種多無人機在大壩異常環(huán)境巡檢中的覆蓋路徑規(guī)劃方法,包括如下步驟:
3、步驟1:形式化定義多無人機在大壩異常環(huán)境巡檢中的覆蓋路徑規(guī)劃問題;
4、步驟2:構(gòu)建基于drl的多無人機覆蓋路徑規(guī)劃模型;
5、步驟3:更新模型參數(shù)。
6、優(yōu)選地,所述的步驟1具體為:
7、形式化定義多無人機在大壩異常環(huán)境巡檢中的覆蓋路徑規(guī)劃問題可以分為兩步,分別是定義異常環(huán)境和定義優(yōu)化問題。
8、更加優(yōu)選地,所述的定義異常環(huán)境具體為:
9、大壩巡檢對于大壩的安全運行具有重要意義,特別是在壩區(qū)遭遇雷暴,強風(fēng),以及地震等自然災(zāi)害后,全面有效的大壩巡檢可以及時發(fā)現(xiàn)潛在的結(jié)構(gòu)問題(如裂縫、滲漏)并采取糾正措施,同時實時監(jiān)測自然災(zāi)害對水庫生態(tài)環(huán)境的影響,本專利技術(shù)將遭遇自然災(zāi)害后的壩區(qū)稱之為大壩異常環(huán)境。具體地,大壩異常環(huán)境由以下成分共同定義,分別是包含邊界和障礙物的大壩區(qū)域,大壩區(qū)域中的災(zāi)難點,每個災(zāi)難點的受災(zāi)嚴(yán)重程度,靜態(tài)傳感器(災(zāi)難發(fā)生前已完成部署),多架無人機,每架無人機的覆蓋面積。
10、更加優(yōu)選地,所述的定義優(yōu)化問題具體為:
11、在定義了大壩異常環(huán)境之后,本專利技術(shù)將多無人機在大壩異常環(huán)境巡檢中的覆蓋路徑規(guī)劃問題定義為一個優(yōu)化問題,優(yōu)化目標(biāo)包含多無人機的覆蓋率以及多無人機能量消耗,旨在最小化多無人機的能耗和最大化多無人機的覆蓋區(qū)域。
12、優(yōu)選地,所述的步驟2具體為:
13、根據(jù)深度學(xué)習(xí)和強化學(xué)習(xí)的原理,本專利技術(shù)構(gòu)建基于drl的多無人機覆蓋路徑規(guī)劃模型。該模型能夠?qū)崿F(xiàn)多無人機在大壩異常環(huán)境巡檢過程中的覆蓋率和能耗的聯(lián)合優(yōu)化。
14、更加優(yōu)選地,所述的基于drl的多無人機覆蓋路徑規(guī)劃模型主要由兩部分構(gòu)成,分別是tp(trace?pheromone,追蹤信息素,簡稱tp)以及maddpg(multi-agent?deepdeterministic?policy?gradient,多智能體深度確定性策略梯度,簡稱maddpg)。tp建立了無人機間的通信媒介,實現(xiàn)了無人機在大壩異常環(huán)境下的間接通信。同時,tp可以有效地管理無人機的路徑信息,將無人機之間復(fù)雜的交互簡化為低維表示。然后maddpg被用于實現(xiàn)多無人機的覆蓋路徑規(guī)劃。在maddpg中,獎勵函數(shù)被用于同時完成最大化多無人機覆蓋率和最小化多無人機能耗的目標(biāo)。
15、更加優(yōu)選地,所述的maddpg具體為:
16、每架無人機擁有獨立的maddpg,每個maddpg均包含兩個網(wǎng)絡(luò),分別是演員網(wǎng)絡(luò)和評論家網(wǎng)絡(luò)。演員網(wǎng)絡(luò)由兩個fc層(fully?connected?layers,全連接層,簡稱fc層)和一個softmax層組成,這一網(wǎng)絡(luò)旨在生成一個無人機可以執(zhí)行的動作(如飛行方向和飛行角度)的概率,基于這些概率,無人機選擇下一個將要執(zhí)行的動作。評論家網(wǎng)絡(luò)由三個fc層構(gòu)成,主要用于產(chǎn)生q值。
17、優(yōu)選地,所述的步驟3具體為:
18、maddpg通過為每個無人機分別更新演員網(wǎng)絡(luò)和評論家網(wǎng)絡(luò)來進行參數(shù)更新。每個無人機擁有獨立的演員-評論家網(wǎng)絡(luò)對,其中演員網(wǎng)絡(luò)根據(jù)期望回報的梯度進行更新,而評論家網(wǎng)絡(luò)則根據(jù)貝爾曼方程來更新q值。在訓(xùn)練過程中,使用集中式的訓(xùn)練方式,即每個無人機的評論家網(wǎng)絡(luò)會考慮所有無人機的動作。但執(zhí)行時是去中心化的,即每個無人機會根據(jù)自身策略獨立行動。
19、最后,通過對比本專利技術(shù)提出的模型和一些先進的drl模型在模擬的大壩異常環(huán)境中的性能,可以發(fā)現(xiàn)本專利技術(shù)所提出的模型在多無人機覆蓋路徑規(guī)劃中具有更大的無人機覆蓋率以及更低的無人機能耗。
20、一種計算機設(shè)備,其特征在于:該計算機設(shè)備包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,處理器執(zhí)行上述計算機程序時實現(xiàn)如上所述的多無人機在大壩異常環(huán)境巡檢中的覆蓋路徑規(guī)劃方法的步驟。
21、一種計算機可本文檔來自技高網(wǎng)...
【技術(shù)保護點】
1.一種多無人機在大壩異常環(huán)境巡檢中的覆蓋路徑規(guī)劃方法,其特征在于,包括如下步驟:
2.根據(jù)權(quán)利要求1所述的一種多無人機在大壩異常環(huán)境巡檢中的覆蓋路徑規(guī)劃方法,其特征在于,所述形式化定義多無人機在大壩異常環(huán)境巡檢中的覆蓋路徑規(guī)劃問題分為兩步,分別是定義異常環(huán)境和定義優(yōu)化問題;
3.根據(jù)權(quán)利要求1所述的一種多無人機在大壩異常環(huán)境巡檢中的覆蓋路徑規(guī)劃方法,其特征在于,構(gòu)建基于DRL的多無人機覆蓋路徑規(guī)劃模型,該模型能夠?qū)崿F(xiàn)多無人機在大壩異常環(huán)境巡檢過程中的覆蓋率和能耗的聯(lián)合優(yōu)化;
4.根據(jù)權(quán)利要求3所述的一種多無人機在大壩異常環(huán)境巡檢中的覆蓋路徑規(guī)劃方法,其特征在于,所述的MADDPG具體為:
5.根據(jù)權(quán)利要求3所述的一種多無人機在大壩異常環(huán)境巡檢中的覆蓋路徑規(guī)劃方法,為了解決多無人機覆蓋路徑規(guī)劃問題,設(shè)計了一個獎勵函數(shù);對于第t代的第p架無人機,在該無人機執(zhí)行一個任務(wù)后給予獎勵這一獎勵被視為一個狀態(tài)-動作函數(shù),旨在引導(dǎo)第p架無人機選擇最優(yōu)的策略;由以下部分構(gòu)成:
6.一種計算機設(shè)備,其特征在于:該計算機設(shè)備包括存儲器、處理
7.一種計算機可讀存儲介質(zhì),其特征在于:該計算機可讀存儲介質(zhì)存儲有執(zhí)行如權(quán)利要求1-5中任一項所述的多無人機在大壩異常環(huán)境巡檢中的覆蓋路徑規(guī)劃方法的計算機程序。
...【技術(shù)特征摘要】
1.一種多無人機在大壩異常環(huán)境巡檢中的覆蓋路徑規(guī)劃方法,其特征在于,包括如下步驟:
2.根據(jù)權(quán)利要求1所述的一種多無人機在大壩異常環(huán)境巡檢中的覆蓋路徑規(guī)劃方法,其特征在于,所述形式化定義多無人機在大壩異常環(huán)境巡檢中的覆蓋路徑規(guī)劃問題分為兩步,分別是定義異常環(huán)境和定義優(yōu)化問題;
3.根據(jù)權(quán)利要求1所述的一種多無人機在大壩異常環(huán)境巡檢中的覆蓋路徑規(guī)劃方法,其特征在于,構(gòu)建基于drl的多無人機覆蓋路徑規(guī)劃模型,該模型能夠?qū)崿F(xiàn)多無人機在大壩異常環(huán)境巡檢過程中的覆蓋率和能耗的聯(lián)合優(yōu)化;
4.根據(jù)權(quán)利要求3所述的一種多無人機在大壩異常環(huán)境巡檢中的覆蓋路徑規(guī)劃方法,其特征在于,所述的maddpg具體為:
5.根據(jù)權(quán)利要求3所...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:榮毅,許皓文,毛鶯池,李果,聶兵兵,戚榮志,王彥芳,徐小坤,彭欣欣,張家愷,魏子鈞,劉軍顯,李玲,孔明,郭彪,劉錦,趙家堯,王貴華,王龍,王英潔,段永杰,沈鳳群,李清夢,
申請(專利權(quán))人:河海大學(xué),
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。