本發(fā)明專利技術(shù)是一種基于勢(shì)博弈的多無人機(jī)協(xié)同搜索方法,其實(shí)施步驟為:步驟一:多無人機(jī)協(xié)同搜索問題建模;步驟二:多無人機(jī)協(xié)調(diào)運(yùn)動(dòng)的勢(shì)博弈建模和雙對(duì)數(shù)-線性學(xué)習(xí)法勢(shì)博弈求解;步驟三:根據(jù)傳感器探測(cè)信息更新概率圖,對(duì)更新后的概率圖進(jìn)行信息融合,獲取目標(biāo)存在概率;步驟四:根據(jù)目標(biāo)存在概率更新不確定度,并進(jìn)行多無人機(jī)協(xié)同搜索。本發(fā)明專利技術(shù)能實(shí)現(xiàn)多無人機(jī)協(xié)同搜索,包含基于勢(shì)博弈的協(xié)調(diào)運(yùn)動(dòng)、概率圖更新、信息融合等過程,由于自身分布式的控制方式,方法計(jì)算簡(jiǎn)單,具有較強(qiáng)的魯棒性,能有效應(yīng)對(duì)外界干擾。
【技術(shù)實(shí)現(xiàn)步驟摘要】
201610143227

【技術(shù)保護(hù)點(diǎn)】
一種基于勢(shì)博弈的多無人機(jī)協(xié)同搜索方法,其特征在于,該方法的步驟如下:步驟一:多無人機(jī)協(xié)同搜索問題建模用n架無人機(jī)對(duì)一個(gè)連續(xù)的任務(wù)區(qū)域進(jìn)行搜索,記為V={v1,v2,...,vn};表示實(shí)數(shù)域;每架無人機(jī)作為獨(dú)立的決策者采用分布式策略對(duì)任務(wù)區(qū)域進(jìn)行探索,將連續(xù)的任務(wù)區(qū)域平均分配為M=Lx×Ly個(gè)單,其中,Lx,Ly表示任務(wù)區(qū)域橫向、縱向分配的份數(shù),M表示劃分的單元的個(gè)數(shù);每個(gè)單元用其中心位置g=[x,y]T等價(jià)代替;其中,x,y表示橫、縱坐標(biāo)的位置,T為數(shù)學(xué)符號(hào)轉(zhuǎn)置;無人機(jī)vi在時(shí)刻t對(duì)其覆蓋范圍內(nèi)的基本單元進(jìn)行一次獨(dú)立的測(cè)量,測(cè)量結(jié)果為Zi,g,t,其中μi,t表示無人機(jī)vi在時(shí)刻t的位置,Rsi表示無人機(jī)傳感器的探測(cè)范圍;若其中心位置位于之內(nèi),則某一單元g內(nèi)的信息被無人機(jī)vi檢測(cè)到;在時(shí)刻t,無人機(jī)vi執(zhí)行一次測(cè)量,觀測(cè)結(jié)果表示如下,Zi,g,t=1,if|g-μi,t|≤Rsi0,otherwise.---(1)]]>此外,將正確率和誤警率分別定義為P(Zi,g,t=1|θg=1)=pc和P(Zi,g,t=1|θg=0)=pf,并假設(shè)這兩個(gè)參數(shù)已知,且在整個(gè)任務(wù)執(zhí)行過程中保持不變,其中θg表示目標(biāo)存在于單元g中的概率;對(duì)于多無人機(jī)網(wǎng)絡(luò)的通信拓?fù)洌瑢⑵浣橐粋€(gè)動(dòng)態(tài)圖Gt=(εt,vt),該動(dòng)態(tài)圖中vt為頂點(diǎn)集合,表示為vt={1,2,...,N},εt為連接邊集合,表示為εt={{i,j}:i,j∈v;||μi,t?μj,t||≤RCi},其中μi,t和μj,t表示兩個(gè)不同無人機(jī)vi和vj在時(shí)刻t的位置,RCi為無人機(jī)的通信范圍;無人機(jī)vi在時(shí)刻t的鄰居集合表示為Ni,t={j∈v|{i,j}∈εt}∪{i},為表征方便,設(shè)該無人機(jī)本身屬于其鄰居集合;無人機(jī)vi在時(shí)刻t的度記為di,t=|Ni,t|,表示它將自身位置信息和傳感器信息傳遞給鄰居個(gè)體的能力;步驟二:多無人機(jī)協(xié)調(diào)運(yùn)動(dòng)的勢(shì)博弈建模和雙對(duì)數(shù)?線性學(xué)習(xí)法勢(shì)博弈求解2.1多無人機(jī)協(xié)調(diào)運(yùn)動(dòng)的勢(shì)博弈建模將多無人機(jī)協(xié)調(diào)運(yùn)動(dòng)建模成勢(shì)博弈的過程中,包括三方面的要素:博弈參與者、參與者行動(dòng)集及效用函數(shù);博弈參與者即為參與搜索過程的n架無人機(jī),需要考慮的為行動(dòng)集和效用函數(shù)的設(shè)計(jì);博弈參與者行動(dòng)集Ai的設(shè)計(jì):它定義了博弈參與者可選擇的全部行為,其中的元素被稱為行動(dòng),是參與者在博弈過程中的決策變量;無人機(jī)的搜索效率取決于其傳感器性能以及其所在的位置,將某一博弈者的行動(dòng)集定義為在任務(wù)區(qū)域內(nèi)它所能選擇的位置,Ai={g|g∈Ω},無人機(jī)vi的行動(dòng)表示為ai∈Ai,整個(gè)無人機(jī)群體的集體行動(dòng)表示為a=(a1,a2,...,an),稱作行動(dòng)組合;設(shè)a(t?1)為無人機(jī)vi在時(shí)刻t?1的行動(dòng)組合,則根據(jù)無人機(jī)運(yùn)動(dòng)特性以及障礙物等行動(dòng)約束,將時(shí)刻t行動(dòng)集簡(jiǎn)化為上一時(shí)刻行動(dòng)集的函數(shù),受限的行動(dòng)集,記為對(duì)于博弈者任一行動(dòng)ai∈Ai,有ai∈Ci(ai),即無人機(jī)被允許停留在上一時(shí)刻的位置;在無人機(jī)被布置到任務(wù)器搜集信息時(shí),密度函數(shù)η:用來記錄無人機(jī)對(duì)任務(wù)區(qū)域內(nèi)目標(biāo)時(shí)間發(fā)生概率的了解程度;表示正的實(shí)數(shù)集;由于信號(hào)衰減,傳感器性能隨著目標(biāo)單元與無人機(jī)位置之間的幾何距離增大而降低,因此用非減可微函數(shù)f(||q?pi||):對(duì)傳感器的信號(hào)強(qiáng)度進(jìn)行量化分析,q∈Ω為任務(wù)區(qū)域中單元格的位置,pi為無人機(jī)vi的位置;無人機(jī)的性能用概率密度函數(shù)和信號(hào)衰減綜合表示如下:Φ(a)=Φ(p1,p2,...,pn)=∫Ωf(mini∈{1,2,...n}||q-pi||)η(q)dq---(2)]]>其中f(||q-pi||)=||q-pi||||q-pi||≤RSi0otherwise]]>式中η(q)為密度函數(shù),RSi為無人機(jī)vi的傳感距離;博弈參與者效用函數(shù)Ui(ai,a?i)的設(shè)計(jì):無人機(jī)vi的效用函數(shù)設(shè)計(jì)為整體效用的邊際貢獻(xiàn)值,記做Ui(ai,a-i)=∫Ωf(mini∈{1,2,...,n}||q-pi||)η(q)dq-∫Ωf(mini∈{1,2,...,i-1,i+1,...,n}||q-pi||)η(q)dq.---(3)]]>根據(jù)勢(shì)函數(shù)的定義,按照式(3)設(shè)計(jì)效用函數(shù),構(gòu)成的博弈為勢(shì)博弈,滿足勢(shì)博弈的相關(guān)性質(zhì),能利用各種學(xué)習(xí)算法保證其最優(yōu)性和收斂性;2.2雙對(duì)數(shù)?線性學(xué)習(xí)法的勢(shì)博弈求解采用雙對(duì)數(shù)?線性學(xué)習(xí)法對(duì)問題進(jìn)行求解,減少無人機(jī)計(jì)算資源的負(fù)擔(dān),有利于多無人機(jī)的實(shí)時(shí)運(yùn)動(dòng)控制;在雙對(duì)數(shù)?線性學(xué)習(xí)法中,首先按異步時(shí)間模型以相同的概率隨機(jī)選擇一架無人機(jī)vi∈V改變其位置;與此同時(shí),其他無人機(jī)保持之前的行動(dòng)不變a?i(t)...
【技術(shù)特征摘要】
1.一種基于勢(shì)博弈的多無人機(jī)協(xié)同搜索方法,其特征在于,該方法的步驟如下:
步驟一:多無人機(jī)協(xié)...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:段海濱,李沛,
申請(qǐng)(專利權(quán))人:北京航空航天大學(xué),
類型:發(fā)明
國(guó)別省市:北京;11
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。