System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)屬于軌跡追蹤控制領(lǐng)域,具體涉及一種基于數(shù)據(jù)驅(qū)動(dòng)和學(xué)習(xí)模型預(yù)測(cè)控制的突變軌跡追蹤控制方法。
技術(shù)介紹
1、無(wú)人系統(tǒng)是指能夠自主完成指定任務(wù)的無(wú)人設(shè)備,包括無(wú)人機(jī)、無(wú)人車和無(wú)人船等。隨著人工智能和先進(jìn)控制方法的不斷發(fā)展,無(wú)人系統(tǒng)的智能化水平顯著提高,其常被用于執(zhí)行各種復(fù)雜任務(wù),如環(huán)境監(jiān)測(cè)、科學(xué)探測(cè)、醫(yī)療救援和農(nóng)業(yè)噴灑等。軌跡追蹤是指無(wú)人系統(tǒng)精準(zhǔn)追蹤預(yù)先設(shè)計(jì)的目標(biāo)軌跡的過(guò)程,是控制領(lǐng)域的基本問(wèn)題之一,在物流分揀、導(dǎo)航和海域巡邏等領(lǐng)域都有廣泛的應(yīng)用。
2、模型預(yù)測(cè)控制(model?predictive?control,mpc)的約束處理能力和滾動(dòng)優(yōu)化機(jī)制使其在解決無(wú)人系統(tǒng)的軌跡追蹤問(wèn)題時(shí)具有顯著優(yōu)勢(shì)。但是,傳統(tǒng)的軌跡追蹤方法要求目標(biāo)軌跡的變化速度在無(wú)人系統(tǒng)的可追蹤范圍內(nèi),當(dāng)追蹤目標(biāo)的外部誤差激增或目標(biāo)軌跡突變時(shí),無(wú)人系統(tǒng)會(huì)丟失目標(biāo)。因此,如何在確保規(guī)劃軌跡的可追蹤性的同時(shí),盡量減小規(guī)劃軌跡與突變軌跡之間的偏差是實(shí)現(xiàn)突變軌跡追蹤控制的一大難題。
3、基于數(shù)據(jù)驅(qū)動(dòng)的策略,迭代學(xué)習(xí)模型預(yù)測(cè)控制(learning?model?predictivecontrol,lmpc)能夠使用來(lái)自之前任務(wù)迭代的追蹤誤差來(lái)提高當(dāng)前時(shí)刻控制器的追蹤性能,但控制器的計(jì)算復(fù)雜度也隨之增加,無(wú)法應(yīng)用到需要高頻控制的無(wú)人系統(tǒng)。傳統(tǒng)的規(guī)劃算法的計(jì)算復(fù)雜度低,能夠?qū)崟r(shí)輸出目標(biāo)軌跡,但算法的優(yōu)化能力差,降低了無(wú)人系統(tǒng)的追蹤能力。為此,利用長(zhǎng)短期記憶網(wǎng)絡(luò)(long?short-term?memory,lstm)學(xué)習(xí)最優(yōu)軌跡與傳統(tǒng)規(guī)劃算法輸出的輔
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)所要解決的技術(shù)問(wèn)題是:
2、為了解決現(xiàn)有的無(wú)人系統(tǒng)軌跡追蹤控制算法無(wú)法追蹤突變軌跡的問(wèn)題,本專利技術(shù)提供一種基于數(shù)據(jù)驅(qū)動(dòng)和學(xué)習(xí)模型預(yù)測(cè)控制的突變軌跡追蹤控制方法。
3、為了解決上述技術(shù)問(wèn)題,本專利技術(shù)采用的技術(shù)方案為:
4、一種基于數(shù)據(jù)驅(qū)動(dòng)和學(xué)習(xí)模型預(yù)測(cè)控制的突變軌跡追蹤控制方法,其特征在于,步驟如下:
5、步驟1:建立無(wú)人船系統(tǒng)的運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)模型;
6、步驟2:隨機(jī)采樣帶有突變點(diǎn)的目標(biāo)軌跡,根據(jù)無(wú)人船系統(tǒng)的速度上界和突變軌跡,設(shè)計(jì)學(xué)習(xí)模型預(yù)測(cè)控制算法,計(jì)算可被無(wú)人系統(tǒng)追蹤的最優(yōu)目標(biāo)軌跡;
7、步驟3:以通過(guò)b樣條計(jì)算的輔助軌跡和輔助控制律為輸入,以學(xué)習(xí)模型預(yù)測(cè)控制算法計(jì)算的最優(yōu)控制律與輔助控制律的偏差為輸出,構(gòu)建序列到序列問(wèn)題的訓(xùn)練集;
8、步驟4:建立基于lstm網(wǎng)絡(luò)的編碼器-解碼器模型,將訓(xùn)練集輸入基于lstm網(wǎng)絡(luò)的編碼器-解碼器模型學(xué)習(xí)最優(yōu)目標(biāo)軌跡與輔助軌跡之間的深層映射關(guān)系;
9、步驟5:檢測(cè)到目標(biāo)軌跡的突變點(diǎn)后,提取以突變點(diǎn)為中心的子目標(biāo)軌跡,基于lstm網(wǎng)絡(luò)的編碼器-解碼器模型,輸出近似最優(yōu)的目標(biāo)軌跡;
10、步驟6:設(shè)計(jì)魯棒模型預(yù)測(cè)控制算法,控制無(wú)人系統(tǒng)追蹤近似最優(yōu)的目標(biāo)軌跡。
11、本專利技術(shù)進(jìn)一步的技術(shù)方案:所述步驟2包括:
12、步驟2.1:設(shè)計(jì)長(zhǎng)預(yù)測(cè)時(shí)域的軌跡規(guī)劃問(wèn)題,計(jì)算出一條連接突變軌跡起始點(diǎn)和終止點(diǎn)的可行軌跡;
13、步驟2.2:建立針對(duì)突變軌跡的迭代優(yōu)化模型,在可行軌跡中選擇最優(yōu)的點(diǎn)作為學(xué)習(xí)mpc的子終端條件,設(shè)計(jì)終端松弛條件;
14、步驟2.3:迭代求解步驟2.2的優(yōu)化問(wèn)題,直到子終端條件為可行軌跡的終點(diǎn),并將輸出的軌跡作為新的可行軌跡,開啟下一次迭代,在迭代次數(shù)達(dá)到設(shè)定的閾值后,將輸出軌跡作為最優(yōu)的目標(biāo)軌跡。
15、本專利技術(shù)進(jìn)一步的技術(shù)方案:所述步驟2.1中,設(shè)計(jì)長(zhǎng)預(yù)測(cè)時(shí)域的軌跡規(guī)劃問(wèn)題,其優(yōu)化問(wèn)題如下所示:
16、
17、st:ηg(k+n|k)=ηr(k+n|k)-ηt
18、ηr(k|k)=ηr(k),ηr(k+nt|k)=ηt
19、ηr(k+n+1|k)=fr(ηr(k+n|k),ur(k+n|k))
20、
21、
22、其中,ηs和ηt是突變軌跡的起止點(diǎn),fr(·)是虛擬追蹤目標(biāo)的更新方程,ur(k+n|k)是虛擬追蹤目標(biāo)的控制輸入,包括虛擬目標(biāo)的線速度和角速度,ηr(k+n|k)是根據(jù)控制輸入預(yù)測(cè)的追蹤目標(biāo)狀態(tài),qt和rt是權(quán)重矩陣;和是虛擬追蹤目標(biāo)的狀態(tài)和控制輸入約束,nt是一個(gè)足夠長(zhǎng)的預(yù)測(cè)時(shí)域,確保虛擬追蹤目標(biāo)對(duì)于無(wú)人系統(tǒng)是可追蹤的,且其能夠在預(yù)測(cè)時(shí)域內(nèi)到達(dá)突變軌跡的終點(diǎn)。
23、本專利技術(shù)進(jìn)一步的技術(shù)方案:所述步驟2.2中,建立針對(duì)突變軌跡的迭代優(yōu)化模型:
24、
25、其中,ql、rl和pl是權(quán)重矩陣,nl是學(xué)習(xí)mpc的預(yù)測(cè)時(shí)域;是在第i次迭代過(guò)程中k時(shí)刻計(jì)算的k+n時(shí)刻的控制輸入,是根據(jù)控制輸入預(yù)測(cè)的虛擬追蹤目標(biāo)狀態(tài);和是虛擬追蹤目標(biāo)的狀態(tài)和控制輸入約束;是隨迭代過(guò)程更新的終端集合;ηd(k+n|k)是突變軌跡的狀態(tài),是虛擬追蹤目標(biāo)距離突變軌跡的狀態(tài)誤差,其計(jì)算方程為:
26、
27、
28、其中,θr(k+n|k)是無(wú)人系統(tǒng)的航向角,φl(shuí)(θr(k+n|k))為旋轉(zhuǎn)矩陣,將狀態(tài)誤差從世界坐標(biāo)系轉(zhuǎn)換到虛擬追蹤目標(biāo)坐標(biāo)系;是控制輸入誤差,代表規(guī)劃的虛擬目標(biāo)速度與突變軌跡速度的偏差,av和bv是虛擬追蹤目標(biāo)追蹤誤差和控制輸入誤差的更新系數(shù)矩陣。
29、本專利技術(shù)進(jìn)一步的技術(shù)方案:所述步驟2.2中,在可行軌跡中選擇最優(yōu)的點(diǎn)作為子終端條件,并設(shè)計(jì)終端松弛條件,具體為:
30、終端集合定義為:表明其中心為在第i-1次迭代過(guò)程中迭代集合si-1內(nèi)代價(jià)值最小的終端點(diǎn);迭代集合內(nèi)存儲(chǔ)上一個(gè)迭代過(guò)程記錄的連接突變起止點(diǎn)的可行軌跡,ti-1是i-1迭代過(guò)程中最優(yōu)目標(biāo)軌跡的長(zhǎng)度;s0內(nèi)是步驟2.1中求解長(zhǎng)時(shí)域軌跡規(guī)劃問(wèn)題所得的初始可行軌跡;在選擇最優(yōu)的終端點(diǎn)時(shí),首先依次選擇迭代集合si-1內(nèi)的點(diǎn)作為迭代優(yōu)化問(wèn)題的終端點(diǎn),求解迭代優(yōu)化問(wèn)題,選擇代價(jià)值最小且確保迭代優(yōu)化問(wèn)題有解的終端點(diǎn)作為當(dāng)前時(shí)刻的最優(yōu)終端點(diǎn),記為是終端時(shí)刻的虛擬追蹤目標(biāo)相對(duì)于終端點(diǎn)的追蹤誤差,當(dāng)終端追蹤誤差位于終端集合內(nèi)時(shí),表明虛擬追蹤目標(biāo)已經(jīng)靠近迭代集合內(nèi)的最優(yōu)終端點(diǎn)即迭代集合內(nèi)可行軌跡上的某一點(diǎn),此時(shí)根據(jù)迭代集合內(nèi)的控制輸入,可以控制虛擬追蹤目標(biāo)延可行軌跡到達(dá)突變軌跡的終點(diǎn)ηt;當(dāng)時(shí),迭代過(guò)程i結(jié)束,將此時(shí)最優(yōu)的追蹤軌跡記錄在集合si內(nèi)。
31、本專利技術(shù)進(jìn)一步的技術(shù)方案:所述步驟3具體為:
32、隨機(jī)采樣長(zhǎng)度為ta的突變軌跡,構(gòu)建連接突變軌跡起點(diǎn)ηs和終點(diǎn)ηt的b樣條曲線作為輔助軌跡,m階n+1個(gè)控制點(diǎn)的b樣條曲線的矩陣表達(dá)形式如下所示:
33、qc(g(t))=g(t)mm(i)c(i)
34、其中,g(t)=[1,g(t),g2(t),,gm-1(t)],δ是設(shè)定的時(shí)間間隔,本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種基于數(shù)據(jù)驅(qū)動(dòng)和學(xué)習(xí)模型預(yù)測(cè)控制的突變軌跡追蹤控制方法,其特征在于,步驟如下:
2.根據(jù)權(quán)利要求1所述一種基于數(shù)據(jù)驅(qū)動(dòng)和學(xué)習(xí)模型預(yù)測(cè)控制的突變軌跡追蹤控制方法,其特征在于,所述步驟2包括:
3.根據(jù)權(quán)利要求2所述一種基于數(shù)據(jù)驅(qū)動(dòng)和學(xué)習(xí)模型預(yù)測(cè)控制的突變軌跡追蹤控制方法,其特征在于,所述步驟2.1中,設(shè)計(jì)長(zhǎng)預(yù)測(cè)時(shí)域的軌跡規(guī)劃問(wèn)題,其優(yōu)化問(wèn)題如下所示:
4.根據(jù)權(quán)利要求3所述一種基于數(shù)據(jù)驅(qū)動(dòng)和學(xué)習(xí)模型預(yù)測(cè)控制的突變軌跡追蹤控制方法,其特征在于,所述步驟2.2中,建立針對(duì)突變軌跡的迭代優(yōu)化模型:
5.根據(jù)權(quán)利要求4所述一種基于數(shù)據(jù)驅(qū)動(dòng)和學(xué)習(xí)模型預(yù)測(cè)控制的突變軌跡追蹤控制方法,其特征在于,所述步驟2.2中,在可行軌跡中選擇最優(yōu)的點(diǎn)作為子終端條件,并設(shè)計(jì)終端松弛條件,具體為:
6.根據(jù)權(quán)利要求5所述一種基于數(shù)據(jù)驅(qū)動(dòng)和學(xué)習(xí)模型預(yù)測(cè)控制的突變軌跡追蹤控制方法,其特征在于,所述步驟3具體為:
7.根據(jù)權(quán)利要求6所述一種基于數(shù)據(jù)驅(qū)動(dòng)和學(xué)習(xí)模型預(yù)測(cè)控制的突變軌跡追蹤控制方法,其特征在于,所述步驟4中,建立基于LSTM網(wǎng)絡(luò)的
8.根據(jù)權(quán)利要求1所述一種基于數(shù)據(jù)驅(qū)動(dòng)和學(xué)習(xí)模型預(yù)測(cè)控制的突變軌跡追蹤控制方法,其特征在于,所述步驟6中,設(shè)計(jì)魯棒模型預(yù)測(cè)控制算法,控制無(wú)人系統(tǒng)追蹤近似最優(yōu)的目標(biāo)軌跡,具體的優(yōu)化問(wèn)題如下所示:
9.一種計(jì)算機(jī)系統(tǒng),其特征在于包括:一個(gè)或多個(gè)處理器,計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),用于存儲(chǔ)一個(gè)或多個(gè)程序,其中,當(dāng)所述一個(gè)或多個(gè)程序被所述一個(gè)或多個(gè)處理器執(zhí)行時(shí),使得所述一個(gè)或多個(gè)處理器實(shí)現(xiàn)權(quán)利要求1所述的方法。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令,所述指令在被執(zhí)行時(shí)用于實(shí)現(xiàn)權(quán)利要求1所述的方法。
...【技術(shù)特征摘要】
1.一種基于數(shù)據(jù)驅(qū)動(dòng)和學(xué)習(xí)模型預(yù)測(cè)控制的突變軌跡追蹤控制方法,其特征在于,步驟如下:
2.根據(jù)權(quán)利要求1所述一種基于數(shù)據(jù)驅(qū)動(dòng)和學(xué)習(xí)模型預(yù)測(cè)控制的突變軌跡追蹤控制方法,其特征在于,所述步驟2包括:
3.根據(jù)權(quán)利要求2所述一種基于數(shù)據(jù)驅(qū)動(dòng)和學(xué)習(xí)模型預(yù)測(cè)控制的突變軌跡追蹤控制方法,其特征在于,所述步驟2.1中,設(shè)計(jì)長(zhǎng)預(yù)測(cè)時(shí)域的軌跡規(guī)劃問(wèn)題,其優(yōu)化問(wèn)題如下所示:
4.根據(jù)權(quán)利要求3所述一種基于數(shù)據(jù)驅(qū)動(dòng)和學(xué)習(xí)模型預(yù)測(cè)控制的突變軌跡追蹤控制方法,其特征在于,所述步驟2.2中,建立針對(duì)突變軌跡的迭代優(yōu)化模型:
5.根據(jù)權(quán)利要求4所述一種基于數(shù)據(jù)驅(qū)動(dòng)和學(xué)習(xí)模型預(yù)測(cè)控制的突變軌跡追蹤控制方法,其特征在于,所述步驟2.2中,在可行軌跡中選擇最優(yōu)的點(diǎn)作為子終端條件,并設(shè)計(jì)終端松弛條件,具體為:
6.根據(jù)權(quán)利要求5所述一種基于數(shù)據(jù)驅(qū)動(dòng)和學(xué)習(xí)模型預(yù)測(cè)控制的突變軌跡...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:李慧平,楊啟帆,楊坤峰,
申請(qǐng)(專利權(quán))人:西北工業(yè)大學(xué),
類型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。