System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)屬于水下自主航行器運(yùn)動(dòng)控制,具體指一種三維未知環(huán)境下數(shù)模協(xié)同驅(qū)動(dòng)的auv最優(yōu)艏向控制方法。
技術(shù)介紹
1、水下自主航行器(一下簡稱auv)的運(yùn)動(dòng)控制可用于執(zhí)行不同任務(wù),并在最小人為干預(yù)下表現(xiàn)出色,因此在海洋探索、科學(xué)任務(wù)中起著重要作用。其中一些任務(wù),如海洋環(huán)境監(jiān)測(cè)和氣象預(yù)報(bào),要求auv在一定區(qū)域內(nèi)長時(shí)間保持,即區(qū)域保持能力。目前,具有固定點(diǎn)定位或區(qū)域保持能力的船只基本上是全操縱動(dòng)力定位(dp)船只或大型海洋操作平臺(tái)。它可以通過錨地定位或dp系統(tǒng)實(shí)現(xiàn)固定點(diǎn)定位或區(qū)域保持控制。auv的流體力學(xué)系數(shù)會(huì)根據(jù)時(shí)變環(huán)境干擾和auv的運(yùn)動(dòng)信息而變化。這些流體力學(xué)系數(shù)還受到其他自由度(dof)的運(yùn)動(dòng)影響。此外,大多數(shù)auv設(shè)計(jì)為欠驅(qū)動(dòng)配置,其需要控制的dof數(shù)量多于獨(dú)立控制輸入的數(shù)量,以保持在高速行駛時(shí)的執(zhí)行器效率。因此,auv通常是欠驅(qū)動(dòng)、高度非線性和高度耦合的。同時(shí),auv不可避免地會(huì)受到未知的時(shí)變干擾、復(fù)雜的流體力學(xué)和不確定性的影響。由于auv的特性,全操縱動(dòng)力船只的區(qū)域保持控制方法,如錨定定位和dp,不能直接用于實(shí)現(xiàn)auv的區(qū)域保持控制。目前,關(guān)于auv區(qū)域保持控制的研究還很少。因此,對(duì)于auv而言,有效可靠的區(qū)域保持控制仍然是一個(gè)非常具有挑戰(zhàn)性的任務(wù)。
2、水下自主航行器的本體結(jié)構(gòu)非常復(fù)雜,具有高度耦合的非線性特點(diǎn),并且存在結(jié)構(gòu)化和非結(jié)構(gòu)化的不確定性。由于水動(dòng)力環(huán)境的變化,其運(yùn)動(dòng)特性也會(huì)隨之改變,這使得精確的數(shù)學(xué)模型難以獲得,從而為控制系統(tǒng)的設(shè)計(jì)帶來了很大的挑戰(zhàn)。此外,在實(shí)際運(yùn)行中,水下自主航行器人容易受到海洋環(huán)
技術(shù)實(shí)現(xiàn)思路
1、針對(duì)傳統(tǒng)基于模型的控制方法在水下自主航行器三維空間定位中的不足,本專利技術(shù)提出了一種三維未知環(huán)境下數(shù)模協(xié)同驅(qū)動(dòng)的auv最優(yōu)艏向位置控制方法。
2、為解決上訴技術(shù)問題,本專利技術(shù)提出一種三維未知環(huán)境下數(shù)模協(xié)同驅(qū)動(dòng)的auv最優(yōu)艏向控制方法,包括:
3、步驟一:建立未知時(shí)變海流環(huán)境下的欠驅(qū)動(dòng)auv的三維六自由度運(yùn)動(dòng)學(xué)模型和動(dòng)力學(xué)模型;
4、步驟二:基于欠驅(qū)動(dòng)auv的三維運(yùn)動(dòng)學(xué)模型、動(dòng)力學(xué)模型,設(shè)計(jì)能實(shí)現(xiàn)三維最優(yōu)艏向控制的基于位置誤差觀測(cè)信息的滑模控制器;
5、步驟三:針對(duì)滑模控制器在三維未知海流環(huán)境中受到的難以觀測(cè)的干擾力,設(shè)計(jì)基于數(shù)據(jù)驅(qū)動(dòng)的近端策略優(yōu)法ppo強(qiáng)化學(xué)習(xí)算法的補(bǔ)償方案,并構(gòu)建ppo的狀態(tài)空間、動(dòng)作空間和獎(jiǎng)勵(lì)函數(shù);
6、步驟四:基于所建立的狀態(tài)空間、動(dòng)作空間和獎(jiǎng)勵(lì)函數(shù),設(shè)計(jì)ppo算法中的演員網(wǎng)絡(luò)和評(píng)價(jià)者網(wǎng)絡(luò),搭建考慮三維未知時(shí)變海流的仿真場(chǎng)景對(duì)auv進(jìn)行訓(xùn)練,構(gòu)成完整的數(shù)模協(xié)同驅(qū)動(dòng)控制方法;
7、步驟五:訓(xùn)練完成后,強(qiáng)化學(xué)習(xí)根據(jù)欠驅(qū)動(dòng)auv在當(dāng)前三維未知時(shí)變海流影響下的位置和速度實(shí)時(shí)輸出滑模控制中對(duì)應(yīng)的干擾力補(bǔ)償,由滑模控制器輸出最終控制量,實(shí)現(xiàn)期望的控制效果。
8、步驟一具體為:
9、未知時(shí)變海流環(huán)境中三維六自由度auv的運(yùn)動(dòng)學(xué)模型如下:
10、
11、動(dòng)力學(xué)模型如下:
12、
13、其中是從自身運(yùn)動(dòng)坐標(biāo)系到固定坐標(biāo)系的轉(zhuǎn)換矩陣,η=η=[ξ,η,ζ,φ,θ,ψ]t是在固定坐標(biāo)系中由auv當(dāng)前位置(ξ,η,ζ)和橫搖角φ、俯仰角θ、艏向角ψ組成的向量,是auv在自身運(yùn)動(dòng)坐標(biāo)系中的速度,是固定坐標(biāo)系中海流的速度,m是剛體質(zhì)量和附加質(zhì)量慣性矩陣;是剛體重量和附加質(zhì)量科氏向心力據(jù)矩陣;是阻尼力矩陣;τ是auv螺旋槳產(chǎn)生的推力;τc是auv所在環(huán)境對(duì)auv產(chǎn)生的干擾力。
14、步驟二具體為:
15、根據(jù)三維六自由度運(yùn)動(dòng)學(xué)模型和動(dòng)力學(xué)模型,三維欠驅(qū)動(dòng)auv滑模控制分為前進(jìn)控制器和姿態(tài)控制器,前進(jìn)控制器根據(jù)最優(yōu)艏向原理定義ue和pe為前進(jìn)控制器滑模面的誤差,其中ue是auv當(dāng)前速度與期望速度之間的誤差,pe是auv當(dāng)前位置與期望位置之間的誤差,通過控制縱向推力沿著滑模面s1=ue+λ1pe控制auv的位置誤差和速度誤差趨于0,使得auv能夠在未知海流干擾的情況下長時(shí)間保持在虛擬球上,并選擇指數(shù)趨近律,其中ε1、λ1和k1是大于0的待設(shè)計(jì)參數(shù),結(jié)合滑模面函數(shù)和動(dòng)力學(xué)模型可以得到前進(jìn)控制律。
16、姿態(tài)控制器分為俯仰控制器和艏向控制器,為保證達(dá)成最優(yōu)艏向控制,需確保欠驅(qū)動(dòng)auv始終指向虛擬球心,根據(jù)最優(yōu)艏向原理定義qe和θe為俯仰控制器滑模面的誤差,qe和θe分別是auv當(dāng)前俯仰角速度與期望俯仰角速度之間的誤差和auv當(dāng)前俯仰角和期望俯仰角之間的誤差,通過控制俯仰力矩沿著滑模面s2=qe+λ2θe控制auv的俯仰角速度和俯仰角的誤差趨于0,并選擇指數(shù)趨近律,其中ε2、λ2和k2是大于0的待設(shè)計(jì)參數(shù),結(jié)合滑模面函數(shù)和動(dòng)力學(xué)模型可以得到俯仰控制律。
17、根據(jù)最優(yōu)艏向控制原理,為確保欠驅(qū)動(dòng)auv始終指向虛擬球心,需保證當(dāng)前俯仰角達(dá)到期望俯仰角的同時(shí)當(dāng)前艏向角也要達(dá)到期望艏向角,定義re和ψe為艏向控制器滑模面的誤差定義,re和ψe分別是auv當(dāng)前艏向角速度與期望艏向角速度之間的誤差和auv當(dāng)前艏向角和期望艏向角之間的誤差,艏向控制器沿著滑模面s3=re+λ3ψe控制auv的艏向角速度和艏向角的誤差趨于0,并選擇指數(shù)趨近律,其中ε3、λ3和k3是大于0的待設(shè)計(jì)參數(shù),結(jié)合滑模面函數(shù)和動(dòng)力學(xué)模型可以得到艏向控制律。
18、步驟三具體為:
19、由于控制律中包含難以觀測(cè)的干擾力,本專利技術(shù)設(shè)計(jì)強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)以補(bǔ)償未知干擾力,所設(shè)計(jì)的強(qiáng)化學(xué)習(xí)狀態(tài)空間包括:當(dāng)前auv姿態(tài)與當(dāng)前期望姿態(tài)的偏差e1,當(dāng)前auv位置與當(dāng)前期望位置的偏差e2,當(dāng)前auv的速度和姿態(tài);動(dòng)作空間包括:三個(gè)未知干擾力fu、fq和fr;獎(jiǎng)勵(lì)函數(shù)包括:當(dāng)前auv位置與期望位置的偏差e1相關(guān)獎(jiǎng)懲項(xiàng),當(dāng)前auv姿態(tài)與期望姿態(tài)的偏差e2相關(guān)獎(jiǎng)懲項(xiàng)。
20、步驟四具體為:
21、基于步驟三中所設(shè)計(jì)的強(qiáng)化學(xué)習(xí)的狀態(tài)空間、動(dòng)作空間和獎(jiǎng)勵(lì)函數(shù),構(gòu)建合適的演員網(wǎng)絡(luò)和評(píng)價(jià)者網(wǎng)絡(luò),ppo算法所需模型包括四個(gè)網(wǎng)絡(luò),分別是演員(actor)網(wǎng)絡(luò)和評(píng)論者(critic)網(wǎng)絡(luò)以及目標(biāo)actor網(wǎng)絡(luò)和目標(biāo)critic網(wǎng)絡(luò),actor網(wǎng)絡(luò)輸入層為狀態(tài)空間中變量;輸出層輸出各個(gè)滑模控制器中位置的干擾力,以補(bǔ)償未知環(huán)境對(duì)auv造成的擾動(dòng),確保auv能工作在期望的位置和姿態(tài);critic網(wǎng)絡(luò)輸入層本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種三維未知環(huán)境下數(shù)模協(xié)同驅(qū)動(dòng)的AUV最優(yōu)艏向控制方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的三維未知環(huán)境下數(shù)模協(xié)同驅(qū)動(dòng)的AUV最優(yōu)艏向控制方法,其特征在于,所述三維六自由度運(yùn)動(dòng)學(xué)模型如下:
3.根據(jù)權(quán)利要求2所述的三維未知環(huán)境下數(shù)模協(xié)同驅(qū)動(dòng)的AUV最優(yōu)艏向控制方法,其特征在于,所述步驟二具體實(shí)現(xiàn)過程如下:
4.根據(jù)權(quán)利要求3所述的三維未知環(huán)境下數(shù)模協(xié)同驅(qū)動(dòng)的AUV最優(yōu)艏向控制方法,其特征在于,所述步驟三具體實(shí)現(xiàn)過程如下:
5.根據(jù)權(quán)利要求4所述的三維未知環(huán)境下數(shù)模協(xié)同驅(qū)動(dòng)的AUV最優(yōu)艏向控制方法,其特征在于,所述步驟四具體實(shí)現(xiàn)過程如下:
【技術(shù)特征摘要】
1.一種三維未知環(huán)境下數(shù)模協(xié)同驅(qū)動(dòng)的auv最優(yōu)艏向控制方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的三維未知環(huán)境下數(shù)模協(xié)同驅(qū)動(dòng)的auv最優(yōu)艏向控制方法,其特征在于,所述三維六自由度運(yùn)動(dòng)學(xué)模型如下:
3.根據(jù)權(quán)利要求2所述的三維未知環(huán)境下數(shù)模協(xié)同驅(qū)動(dòng)的auv最優(yōu)艏向控制方...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:林嘉興,王博,韓志敏,呂強(qiáng),
申請(qǐng)(專利權(quán))人:杭州電子科技大學(xué),
類型:發(fā)明
國別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。