System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專(zhuān)利技術(shù)屬于無(wú)人水下航行器避障,具體涉及一種基于脈沖神經(jīng)網(wǎng)絡(luò)的無(wú)人水下航行器類(lèi)腦避障決策方法、裝置及存儲(chǔ)介質(zhì)。
技術(shù)介紹
1、隨著海洋資源開(kāi)發(fā)需要,秉持發(fā)展海洋領(lǐng)域的戰(zhàn)略方針,無(wú)人水下航行器作為深入探索海洋環(huán)境的重要裝備,因其具備不受線(xiàn)纜約束、水下作業(yè)域廣、安全性好、靈活性強(qiáng)等優(yōu)點(diǎn),能夠自主航行在人類(lèi)難以接近或無(wú)法預(yù)知危險(xiǎn)的海洋環(huán)境,已逐漸成為實(shí)現(xiàn)海洋資源綜合探測(cè)和展現(xiàn)深海綜合實(shí)力的關(guān)鍵海洋裝備,被廣泛應(yīng)用在民用領(lǐng)域中的海洋環(huán)境監(jiān)測(cè)、海洋基礎(chǔ)設(shè)施檢查、水下應(yīng)急救援等任務(wù),并在海洋勘察、編隊(duì)護(hù)航、探測(cè)等方法具有重大應(yīng)用。自主避障技術(shù)作為無(wú)人水下航行器智能安全航行的核心技術(shù)之一,貫穿其水下航行的全過(guò)程,要求無(wú)人水下航行器在面對(duì)復(fù)雜未知水下環(huán)境能夠及時(shí)做出正確決策指令且精準(zhǔn)避開(kāi)障礙物,形成具有自適應(yīng)能力的水下自主避障性能,是無(wú)人水下航行器領(lǐng)域的研究熱點(diǎn)和技術(shù)難點(diǎn)。
2、類(lèi)腦智能避障是計(jì)算神經(jīng)科學(xué)、人工智能等領(lǐng)域的重要研究方向,旨在模擬人腦結(jié)構(gòu)功能和復(fù)雜信息處理機(jī)制,通過(guò)脈沖神經(jīng)網(wǎng)絡(luò)、強(qiáng)化學(xué)習(xí)等技術(shù),形成具有自學(xué)習(xí)和自適應(yīng)能力的類(lèi)似人類(lèi)思維的高級(jí)決策能力,實(shí)現(xiàn)無(wú)人水下航行器在復(fù)雜未知海洋環(huán)境中的自主避障和安全作業(yè)任務(wù)。然而,無(wú)人水下航行器水下作業(yè)要求時(shí)間連續(xù)性,即當(dāng)前時(shí)刻的輸出要基于之前所有時(shí)刻的狀態(tài)數(shù)據(jù)。無(wú)人水下航行器每步?jīng)Q策都需要消耗能量,能效和計(jì)算資源需求問(wèn)題對(duì)于長(zhǎng)時(shí)間巡航、大范圍搜救等任務(wù)來(lái)說(shuō)至關(guān)重要。因此,高效可靠、安全、低能耗的類(lèi)腦避障技術(shù)對(duì)于無(wú)人水下航行器在復(fù)雜水下環(huán)境中實(shí)現(xiàn)自主避障探索具有重要研究意義。
...【技術(shù)保護(hù)點(diǎn)】
1.一種基于脈沖神經(jīng)網(wǎng)絡(luò)的無(wú)人水下航行器類(lèi)腦避障決策方法,其特征在于:包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于脈沖神經(jīng)網(wǎng)絡(luò)的無(wú)人水下航行器類(lèi)腦避障決策方法,其特征在于:所述步驟1所述的原始狀態(tài)信息包括無(wú)人水下航行器到目標(biāo)點(diǎn)的歐氏距離和角度方向、無(wú)人水下航行器的線(xiàn)速度和角速度,以及無(wú)人水下航行器通過(guò)聲納傳感器處理得到的測(cè)距信息;根據(jù)無(wú)人水下航行器與環(huán)境交互,設(shè)置獎(jiǎng)勵(lì)函數(shù):
3.根據(jù)權(quán)利要求1所述的一種基于脈沖神經(jīng)網(wǎng)絡(luò)的無(wú)人水下航行器類(lèi)腦避障決策方法,其特征在于:所述步驟2脈沖神經(jīng)元軟復(fù)位膜電位更新機(jī)制,在膜電位重置時(shí)能夠保留膜電壓超過(guò)閾值的部分,保證當(dāng)前時(shí)刻膜電位數(shù)據(jù)是在上一時(shí)刻膜電位數(shù)據(jù)的基礎(chǔ)上進(jìn)行變化,對(duì)應(yīng)脈沖神經(jīng)網(wǎng)絡(luò)在生物層面上的時(shí)間連續(xù)性;將軟復(fù)位膜電位更新機(jī)制部署在每個(gè)脈沖神經(jīng)元中,確保無(wú)人水下航行器在水下環(huán)境中自主避障探索當(dāng)前時(shí)刻決策要與之前時(shí)刻決策相關(guān)的需求,每條路徑執(zhí)行后才進(jìn)行重置,具有時(shí)間連續(xù)性和生物合理性。
4.根據(jù)權(quán)利要求3所述的一種基于脈沖神經(jīng)網(wǎng)絡(luò)的無(wú)人水下航行器類(lèi)腦避障決策方法,其特征在于:將所述軟復(fù)位膜電位更新
5.根據(jù)權(quán)利要求1所述的一種基于脈沖神經(jīng)網(wǎng)絡(luò)的無(wú)人水下航行器類(lèi)腦避障決策方法,其特征在于:所述步驟3所述的脈沖編碼器采用泊松編碼方式對(duì)原始狀態(tài)信息進(jìn)行編碼,在給定時(shí)間窗口內(nèi)生成脈沖形式的序列作為狀態(tài)輸入信息;所述的脈沖解碼器是將輸出層神經(jīng)元的脈沖序列通過(guò)平均脈沖累加的方式處理成無(wú)人水下航行器自主避障探索所需的動(dòng)作信息;
6.根據(jù)權(quán)利要求1所述的一種基于脈沖神經(jīng)網(wǎng)絡(luò)的無(wú)人水下航行器類(lèi)腦避障決策方法,其特征在于:所述步驟4脈沖神經(jīng)網(wǎng)絡(luò)模型采用Actor-Critic架構(gòu),在DDPG算法的基礎(chǔ)上,將軟復(fù)位脈沖Actor網(wǎng)絡(luò)和深度Critic網(wǎng)絡(luò)相結(jié)合;軟復(fù)位脈沖Actor網(wǎng)絡(luò)由所述軟復(fù)位脈沖神經(jīng)元所搭建的四層全連接層構(gòu)成,保證所述模型自主避障探索具有時(shí)間連續(xù)性,深度Critic網(wǎng)絡(luò)則采用基于人工神經(jīng)網(wǎng)絡(luò)的模型,由傳統(tǒng)人工神經(jīng)元構(gòu)成的四層全連接層組成。
7.根據(jù)權(quán)利要求1所述的一種基于脈沖神經(jīng)網(wǎng)絡(luò)的無(wú)人水下航行器類(lèi)腦避障決策方法,其特征在于:所述步驟5的脈沖神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練過(guò)程包括:
8.根據(jù)權(quán)利要求7所述的一種基于脈沖神經(jīng)網(wǎng)絡(luò)的無(wú)人水下航行器類(lèi)腦避障決策方法,其特征在于:所述軟復(fù)位脈沖Actor網(wǎng)絡(luò)采用STBP算法分別從時(shí)間域和空間域進(jìn)行反向傳播訓(xùn)練,深度Critic部分則采用正常反向傳播算法進(jìn)行網(wǎng)絡(luò)訓(xùn)練;在軟復(fù)位脈沖Actor網(wǎng)絡(luò)前向傳播結(jié)束后,網(wǎng)絡(luò)輸出結(jié)果傳入到深度Critic網(wǎng)絡(luò)的最后一層以生成Q值,軟復(fù)位脈沖Actor網(wǎng)絡(luò)訓(xùn)練的目的是為了產(chǎn)生最大Q值的無(wú)人水下航行器避障決策,如下:
9.一種計(jì)算機(jī)裝置/設(shè)備/系統(tǒng),包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上的計(jì)算機(jī)程序,其特征在于:所述處理器執(zhí)行所述計(jì)算機(jī)程序以實(shí)現(xiàn)權(quán)利要求1至8中任一項(xiàng)所述方法的步驟。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序/指令,其特征在于:該計(jì)算機(jī)程序/指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至8中任一項(xiàng)所述方法的步驟。
...【技術(shù)特征摘要】
1.一種基于脈沖神經(jīng)網(wǎng)絡(luò)的無(wú)人水下航行器類(lèi)腦避障決策方法,其特征在于:包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于脈沖神經(jīng)網(wǎng)絡(luò)的無(wú)人水下航行器類(lèi)腦避障決策方法,其特征在于:所述步驟1所述的原始狀態(tài)信息包括無(wú)人水下航行器到目標(biāo)點(diǎn)的歐氏距離和角度方向、無(wú)人水下航行器的線(xiàn)速度和角速度,以及無(wú)人水下航行器通過(guò)聲納傳感器處理得到的測(cè)距信息;根據(jù)無(wú)人水下航行器與環(huán)境交互,設(shè)置獎(jiǎng)勵(lì)函數(shù):
3.根據(jù)權(quán)利要求1所述的一種基于脈沖神經(jīng)網(wǎng)絡(luò)的無(wú)人水下航行器類(lèi)腦避障決策方法,其特征在于:所述步驟2脈沖神經(jīng)元軟復(fù)位膜電位更新機(jī)制,在膜電位重置時(shí)能夠保留膜電壓超過(guò)閾值的部分,保證當(dāng)前時(shí)刻膜電位數(shù)據(jù)是在上一時(shí)刻膜電位數(shù)據(jù)的基礎(chǔ)上進(jìn)行變化,對(duì)應(yīng)脈沖神經(jīng)網(wǎng)絡(luò)在生物層面上的時(shí)間連續(xù)性;將軟復(fù)位膜電位更新機(jī)制部署在每個(gè)脈沖神經(jīng)元中,確保無(wú)人水下航行器在水下環(huán)境中自主避障探索當(dāng)前時(shí)刻決策要與之前時(shí)刻決策相關(guān)的需求,每條路徑執(zhí)行后才進(jìn)行重置,具有時(shí)間連續(xù)性和生物合理性。
4.根據(jù)權(quán)利要求3所述的一種基于脈沖神經(jīng)網(wǎng)絡(luò)的無(wú)人水下航行器類(lèi)腦避障決策方法,其特征在于:將所述軟復(fù)位膜電位更新機(jī)制部署在每個(gè)脈沖神經(jīng)元中,膜電流、膜電壓和脈沖發(fā)放情況,公式如下:
5.根據(jù)權(quán)利要求1所述的一種基于脈沖神經(jīng)網(wǎng)絡(luò)的無(wú)人水下航行器類(lèi)腦避障決策方法,其特征在于:所述步驟3所述的脈沖編碼器采用泊松編碼方式對(duì)原始狀態(tài)信息進(jìn)行編碼,在給定時(shí)間窗口內(nèi)生成脈沖形式的序列作為狀態(tài)輸入信息;所述的脈沖解碼器是將輸出層神經(jīng)元的脈沖序列通過(guò)平均脈沖累加的方式處理成無(wú)人水下航行器自主避障探...
【專(zhuān)利技術(shù)屬性】
技術(shù)研發(fā)人員:馮偉興,張博洋,張志成,
申請(qǐng)(專(zhuān)利權(quán))人:哈爾濱工程大學(xué),
類(lèi)型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。