System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及機(jī)器學(xué)習(xí)、衛(wèi)星導(dǎo)航,特別是一種基于強(qiáng)化學(xué)習(xí)的自動駕駛車輛gnss欺騙攻擊檢測裝置和方法。
技術(shù)介紹
1、隨著通信和自動化技術(shù)的進(jìn)步,道路交通系統(tǒng)的格局發(fā)生了根本性的變化。地面車輛變得越來越自動化,它們之間以及與交通基礎(chǔ)設(shè)施之間的聯(lián)系越來越緊密。為旅行者提供了一個機(jī)會,可以高效地從一個地方移動到另一個地方,并在旅行時將時間用于個人用途。定位、導(dǎo)航和授時(pnt)服務(wù)是自動駕駛汽車(av)導(dǎo)航的關(guān)鍵。全球?qū)Ш叫l(wèi)星系統(tǒng)(gnss)提供基于衛(wèi)星的pnt服務(wù)。在美國,gnss被稱為全球定位系統(tǒng)(gps)。gps是美國國防部于1970年發(fā)射的一組衛(wèi)星,用于軍事用途。一些國家有自己的衛(wèi)星如gps,來提供pnt服務(wù)。在美國,gps提供兩種不同的服務(wù),即標(biāo)準(zhǔn)定位服務(wù)(sps)和精確定位服務(wù)(pps)。pps服務(wù)可用于政府和軍事用途,預(yù)計自動駕駛車輛將使用sps,也稱為民用gps,用于其pnt服務(wù)。
2、自動駕駛汽車需要可靠和實(shí)時的pnt服務(wù)。然而,基于gnss的pnt業(yè)務(wù)的魯棒性和可靠性取決于接收端的強(qiáng)衛(wèi)星信號和無線電通信。衛(wèi)星與gnss接收機(jī)之間的距離較長,導(dǎo)致信號強(qiáng)度降低,gnss?pnt業(yè)務(wù)可靠性下降。gnss信號也容易受到自然漏洞的影響,這些漏洞被稱為無意漏洞。例如,在通過隧道時,自動駕駛車輛可能無法獲得gnss信號。在城市地區(qū),高層建筑會導(dǎo)致多徑傳播,從而產(chǎn)生射頻干擾并降低gnss信號強(qiáng)度。除了這些漏洞外,干擾和欺騙是針對基于gnss的pnt業(yè)務(wù)的常見故意威脅。干擾攻擊通過淹沒高功率受損信號使接收器無法獲得真實(shí)
3、有許多方法可以通過分析gnss信號來檢測復(fù)雜的gnss欺騙攻擊。加密機(jī)制、無編碼互相關(guān)度量、信號統(tǒng)計分析和基于天線的方法是檢測欺騙攻擊的常用技術(shù)。此外,研究人員還使用車載慣性導(dǎo)航系統(tǒng)(ins)和慣性測量單元(imu)傳感器,如陀螺儀和加速度計,通過與基于gnss的位置和加速度信息進(jìn)行比較,計算車輛的位置和加速度,以標(biāo)記欺騙攻擊。然而,由于比例因素和非正交性誤差,這些車載傳感器提供的位置、速度和方向信息不太可靠。此外,這些錯誤會隨著時間的推移而積累。隨著機(jī)器學(xué)習(xí)(ml)和深度學(xué)習(xí)(dl)模型的進(jìn)步,一些研究調(diào)查了使用ml和dl進(jìn)行復(fù)雜欺騙攻擊檢測的潛力。然而,目前還沒有研究使用深度強(qiáng)化學(xué)習(xí)(rl)方法來檢測復(fù)雜的逐回合欺騙攻擊。
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)所要解決的技術(shù)問題是克服現(xiàn)有技術(shù)的不足而提供一種基于強(qiáng)化學(xué)習(xí)的自動駕駛車輛gnss欺騙攻擊檢測裝置和方法,本專利技術(shù)基于低成本的車載傳感器數(shù)據(jù),通過構(gòu)建強(qiáng)化學(xué)習(xí)模型學(xué)習(xí)動作策略,無需直接分析gnss信號特征,就能夠有效檢測gnss欺騙攻擊。
2、本專利技術(shù)為解決上述技術(shù)問題采用以下技術(shù)方案:
3、第一方面,一種基于強(qiáng)化學(xué)習(xí)的自動駕駛車輛gnss欺騙攻擊檢測裝置,包括數(shù)據(jù)處理模塊、行駛距離推算模塊、行駛距離預(yù)測模塊、強(qiáng)化學(xué)習(xí)rl模塊和欺騙攻擊判斷模塊;其中,
4、數(shù)據(jù)處理模塊,用于對車輛在行駛過程中所獲取的gps經(jīng)緯度信息進(jìn)行處理,在不同的位置創(chuàng)建位置移動,從而獲得逐向欺騙攻擊數(shù)據(jù)集和無攻擊數(shù)據(jù)集;
5、行駛距離推算模塊,用于通過gps經(jīng)緯度信息計算地面真值,地面真值是指車輛在兩個連續(xù)時間戳的行駛距離d;
6、行駛距離預(yù)測模塊,用于構(gòu)建深度神經(jīng)網(wǎng)絡(luò)dnn,利用無攻擊數(shù)據(jù)集訓(xùn)練距離預(yù)測深度神經(jīng)網(wǎng)絡(luò),利用訓(xùn)練后的距離預(yù)測深度神經(jīng)網(wǎng)絡(luò)、車輛行駛過程中的gps經(jīng)緯度信息和來自控制區(qū)域網(wǎng)絡(luò)can的方向盤角度、速度和相對加速踏板位置,來預(yù)測車輛在兩個連續(xù)時間戳的預(yù)測距離s;
7、強(qiáng)化學(xué)習(xí)rl模塊,通過逐向欺騙攻擊數(shù)據(jù)集和無攻擊數(shù)據(jù)集進(jìn)行訓(xùn)練,待訓(xùn)練收斂后,用于根據(jù)實(shí)時地面真值和差分距離dd,dd=d-s,實(shí)時更新兩個連續(xù)時間戳之間行駛距離的最大預(yù)測誤差的閾值;
8、欺騙攻擊判斷模塊,用于比較實(shí)時的差分距離dd與強(qiáng)化學(xué)習(xí)rl模塊獲得的閾值,判斷gnss是否受到欺騙攻擊,如果實(shí)時的差分距離dd大于閾值,則gnss受到欺騙攻擊;否則,gnss未受到欺騙攻擊。
9、作為本專利技術(shù)所述的一種基于強(qiáng)化學(xué)習(xí)的自動駕駛車輛gnss欺騙攻擊檢測裝置進(jìn)一步優(yōu)化方案,強(qiáng)化學(xué)習(xí)rl模塊包括強(qiáng)化學(xué)習(xí)代理、獎勵計算單元、動作策略單元和狀態(tài)計算單元,其中,
10、強(qiáng)化學(xué)習(xí)代理,用于獲取實(shí)時地面真值,利用實(shí)時差分距離dd和強(qiáng)化學(xué)習(xí)代理的當(dāng)前狀態(tài)判斷gnss是否受到欺騙攻擊,其中,狀態(tài)是指兩個連續(xù)時間戳之間行駛距離的最大預(yù)測誤差的閾值;
11、獎勵計算單元,用于根據(jù)判斷gnss是否受到欺騙攻擊的結(jié)果和地面真值計算獎勵,該獎勵用于訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò):
12、動作策略單元,用于通過深度學(xué)習(xí)網(wǎng)絡(luò)、地面真值和差分距離,形成狀態(tài)和動作之間的映射關(guān)系,即動作策略;動作包括增大閾值、減小閾值或閾值不變;
13、狀態(tài)計算單元,根據(jù)上一時刻的狀態(tài)以及采取的動作,計算下一時刻的狀態(tài)。
14、作為本專利技術(shù)所述的一種基于強(qiáng)化學(xué)習(xí)的自動駕駛車輛gnss欺騙攻擊檢測裝置進(jìn)一步優(yōu)化方案,逐向欺騙攻擊是指,欺騙者獲取目標(biāo)av的目的地信息后,產(chǎn)生錯誤的gps信號,使av的gps接收器鎖定在欺騙信號上,在控制gps信號后,欺騙者創(chuàng)建一條與實(shí)際路線的所有轉(zhuǎn)彎相匹配的欺騙路線。
15、作為本專利技術(shù)所述的一種基于強(qiáng)化學(xué)習(xí)的自動駕駛車輛gnss欺騙攻擊檢測裝置進(jìn)一步優(yōu)化方案,行駛距離預(yù)測模塊中,構(gòu)建的深度神經(jīng)網(wǎng)絡(luò)包括輸入層、輸出層以及三層全連接隱藏層,以車輛行駛過程中的利用gps經(jīng)緯度信息計算得到的車輛行駛距離和來自控制區(qū)域網(wǎng)絡(luò)can的方向盤角度、速度和相對加速踏板位置,經(jīng)過歸一化處理后,作為深度神經(jīng)網(wǎng)絡(luò)輸入層神經(jīng)元,三層全連接隱藏層神經(jīng)元數(shù)量分別為16、8和4,深度神經(jīng)網(wǎng)絡(luò)輸出為車輛連續(xù)兩個時間戳的行駛距離,選取整流線性單元relu函數(shù)作為激活函數(shù)。
16、作為本專利技術(shù)所述的一種基于強(qiáng)化學(xué)習(xí)的自動駕駛車輛gnss欺騙攻擊檢測裝置進(jìn)一步優(yōu)化方案,在強(qiáng)化學(xué)習(xí)模塊中,rl代理的狀態(tài)輸入是一個根據(jù)兩個連續(xù)時間戳之間行駛距離的最大預(yù)測誤差定義的閾值,rl代理根據(jù)狀態(tài)與訓(xùn)練好的深度學(xué)習(xí)網(wǎng)絡(luò)獲得動作,該動作用于更新閾值,從而用于判斷gnss是否受到欺騙攻擊,對獎勵計算、狀態(tài)計算、rl動作設(shè)計采用以下配置:
17、a、獎勵計算
18、獎勵設(shè)置為:當(dāng)?shù)孛嬲嬷蹬crl代理的判斷一致,則給予正獎勵;否則,給予負(fù)獎勵;
19、b、狀態(tài)計算
20、狀態(tài)配置為:兩個連續(xù)時間戳之間行駛距離的最大預(yù)測誤差;
21、c、rl動作設(shè)計
22、rl動作配置本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種基于強(qiáng)化學(xué)習(xí)的自動駕駛車輛GNSS欺騙攻擊檢測裝置,其特征在于,包括數(shù)據(jù)處理模塊、行駛距離推算模塊、行駛距離預(yù)測模塊、強(qiáng)化學(xué)習(xí)RL模塊和欺騙攻擊判斷模塊;其中,
2.根據(jù)權(quán)利要求1所述的一種基于強(qiáng)化學(xué)習(xí)的自動駕駛車輛GNSS欺騙攻擊檢測裝置,其特征在于,強(qiáng)化學(xué)習(xí)RL模塊包括強(qiáng)化學(xué)習(xí)代理、獎勵計算單元、動作策略單元和狀態(tài)計算單元,其中,
3.根據(jù)權(quán)利要求1所述的一種基于強(qiáng)化學(xué)習(xí)的自動駕駛車輛GNSS欺騙攻擊檢測裝置,其特征在于,逐向欺騙攻擊是指,欺騙者獲取目標(biāo)AV的目的地信息后,產(chǎn)生錯誤的GPS信號,使AV的GPS接收器鎖定在欺騙信號上,在控制GPS信號后,欺騙者創(chuàng)建一條與實(shí)際路線的所有轉(zhuǎn)彎相匹配的欺騙路線。
4.根據(jù)權(quán)利要求1所述的一種基于強(qiáng)化學(xué)習(xí)的自動駕駛車輛GNSS欺騙攻擊檢測裝置,其特征在于,行駛距離預(yù)測模塊中,構(gòu)建的深度神經(jīng)網(wǎng)絡(luò)包括輸入層、輸出層以及三層全連接隱藏層,以車輛行駛過程中的利用GPS經(jīng)緯度信息計算得到的車輛行駛距離和來自控制區(qū)域網(wǎng)絡(luò)CAN的方向盤角度、速度和相對加速踏板位置,經(jīng)過歸一化處理后,作為深度神經(jīng)網(wǎng)絡(luò)輸入層神
5.根據(jù)權(quán)利要求2所述的一種基于強(qiáng)化學(xué)習(xí)的自動駕駛車輛GNSS欺騙攻擊檢測裝置,其特征在于,在強(qiáng)化學(xué)習(xí)模塊中,RL代理的狀態(tài)輸入是一個根據(jù)兩個連續(xù)時間戳之間行駛距離的最大預(yù)測誤差定義的閾值,RL代理根據(jù)狀態(tài)與訓(xùn)練好的深度學(xué)習(xí)網(wǎng)絡(luò)獲得動作,該動作用于更新閾值,從而用于判斷GNSS是否受到欺騙攻擊,對獎勵計算、狀態(tài)計算、RL動作設(shè)計采用以下配置:
6.一種基于強(qiáng)化學(xué)習(xí)的自動駕駛車輛GNSS欺騙攻擊檢測方法,其特征在于,
7.基于權(quán)利要求6所述的一種基于強(qiáng)化學(xué)習(xí)的自動駕駛車輛GNSS欺騙攻擊檢測方法,其特征在于,采取半正矢公式計算兩個連續(xù)時間戳的行駛距離d:
8.基于權(quán)利要求6所述的一種基于強(qiáng)化學(xué)習(xí)的自動駕駛車輛GNSS欺騙攻擊檢測方法,其特征在于,在強(qiáng)化學(xué)習(xí)模塊中,
9.一種計算機(jī)設(shè)備,包括存儲器、處理器,以及存儲在所述存儲器中并能夠在所述處理器上運(yùn)行的計算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計算機(jī)程序時實(shí)現(xiàn)如權(quán)利要求1至5任一項(xiàng)所述的基于強(qiáng)化學(xué)習(xí)的自動駕駛車輛GNSS欺騙攻擊檢測方法的步驟。
10.一種計算機(jī)可讀存儲介質(zhì),所述計算機(jī)可讀存儲介質(zhì)存儲有計算機(jī)程序,其特征在于,所述計算機(jī)程序被處理器執(zhí)行時實(shí)現(xiàn)如權(quán)利要求1至5任一項(xiàng)所述的基于強(qiáng)化學(xué)習(xí)的自動駕駛車輛GNSS欺騙攻擊檢測方法的步驟。
...【技術(shù)特征摘要】
1.一種基于強(qiáng)化學(xué)習(xí)的自動駕駛車輛gnss欺騙攻擊檢測裝置,其特征在于,包括數(shù)據(jù)處理模塊、行駛距離推算模塊、行駛距離預(yù)測模塊、強(qiáng)化學(xué)習(xí)rl模塊和欺騙攻擊判斷模塊;其中,
2.根據(jù)權(quán)利要求1所述的一種基于強(qiáng)化學(xué)習(xí)的自動駕駛車輛gnss欺騙攻擊檢測裝置,其特征在于,強(qiáng)化學(xué)習(xí)rl模塊包括強(qiáng)化學(xué)習(xí)代理、獎勵計算單元、動作策略單元和狀態(tài)計算單元,其中,
3.根據(jù)權(quán)利要求1所述的一種基于強(qiáng)化學(xué)習(xí)的自動駕駛車輛gnss欺騙攻擊檢測裝置,其特征在于,逐向欺騙攻擊是指,欺騙者獲取目標(biāo)av的目的地信息后,產(chǎn)生錯誤的gps信號,使av的gps接收器鎖定在欺騙信號上,在控制gps信號后,欺騙者創(chuàng)建一條與實(shí)際路線的所有轉(zhuǎn)彎相匹配的欺騙路線。
4.根據(jù)權(quán)利要求1所述的一種基于強(qiáng)化學(xué)習(xí)的自動駕駛車輛gnss欺騙攻擊檢測裝置,其特征在于,行駛距離預(yù)測模塊中,構(gòu)建的深度神經(jīng)網(wǎng)絡(luò)包括輸入層、輸出層以及三層全連接隱藏層,以車輛行駛過程中的利用gps經(jīng)緯度信息計算得到的車輛行駛距離和來自控制區(qū)域網(wǎng)絡(luò)can的方向盤角度、速度和相對加速踏板位置,經(jīng)過歸一化處理后,作為深度神經(jīng)網(wǎng)絡(luò)輸入層神經(jīng)元,三層全連接隱藏層神經(jīng)元數(shù)量分別為16、8和4,深度神經(jīng)網(wǎng)絡(luò)輸出為車輛連續(xù)兩個時間戳的行駛距離,選取整流線性單元relu函數(shù)作為激活函數(shù)。
5.根據(jù)...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:陳向東,楊博杰,陳蒙琪,付海旋,
申請(專利權(quán))人:國網(wǎng)信息通信產(chǎn)業(yè)集團(tuán)有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。