System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及智能交通,尤其涉及一種基于深度學(xué)習(xí)的智能網(wǎng)聯(lián)phev多行駛模式自主決策控制方法。
技術(shù)介紹
1、隨著智能交通系統(tǒng)its和人工智能技術(shù)的不斷發(fā)展,傳統(tǒng)汽車與智能網(wǎng)聯(lián)技術(shù)逐漸深入融合,被視為未來汽車發(fā)展的重要方向,大力發(fā)展智能網(wǎng)聯(lián)汽車成為了國際社會的共識。另一方面,智能網(wǎng)聯(lián)汽車綜合了自動駕駛和網(wǎng)絡(luò)互聯(lián)的優(yōu)勢,研究車輛行駛模式的控制方法以提高智能網(wǎng)聯(lián)汽車的安全性、舒適性和能耗經(jīng)濟(jì)性具有十分重要的意義。
2、目前,隨著交通場景的日益復(fù)雜以及智能網(wǎng)聯(lián)汽車icv和智能交通系統(tǒng)its的快速發(fā)展,傳統(tǒng)汽車通常依靠駕駛員經(jīng)驗(yàn)和傳統(tǒng)輔助駕駛系統(tǒng)來操控車輛行駛,并沒有深入的融合智能網(wǎng)聯(lián)信息,面對多變、復(fù)雜的路況,車輛在行駛中的安全性、舒適性以及能耗經(jīng)濟(jì)性難以保證。
3、用于求解智能網(wǎng)聯(lián)汽車最優(yōu)控制問題的方法主要包括基于規(guī)則、優(yōu)化和學(xué)習(xí)等算法。基于規(guī)則邏輯的控制策略其適應(yīng)性和靈活性較低,無法滿足復(fù)雜交通環(huán)境下的需求。基于優(yōu)化的控制方法需要實(shí)時(shí)在線處理大量數(shù)據(jù),對車載處理器要求很高,適應(yīng)復(fù)雜的交通環(huán)境。基于深度強(qiáng)化學(xué)習(xí)理論在車輛自動駕駛領(lǐng)域的研究大多都是關(guān)于車輛跟隨行駛決策,對于在復(fù)雜交通環(huán)境下綜合考慮車輛的安全性、舒適性和能耗經(jīng)濟(jì)性的研究仍需進(jìn)一步深入。
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)的目的在于提供一種基于深度學(xué)習(xí)的智能網(wǎng)聯(lián)phev多行駛模式自主決策控制方法,解決現(xiàn)有技術(shù)中的基于深度強(qiáng)化學(xué)習(xí)理論在車輛自動駕駛領(lǐng)域的研究大多都是關(guān)于車輛跟隨行駛決策,對于在復(fù)雜交通環(huán)境下綜
2、2、為實(shí)現(xiàn)上述目的,本專利技術(shù)提供了一種基于深度學(xué)習(xí)的智能網(wǎng)聯(lián)phev多行駛模式自主決策控制方法,所述基于深度學(xué)習(xí)的智能網(wǎng)聯(lián)phev多行駛模式自主決策控制方法包括如下步驟:
3、s1:在智能網(wǎng)聯(lián)環(huán)境下構(gòu)建三種交通場景,分別為巡航場景、跟馳場景和通行場景;
4、s2:利用its、gps和v2x技術(shù),獲取道路交通信息和前方車輛的基本信息,并構(gòu)建巡航智能網(wǎng)聯(lián)phev行駛模型、跟馳智能網(wǎng)聯(lián)phev行駛模型及通行智能網(wǎng)聯(lián)phev行駛模型,且采用考慮多目標(biāo)函數(shù)的mpc算法求解最優(yōu)行駛車速;
5、s3:基于ddpg算法搭建多目標(biāo)行駛模式自主決策控制模型;
6、s4:采用下一代交通仿真項(xiàng)目的公開數(shù)據(jù)作為深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)集,并提取其中的跟馳巡航數(shù)據(jù)集作為訓(xùn)練集,進(jìn)行算法訓(xùn)練;
7、s5:智能體根據(jù)獲得的獎勵(lì)信號不斷調(diào)整策略,多次訓(xùn)練優(yōu)化后趨于穩(wěn)定,使其探索到一種相對穩(wěn)定的行為策略,并且該策略能夠在環(huán)境中獲得穩(wěn)定的獎勵(lì),最終達(dá)到訓(xùn)練次數(shù)的最大值時(shí)訓(xùn)練終止;
8、s6:使用訓(xùn)練優(yōu)化后的策略和基于規(guī)則式acc控制策略分別在同一典型工況和實(shí)際工況中進(jìn)行仿真測試,并評估行駛模式自主決策控制策略的有效性和適應(yīng)性。
9、其中,在步驟s2中,構(gòu)建巡航智能網(wǎng)聯(lián)phev行駛模型、跟馳智能網(wǎng)聯(lián)phev行駛模型及通行智能網(wǎng)聯(lián)phev行駛模型的具體方法為:
10、巡航智能網(wǎng)聯(lián)phev行駛模型設(shè)計(jì):在車輛處于巡航模式工作時(shí),控制目標(biāo)只需考慮速度與加速度,因此采用實(shí)時(shí)性較好,響應(yīng)快速的pid算法來調(diào)節(jié)車速,以安全性、舒適性和能耗經(jīng)濟(jì)性作為約束條件,基于pid控制實(shí)現(xiàn)對期望速度跟蹤;
11、跟馳智能網(wǎng)聯(lián)phev行駛模型設(shè)計(jì):通過實(shí)時(shí)獲得的交通道路環(huán)境信息和前方車輛狀態(tài)信息,結(jié)合車輛安全間距策略以及縱向動力學(xué)模型,以后車的安全性、舒適性及能耗經(jīng)濟(jì)性綜合最優(yōu)為目標(biāo),基于模型預(yù)測控制控制策略對后車速度進(jìn)行優(yōu)化;
12、通行智能網(wǎng)聯(lián)phev行駛模型設(shè)計(jì):依托智能網(wǎng)聯(lián)環(huán)境,根據(jù)獲取的信號燈信息和前車狀態(tài)信息進(jìn)行目標(biāo)速度的規(guī)劃,建立了基于rbf神經(jīng)網(wǎng)絡(luò)的預(yù)測模型對前車速度進(jìn)行預(yù)測,根據(jù)規(guī)劃的目標(biāo)速度、與前車保持的安全距離為目標(biāo)設(shè)計(jì)目標(biāo)函數(shù),同時(shí)根據(jù)車輛自身和道路的限制,對驅(qū)動轉(zhuǎn)矩、制動力和速度進(jìn)行約束,基于非線性mpc對多目標(biāo)優(yōu)化問題進(jìn)行求解。
13、其中,在步驟s3中,所述ddpg算法采用確定性策略梯度方法與actor-critic算法相結(jié)合,并且所述多目標(biāo)行駛模式自主決策控制模型包括狀態(tài)空間、動作空間和獎勵(lì)函數(shù)。
14、其中,在步驟s3中,所述狀態(tài)空間、動作空間和獎勵(lì)函數(shù)的設(shè)計(jì)具體為:
15、狀態(tài)空間和動作空間的設(shè)計(jì):當(dāng)目標(biāo)車輛在復(fù)雜交通環(huán)境中行駛時(shí),期望行駛模式自主決策控制模型可以根據(jù)獲取到的周邊信息自主決策使用何種行駛模式;
16、在設(shè)計(jì)獎勵(lì)函數(shù)時(shí),需考慮行駛安全性、經(jīng)濟(jì)性和舒適性三個(gè)優(yōu)化目標(biāo)設(shè)計(jì)獎勵(lì)函數(shù)。
17、其中,在步驟s4中,算法訓(xùn)練的具體步驟為:在matlab/simulink中搭建模型進(jìn)行仿真實(shí)驗(yàn),采用下一代交通仿真項(xiàng)目的公開數(shù)據(jù)作為深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)集,提高訓(xùn)練質(zhì)量。
18、其中,在步驟s6中,使用訓(xùn)練優(yōu)化后的策略和基于規(guī)則式acc控制策略分別在同一典型工況和實(shí)際工況中進(jìn)行仿真測試具體包括典型工況仿真結(jié)果分析和實(shí)際工況仿真結(jié)果分析。
19、其中,在步驟s6中,典型工況仿真結(jié)果分析具體為:采用基于規(guī)則邏輯的acc控制策略在相同工況下進(jìn)行仿真分析對比。
20、其中,在步驟s6中,實(shí)際工況仿真結(jié)果分析具體為:在真實(shí)交通場景中的泛化能理。
21、本專利技術(shù)的一種基于深度學(xué)習(xí)的智能網(wǎng)聯(lián)phev多行駛模式自主決策控制方法,通過構(gòu)建巡航場景、跟馳場景和通行場景三種行駛模式,設(shè)計(jì)基于確定性策略梯度算法的狀態(tài)空間與動作空間,并針對行車安全性、乘車舒適性和能耗經(jīng)濟(jì)構(gòu)建多目標(biāo)獎勵(lì)函數(shù),利用馬爾可夫決策過程搭建多目標(biāo)行駛模式自主決策控制模型,保證智能網(wǎng)聯(lián)phev在復(fù)雜環(huán)境下行駛時(shí),可以通過自主決策不同的行駛模式從而規(guī)劃出最優(yōu)目標(biāo)車輛速度,實(shí)現(xiàn)智能網(wǎng)聯(lián)phev在行駛過程中安全性、通行性以及能耗經(jīng)濟(jì)性綜合最優(yōu),進(jìn)一步提高智能車輛在復(fù)雜交通環(huán)境中的決策能力。
本文檔來自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種基于深度學(xué)習(xí)的智能網(wǎng)聯(lián)PHEV多行駛模式自主決策控制方法,其特征在于,包括如下步驟:
2.如權(quán)利要求1所述的基于深度學(xué)習(xí)的智能網(wǎng)聯(lián)PHEV多行駛模式自主決策控制方法,其特征在于,
3.如權(quán)利要求2所述的基于深度學(xué)習(xí)的智能網(wǎng)聯(lián)PHEV多行駛模式自主決策控制方法,其特征在于,
4.如權(quán)利要求3所述的基于深度學(xué)習(xí)的智能網(wǎng)聯(lián)PHEV多行駛模式自主決策控制方法,其特征在于,
5.如權(quán)利要求4所述的基于深度學(xué)習(xí)的智能網(wǎng)聯(lián)PHEV多行駛模式自主決策控制方法,其特征在于,
6.如權(quán)利要求5所述的基于深度學(xué)習(xí)的智能網(wǎng)聯(lián)PHEV多行駛模式自主決策控制方法,其特征在于,
7.如權(quán)利要求6所述的基于深度學(xué)習(xí)的智能網(wǎng)聯(lián)PHEV多行駛模式自主決策控制方法,其特征在于,
8.如權(quán)利要求7所述的基于深度學(xué)習(xí)的智能網(wǎng)聯(lián)PHEV多行駛模式自主決策控制方法,其特征在于,
【技術(shù)特征摘要】
1.一種基于深度學(xué)習(xí)的智能網(wǎng)聯(lián)phev多行駛模式自主決策控制方法,其特征在于,包括如下步驟:
2.如權(quán)利要求1所述的基于深度學(xué)習(xí)的智能網(wǎng)聯(lián)phev多行駛模式自主決策控制方法,其特征在于,
3.如權(quán)利要求2所述的基于深度學(xué)習(xí)的智能網(wǎng)聯(lián)phev多行駛模式自主決策控制方法,其特征在于,
4.如權(quán)利要求3所述的基于深度學(xué)習(xí)的智能網(wǎng)聯(lián)phev多行駛模式自主決策控制方法,其特征在于,
...【專利技術(shù)屬性】
技術(shù)研發(fā)人員:雷貞貞,張帥,薛阿龍,董李法,張?jiān)?/a>,施軍,孟杰,劉娟,
申請(專利權(quán))人:重慶科技大學(xué),
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。