System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現(xiàn)步驟摘要】
本專利技術涉及智能駕駛,尤其涉及一種低速無人車的避障規(guī)劃方法、裝置、設備及介質(zhì)。
技術介紹
1、對于自動駕駛車輛,行業(yè)內(nèi)所使用的規(guī)劃算法分為基于策略的規(guī)劃算法和基于數(shù)據(jù)的規(guī)劃算法兩類。前者使用工程師設計的策略以及數(shù)學優(yōu)化等方法通過運算獲得車輛行駛軌跡;后者通過大量的數(shù)據(jù)訓練大模型,通過訓練好的大模型進行軌跡的生成。基于策略的規(guī)劃算法有可解釋性好,安全性高的優(yōu)點,但由于實際的車輛駕駛問題復雜程度相當之高,超過人力所能窮舉的極限,而且高維的非凸優(yōu)化計算耗時極高(自動駕駛問題正是一個此類問題),在真實車輛上無法做到實時運行,因此可以通過數(shù)據(jù)自行學習的基于數(shù)據(jù)的規(guī)劃算法普遍被認為具有更高的上限,是未來更有發(fā)展前景的方向。基于數(shù)據(jù)的規(guī)劃算法有兩種實現(xiàn)方案。
2、一是基于強化學習的方案,但由于強化學習需要對實際環(huán)境的完美模擬,這在棋類運動時可以做得到。但在自動駕駛中,以現(xiàn)有技術無法獲取足夠逼真的仿真器(因為無法模擬真實道路上所有其他車輛/行人的反應),因此無法進行有效的訓練,模擬的真實性問題一直無法有效解決,導致此類方案一直無法大規(guī)模應用。
3、二是使用人類駕駛軌跡為真值的監(jiān)督學習方案,此類方案有兩個不足,一是模型的上限會受人類駕駛的影響,無法做到真正超越人類,且受不同駕駛員的風格影響,可能造成模型輸出結果的風格不統(tǒng)一,偏激進;其次是多很多種類的低速無人車比如低速物流低速無人車,由于沒有駕駛艙的存在,人類駕駛軌跡實際上無法獲取,在無法獲取人類駕駛軌跡的情況下,此類方案也無法應用。即使用人類駕駛軌跡的監(jiān)督學習方案無法應
技術實現(xiàn)思路
1、本專利技術提供了一種低速無人車的避障規(guī)劃方法、裝置、設備及介質(zhì),以實現(xiàn)無人類駕駛軌跡情況下的低速無人車的避障規(guī)劃模型訓練。
2、根據(jù)本專利技術的一方面,提供了一種低速無人車的避障規(guī)劃方法,包括:
3、通過策略避障規(guī)劃器獲取低速無人車對存在至少一個障礙物的真實路況數(shù)據(jù)的初始避障軌跡;
4、根據(jù)所述初始避障軌跡和所述真實路況數(shù)據(jù)對基礎避障規(guī)劃模型進行模仿訓練,得到中間避障規(guī)劃模型;
5、根據(jù)調(diào)優(yōu)損失函數(shù)和所述真實路況數(shù)據(jù)對所述中間避障規(guī)劃模型進行調(diào)優(yōu)訓練,得到目標避障規(guī)劃模型;其中,所述目標避障規(guī)劃模型用于根據(jù)低速無人車的實時路況數(shù)據(jù)確定所述低速無人車的實時避障軌跡。
6、根據(jù)本專利技術的另一方面,提供了一種低速無人車的避障規(guī)劃裝置,包括:
7、軌跡生成模塊,用于通過策略避障規(guī)劃器獲取低速無人車對存在至少一個障礙物的真實路況數(shù)據(jù)的初始避障軌跡;
8、模擬訓練模塊,用于根據(jù)所述初始避障軌跡和所述真實路況數(shù)據(jù)對基礎避障規(guī)劃模型進行模仿訓練,得到中間避障規(guī)劃模型;
9、調(diào)優(yōu)訓練模塊,用于根據(jù)調(diào)優(yōu)損失函數(shù)和所述真實路況數(shù)據(jù)對所述中間避障規(guī)劃模型進行調(diào)優(yōu)訓練,得到目標避障規(guī)劃模型;其中,所述目標避障規(guī)劃模型用于根據(jù)低速無人車的實時路況數(shù)據(jù)確定所述低速無人車的實時避障軌跡。
10、根據(jù)本專利技術的另一方面,提供了一種計算機程序產(chǎn)品,包括計算機程序,所述計算機程序在被處理器執(zhí)行時實現(xiàn)根據(jù)本專利技術任一實施例所述的低速無人車的避障規(guī)劃方法。
11、根據(jù)本專利技術的另一方面,提供了一種電子設備,所述電子設備包括:
12、至少一個處理器;以及
13、與所述至少一個處理器通信連接的存儲器;其中,
14、所述存儲器存儲有可被所述至少一個處理器執(zhí)行的計算機程序,所述計算機程序被所述至少一個處理器執(zhí)行,以使所述至少一個處理器能夠執(zhí)行本專利技術任一實施例所述的低速無人車的避障規(guī)劃方法。
15、根據(jù)本專利技術的另一方面,提供了一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)存儲有計算機指令,所述計算機指令用于使處理器執(zhí)行時實現(xiàn)本專利技術任一實施例所述的低速無人車的避障規(guī)劃方法。
16、本專利技術實施例訓練模型先模仿傳統(tǒng)規(guī)劃器的結果,再通過人工設定的調(diào)優(yōu)損失函數(shù)進行調(diào)優(yōu),從而避免了在訓練過程中使用人類駕駛數(shù)據(jù),這使得本方案中的流程在低速無人送貨車等無法人工駕駛的低速無人車類別中可以適用,并具有理論上更廣的可用范圍和更高的上限。
17、應當理解,本部分所描述的內(nèi)容并非旨在標識本專利技術的實施例的關鍵或重要特征,也不用于限制本專利技術的范圍。本專利技術的其它特征將通過以下的說明書而變得容易理解。
本文檔來自技高網(wǎng)...【技術保護點】
1.一種低速無人車的避障規(guī)劃方法,其特征在于,所述方法包括:
2.根據(jù)權利要求1所述的方法,其特征在于,所述根據(jù)所述初始避障軌跡和所述真實路況數(shù)據(jù)對基礎避障規(guī)劃模型進行模仿訓練,得到中間避障規(guī)劃模型包括:
3.根據(jù)權利要求2所述的方法,其特征在于,所述調(diào)優(yōu)損失函數(shù)包括預設的平滑性損失函數(shù)、安全性損失函數(shù)和效率損失函數(shù),所述根據(jù)調(diào)優(yōu)損失函數(shù)和所述真實路況數(shù)據(jù)對所述中間避障規(guī)劃模型進行調(diào)優(yōu)訓練,得到目標避障規(guī)劃模型包括:
4.根據(jù)權利要求3所述的方法,其特征在于,所述安全性損失函數(shù)是分段函數(shù),表示如下:
5.根據(jù)權利要求3所述的方法,其特征在于,所述效率損失函數(shù)是分段不連續(xù)且不單調(diào)的獎勵函數(shù),表示如下:
6.根據(jù)權利要求1-5任一項所述的方法,其特征在于,所述低速無人車包括下述至少一種:物流低速無人車、低速掃地車和外賣低速無人車;所述避障軌跡對應的避障措施包括下述至少一種:跟車、左側繞行、右側繞行,左側超車、右側超車、錯車和讓行。
7.一種低速無人車的避障規(guī)劃裝置,其特征在于,所述裝置包括:
8.根據(jù)
9.一種電子設備,其特征在于,所述電子設備包括:
10.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)存儲有計算機指令,所述計算機指令用于使處理器執(zhí)行時實現(xiàn)權利要求1-6中任一項所述的低速無人車的避障規(guī)劃方法。
...【技術特征摘要】
1.一種低速無人車的避障規(guī)劃方法,其特征在于,所述方法包括:
2.根據(jù)權利要求1所述的方法,其特征在于,所述根據(jù)所述初始避障軌跡和所述真實路況數(shù)據(jù)對基礎避障規(guī)劃模型進行模仿訓練,得到中間避障規(guī)劃模型包括:
3.根據(jù)權利要求2所述的方法,其特征在于,所述調(diào)優(yōu)損失函數(shù)包括預設的平滑性損失函數(shù)、安全性損失函數(shù)和效率損失函數(shù),所述根據(jù)調(diào)優(yōu)損失函數(shù)和所述真實路況數(shù)據(jù)對所述中間避障規(guī)劃模型進行調(diào)優(yōu)訓練,得到目標避障規(guī)劃模型包括:
4.根據(jù)權利要求3所述的方法,其特征在于,所述安全性損失函數(shù)是分段函數(shù),表示如下:
5.根據(jù)權利要求3所述的方法,其特征在于,所述效率損失函數(shù)是分段不連續(xù)且不單調(diào)的獎勵函數(shù),表示如...
【專利技術屬性】
技術研發(fā)人員:陳至元,趙瑞彬,
申請(專利權)人:九識蘇州智能科技有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。