System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及人工智能,尤其涉及一種基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法及相關(guān)設(shè)備。
技術(shù)介紹
1、隨著自動(dòng)駕駛技術(shù)的快速發(fā)展,如何實(shí)現(xiàn)高效、安全的自動(dòng)駕駛規(guī)劃成為了當(dāng)前研究的熱點(diǎn)問(wèn)題。在復(fù)雜多變的道路環(huán)境中,自動(dòng)駕駛系統(tǒng)需要快速理解駕駛場(chǎng)景,并做出適當(dāng)?shù)鸟{駛決策,這對(duì)自動(dòng)駕駛規(guī)劃算法提出了較高的要求。
2、目前,大多數(shù)自動(dòng)駕駛規(guī)劃方法主要依賴于人工規(guī)則和傳統(tǒng)機(jī)器學(xué)習(xí)算法。這些方法通常使用預(yù)定義的規(guī)則或模型來(lái)解析駕駛場(chǎng)景,然后基于解析結(jié)果生成相應(yīng)的駕駛規(guī)劃。
3、然而,這些方法在處理復(fù)雜、動(dòng)態(tài)變化的駕駛場(chǎng)景時(shí)仍存在明顯不足。特別是在引入視覺(jué)語(yǔ)言大模型后,視覺(jué)語(yǔ)言大模型可能產(chǎn)生視覺(jué)幻覺(jué),即在分析駕駛場(chǎng)景時(shí)錯(cuò)誤地理解實(shí)際并不存在的元素或情況。這種視覺(jué)幻覺(jué)可能導(dǎo)致自動(dòng)駕駛系統(tǒng)做出錯(cuò)誤的判斷,嚴(yán)重影響行車安全。
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)提供一種基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法及相關(guān)設(shè)備,通過(guò)多階段推理提高了模型輸出的可靠性,增強(qiáng)了自動(dòng)駕駛系統(tǒng)的安全性。
2、在本專利技術(shù)的第一方面,提供了一種基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法,包括:
3、獲取駕駛場(chǎng)景信息;
4、將所述駕駛場(chǎng)景信息輸入至視覺(jué)語(yǔ)言大模型,獲取所述視覺(jué)語(yǔ)言大模型輸出的自動(dòng)駕駛規(guī)劃參數(shù),其中,所述視覺(jué)語(yǔ)言大模型是通過(guò)樣本駕駛場(chǎng)景信息和思維鏈微調(diào)得到,所述思維鏈用于輔助所述視覺(jué)語(yǔ)言大模型對(duì)所述樣本駕駛場(chǎng)景信息進(jìn)行多階段推理分析。
5、在本專利技術(shù)的第二
6、在本專利技術(shù)的第三方面,提供了一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述任一種所述基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法。
7、在本專利技術(shù)的第四方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述任一種所述基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法。
8、綜上所述,本專利技術(shù)中提供的一個(gè)或多個(gè)技術(shù)方案,至少具有如下技術(shù)效果或優(yōu)點(diǎn):
9、通過(guò)將駕駛場(chǎng)景信息輸入經(jīng)過(guò)思維鏈微調(diào)的視覺(jué)語(yǔ)言大模型,能夠獲取適用于當(dāng)前駕駛場(chǎng)景的自動(dòng)駕駛規(guī)劃參數(shù)。這種方法相比于
技術(shù)介紹
中依賴預(yù)定義規(guī)則或模型的傳統(tǒng)方法,具有顯著優(yōu)勢(shì)。首先,經(jīng)過(guò)思維鏈微調(diào)的視覺(jué)語(yǔ)言大模型能夠?qū)︸{駛場(chǎng)景進(jìn)行多階段推理分析,這使得模型能夠更全面、深入地理解復(fù)雜多變的駕駛環(huán)境,從而生成更加適合當(dāng)前場(chǎng)景的規(guī)劃參數(shù)。其次,視覺(jué)語(yǔ)言大模型的引入使得系統(tǒng)具備了更強(qiáng)的語(yǔ)義理解能力和上下文推理能力,能夠更好地處理動(dòng)態(tài)變化的駕駛場(chǎng)景,克服了傳統(tǒng)方法在復(fù)雜場(chǎng)景下的不足。此外,思維鏈的引入有助于緩解視覺(jué)語(yǔ)言大模型可能產(chǎn)生的視覺(jué)幻覺(jué)問(wèn)題,通過(guò)多階段推理提高了模型輸出的可靠性,從而增強(qiáng)了自動(dòng)駕駛系統(tǒng)的安全性。
【技術(shù)保護(hù)點(diǎn)】
1.一種基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法,其特征在于,所述獲取駕駛場(chǎng)景信息,包括:
3.根據(jù)權(quán)利要求2所述的基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法,其特征在于,所述道路元素包括車道、動(dòng)態(tài)物體以及靜態(tài)物體,所述獲取所述道路元素構(gòu)成的鳥(niǎo)瞰圖,包括:
4.根據(jù)權(quán)利要求1-3中任一項(xiàng)所述的基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法,其特征在于,所述視覺(jué)語(yǔ)言大模型的微調(diào)過(guò)程包括:
5.根據(jù)權(quán)利要求4所述的基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法,其特征在于,所述樣本思維鏈包括第一樣本思維子鏈和第二樣本思維子鏈,所述第一樣本思維子鏈的邏輯順序先于所述第二樣本思維子鏈;
6.根據(jù)權(quán)利要求5所述的基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法,其特征在于,所述將所述樣本駕駛場(chǎng)景信息和所述樣本思維鏈輸入至視覺(jué)語(yǔ)言大模型,獲取所述視覺(jué)語(yǔ)言大模型輸出的樣本自動(dòng)駕駛規(guī)劃參數(shù),包括:
7.根據(jù)權(quán)利要求4所述的基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法,其特征在于,所述獲取所述樣
8.一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法。
9.一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法。
10.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法。
...【技術(shù)特征摘要】
1.一種基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法,其特征在于,所述獲取駕駛場(chǎng)景信息,包括:
3.根據(jù)權(quán)利要求2所述的基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法,其特征在于,所述道路元素包括車道、動(dòng)態(tài)物體以及靜態(tài)物體,所述獲取所述道路元素構(gòu)成的鳥(niǎo)瞰圖,包括:
4.根據(jù)權(quán)利要求1-3中任一項(xiàng)所述的基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法,其特征在于,所述視覺(jué)語(yǔ)言大模型的微調(diào)過(guò)程包括:
5.根據(jù)權(quán)利要求4所述的基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法,其特征在于,所述樣本思維鏈包括第一樣本思維子鏈和第二樣本思維子鏈,所述第一樣本思維子鏈的邏輯順序先于所述第二樣本思維子鏈;
6.根據(jù)權(quán)利要求5所述的基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法,其特征在于,所述將所述樣本駕駛場(chǎng)景...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:張啟超,鄭宇鵬,趙冬斌,
申請(qǐng)(專利權(quán))人:中國(guó)科學(xué)院自動(dòng)化研究所,
類型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。