當(dāng)前位置: 首頁(yè) > 專利查詢>中國(guó)科學(xué)院自動(dòng)化研究所專利>正文

基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法及相關(guān)設(shè)備技術(shù)

技術(shù)編號(hào)：44446437 閱讀：3 留言：0更新日期：2025-02-28 18:52

一種基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法及相關(guān)設(shè)備，涉及人工智能技術(shù)領(lǐng)域。其中方法包括：獲取駕駛場(chǎng)景信息；將所述駕駛場(chǎng)景信息輸入至視覺(jué)語(yǔ)言大模型，獲取所述視覺(jué)語(yǔ)言大模型輸出的自動(dòng)駕駛規(guī)劃參數(shù)，其中，所述視覺(jué)語(yǔ)言大模型是通過(guò)樣本駕駛場(chǎng)景信息和思維鏈微調(diào)得到，所述思維鏈用于輔助所述視覺(jué)語(yǔ)言大模型對(duì)所述樣本駕駛場(chǎng)景信息進(jìn)行多階段推理分析。實(shí)施本發(fā)明專利技術(shù)提供的技術(shù)方案，通過(guò)多階段推理提高了模型輸出的可靠性，增強(qiáng)了自動(dòng)駕駛系統(tǒng)的安全性。

全部詳細(xì)技術(shù)資料下載

【技術(shù)實(shí)現(xiàn)步驟摘要】

本專利技術(shù)涉及人工智能，尤其涉及一種基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法及相關(guān)設(shè)備。

技術(shù)介紹

1、隨著自動(dòng)駕駛技術(shù)的快速發(fā)展，如何實(shí)現(xiàn)高效、安全的自動(dòng)駕駛規(guī)劃成為了當(dāng)前研究的熱點(diǎn)問(wèn)題。在復(fù)雜多變的道路環(huán)境中，自動(dòng)駕駛系統(tǒng)需要快速理解駕駛場(chǎng)景，并做出適當(dāng)?shù)鸟{駛決策，這對(duì)自動(dòng)駕駛規(guī)劃算法提出了較高的要求。

2、目前，大多數(shù)自動(dòng)駕駛規(guī)劃方法主要依賴于人工規(guī)則和傳統(tǒng)機(jī)器學(xué)習(xí)算法。這些方法通常使用預(yù)定義的規(guī)則或模型來(lái)解析駕駛場(chǎng)景，然后基于解析結(jié)果生成相應(yīng)的駕駛規(guī)劃。

3、然而，這些方法在處理復(fù)雜、動(dòng)態(tài)變化的駕駛場(chǎng)景時(shí)仍存在明顯不足。特別是在引入視覺(jué)語(yǔ)言大模型后，視覺(jué)語(yǔ)言大模型可能產(chǎn)生視覺(jué)幻覺(jué)，即在分析駕駛場(chǎng)景時(shí)錯(cuò)誤地理解實(shí)際并不存在的元素或情況。這種視覺(jué)幻覺(jué)可能導(dǎo)致自動(dòng)駕駛系統(tǒng)做出錯(cuò)誤的判斷，嚴(yán)重影響行車安全。

技術(shù)實(shí)現(xiàn)思路

1、本專利技術(shù)提供一種基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法及相關(guān)設(shè)備，通過(guò)多階段推理提高了模型輸出的可靠性，增強(qiáng)了自動(dòng)駕駛系統(tǒng)的安全性。

2、在本專利技術(shù)的第一方面，提供了一種基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法，包括：

3、獲取駕駛場(chǎng)景信息；

4、將所述駕駛場(chǎng)景信息輸入至視覺(jué)語(yǔ)言大模型，獲取所述視覺(jué)語(yǔ)言大模型輸出的自動(dòng)駕駛規(guī)劃參數(shù)，其中，所述視覺(jué)語(yǔ)言大模型是通過(guò)樣本駕駛場(chǎng)景信息和思維鏈微調(diào)得到，所述思維鏈用于輔助所述視覺(jué)語(yǔ)言大模型對(duì)所述樣本駕駛場(chǎng)景信息進(jìn)行多階段推理分析。

5、在本專利技術(shù)的第二

6、在本專利技術(shù)的第三方面，提供了一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其上存儲(chǔ)有計(jì)算機(jī)程序，該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述任一種所述基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法。

7、在本專利技術(shù)的第四方面，提供了一種計(jì)算機(jī)程序產(chǎn)品，包括計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述任一種所述基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法。

8、綜上所述，本專利技術(shù)中提供的一個(gè)或多個(gè)技術(shù)方案，至少具有如下技術(shù)效果或優(yōu)點(diǎn)：

9、通過(guò)將駕駛場(chǎng)景信息輸入經(jīng)過(guò)思維鏈微調(diào)的視覺(jué)語(yǔ)言大模型，能夠獲取適用于當(dāng)前駕駛場(chǎng)景的自動(dòng)駕駛規(guī)劃參數(shù)。這種方法相比于
技術(shù)介紹
中依賴預(yù)定義規(guī)則或模型的傳統(tǒng)方法，具有顯著優(yōu)勢(shì)。首先，經(jīng)過(guò)思維鏈微調(diào)的視覺(jué)語(yǔ)言大模型能夠?qū)︸{駛場(chǎng)景進(jìn)行多階段推理分析，這使得模型能夠更全面、深入地理解復(fù)雜多變的駕駛環(huán)境，從而生成更加適合當(dāng)前場(chǎng)景的規(guī)劃參數(shù)。其次，視覺(jué)語(yǔ)言大模型的引入使得系統(tǒng)具備了更強(qiáng)的語(yǔ)義理解能力和上下文推理能力，能夠更好地處理動(dòng)態(tài)變化的駕駛場(chǎng)景，克服了傳統(tǒng)方法在復(fù)雜場(chǎng)景下的不足。此外，思維鏈的引入有助于緩解視覺(jué)語(yǔ)言大模型可能產(chǎn)生的視覺(jué)幻覺(jué)問(wèn)題，通過(guò)多階段推理提高了模型輸出的可靠性，從而增強(qiáng)了自動(dòng)駕駛系統(tǒng)的安全性。

本文檔來(lái)自技高網(wǎng)...

【技術(shù)保護(hù)點(diǎn)】

1.一種基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法，其特征在于，包括：

2.根據(jù)權(quán)利要求1所述的基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法，其特征在于，所述獲取駕駛場(chǎng)景信息，包括：

3.根據(jù)權(quán)利要求2所述的基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法，其特征在于，所述道路元素包括車道、動(dòng)態(tài)物體以及靜態(tài)物體，所述獲取所述道路元素構(gòu)成的鳥(niǎo)瞰圖，包括：

4.根據(jù)權(quán)利要求1-3中任一項(xiàng)所述的基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法，其特征在于，所述視覺(jué)語(yǔ)言大模型的微調(diào)過(guò)程包括：

5.根據(jù)權(quán)利要求4所述的基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法，其特征在于，所述樣本思維鏈包括第一樣本思維子鏈和第二樣本思維子鏈，所述第一樣本思維子鏈的邏輯順序先于所述第二樣本思維子鏈；

6.根據(jù)權(quán)利要求5所述的基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法，其特征在于，所述將所述樣本駕駛場(chǎng)景信息和所述樣本思維鏈輸入至視覺(jué)語(yǔ)言大模型，獲取所述視覺(jué)語(yǔ)言大模型輸出的樣本自動(dòng)駕駛規(guī)劃參數(shù)，包括：

7.根據(jù)權(quán)利要求4所述的基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法，其特征在于，所述獲取所述樣

8.一種電子設(shè)備，包括存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序，其特征在于，所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法。

9.一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其上存儲(chǔ)有計(jì)算機(jī)程序，其特征在于，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法。

10.一種計(jì)算機(jī)程序產(chǎn)品，包括計(jì)算機(jī)程序，其特征在于，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法。

...

【技術(shù)特征摘要】

1.一種基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法，其特征在于，包括：

2.根據(jù)權(quán)利要求1所述的基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法，其特征在于，所述獲取駕駛場(chǎng)景信息，包括：

6.根據(jù)權(quán)利要求5所述的基于視覺(jué)語(yǔ)言大模型的自動(dòng)駕駛規(guī)劃方法，其特征在于，所述將所述樣本駕駛場(chǎng)景...

【專利技術(shù)屬性】
技術(shù)研發(fā)人員：張啟超，鄭宇鵬，趙冬斌，
申請(qǐng)(專利權(quán))人：中國(guó)科學(xué)院自動(dòng)化研究所，
類型：發(fā)明
國(guó)別省市：

全部詳細(xì)技術(shù)資料下載我是這個(gè)專利的主人

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條評(píng)論

還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

發(fā)布您的意見(jiàn)

相關(guān)領(lǐng)域技術(shù)