System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)涉及智能導(dǎo)航,特別涉及一種基于大語言模型思維鏈的機(jī)器人定位導(dǎo)航方法及裝置。
技術(shù)介紹
1、傳統(tǒng)的機(jī)器人導(dǎo)航系統(tǒng)依賴于幾何和物理傳感數(shù)據(jù)進(jìn)行環(huán)境識別和路徑規(guī)劃。這些方法在處理復(fù)雜指令及未知環(huán)境時面臨局限性。近年來,大語言模型(llm)能夠處理并理解復(fù)雜的語言指令,但現(xiàn)有的工作大多采用端到端的方法,這種方法通常缺乏系統(tǒng)的推理過程,不能充分利用模型中蘊(yùn)含的豐富語義信息來優(yōu)化導(dǎo)航任務(wù)。
技術(shù)實現(xiàn)思路
1、本專利技術(shù)提供一種基于大語言模型思維鏈的機(jī)器人定位導(dǎo)航方法及裝置,以解決現(xiàn)有的導(dǎo)航方法通常缺乏系統(tǒng)的推理過程,不能充分利用模型中蘊(yùn)含的豐富語義信息來優(yōu)化導(dǎo)航任務(wù)。
2、本專利技術(shù)第一方面實施例提供一種基于大語言模型思維鏈的機(jī)器人定位導(dǎo)航方法,包括以下步驟:
3、獲取目標(biāo)指令,采集機(jī)器人的當(dāng)前位置,以及所述當(dāng)前位置的圖像信息;
4、利用視覺語言模型對所述目標(biāo)指令和所述當(dāng)前位置的圖像信息進(jìn)行語義分析,生成導(dǎo)航思維鏈;
5、利用語言評分模型對所述導(dǎo)航思維鏈進(jìn)行分析,確定機(jī)器人的下一位置,根據(jù)所述下一位置和所述當(dāng)前位置生成機(jī)器人的導(dǎo)航路線。
6、可選地,在本專利技術(shù)的一個實施例中,利用設(shè)置在機(jī)器人上的gps系統(tǒng)采集機(jī)器人的當(dāng)前位置;利用設(shè)置在機(jī)器人上的攝像頭采集機(jī)器人當(dāng)前位置的圖像信息。
7、可選地,在本專利技術(shù)的一個實施例中,利用視覺語言模型對所述目標(biāo)指令和所述當(dāng)前位置的圖像信息進(jìn)行語義分析,生成導(dǎo)航思維鏈,包括:
8、根據(jù)所述目標(biāo)指令的語義對所述當(dāng)前位置的圖像信息進(jìn)行分析,得到圖像信息中的多個位置點信息,根據(jù)所述多個位置點信息生成由實現(xiàn)所述目標(biāo)指令的多條路徑構(gòu)成的所述導(dǎo)航思維鏈。
9、可選地,在本專利技術(shù)的一個實施例中,根據(jù)所述導(dǎo)航思維鏈和機(jī)器人的當(dāng)前位置,確定機(jī)器人的下一位置,以生成機(jī)器人的導(dǎo)航路線,包括:
10、對所述導(dǎo)航思維鏈中的多條路徑進(jìn)行評分,在多個評分中選擇評分最高的路徑作為機(jī)器人的下一位置,根據(jù)所述下一位置和所述當(dāng)前位置生成機(jī)器人的導(dǎo)航路線。
11、可選地,在本專利技術(shù)的一個實施例中,對所述導(dǎo)航思維鏈中的多條路徑進(jìn)行評分的公式為:
12、s(i)=\sum_{k=1}^{k}w_k\cdot
ext{lm}(c_k|
ext{context})
13、其中,(s(i))表示每個位置i的評分,w_k為特征權(quán)重,(text{lm})表示大語言模型的調(diào)用,(c_k)是關(guān)聯(lián)的語義特征,(text{context})為當(dāng)前的任務(wù)上下文。
14、可選地,在本專利技術(shù)的一個實施例中,在多個評分中選擇評分最高的路徑作為機(jī)器人的下一位置的公式為:
15、text{nextstep}=\arg\max_{s\in
ext{steps}}\left(\alpha\cdot?s(s)-\beta\cdot
ext{dist}(s)\right)
16、其中,(text{nextstep})是選擇的下一步行動,(alpha\)和(beta\)是權(quán)重系數(shù),用來調(diào)整思維鏈評分s(s)和距離成本(text{dist}(s))的影響,(s)表示可能的導(dǎo)航步驟。
17、本專利技術(shù)第二方面實施例提供一種基于大語言模型思維鏈的機(jī)器人定位導(dǎo)航裝置,包括:
18、數(shù)據(jù)采集模塊,用于獲取目標(biāo)指令,采集機(jī)器人的當(dāng)前位置,以及所述當(dāng)前位置的圖像信息;
19、思維鏈路生成模塊,用于利用視覺語言模型對所述目標(biāo)指令和所述當(dāng)前位置的圖像信息進(jìn)行語義分析,生成導(dǎo)航思維鏈;
20、導(dǎo)航?jīng)Q策模塊,用于利用語言評分模型對所述導(dǎo)航思維鏈進(jìn)行分析,確定機(jī)器人的下一位置,根據(jù)所述下一位置和所述當(dāng)前位置生成機(jī)器人的導(dǎo)航路線。
21、可選地,在本專利技術(shù)的一個實施例中,所述數(shù)據(jù)采集模塊具體包括:
22、設(shè)置在機(jī)器人上的gps系統(tǒng),用于采集機(jī)器人的當(dāng)前位置;
23、設(shè)置在機(jī)器人上的攝像頭,用于采集機(jī)器人當(dāng)前位置的圖像信息。
24、可選地,在本專利技術(shù)的一個實施例中,所述思維鏈路生成模塊具體用于根據(jù)所述目標(biāo)指令的語義對所述當(dāng)前位置的圖像信息進(jìn)行分析,得到圖像信息中的多個位置點信息,根據(jù)所述多個位置點信息生成由實現(xiàn)所述目標(biāo)指令的多條路徑構(gòu)成的所述導(dǎo)航思維鏈。
25、可選地,在本專利技術(shù)的一個實施例中,所述導(dǎo)航?jīng)Q策模塊具體用于對所述導(dǎo)航思維鏈中的多條路徑進(jìn)行評分,在多個評分中選擇評分最高的路徑作為機(jī)器人的下一位置,根據(jù)所述下一位置和所述當(dāng)前位置生成機(jī)器人的導(dǎo)航路線。
26、本專利技術(shù)實施例的基于大語言模型思維鏈的機(jī)器人定位導(dǎo)航方法及裝置,通過深入的語義推理優(yōu)化機(jī)器人的導(dǎo)航能力,通過結(jié)合大語言模型生成的思維鏈與環(huán)境的實時感知數(shù)據(jù),能夠在復(fù)雜或未知環(huán)境中實現(xiàn)精準(zhǔn)的定位與導(dǎo)航。
27、本專利技術(shù)附加的方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本專利技術(shù)的實踐了解到。
本文檔來自技高網(wǎng)...【技術(shù)保護(hù)點】
1.一種基于大語言模型思維鏈的機(jī)器人定位導(dǎo)航方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,利用設(shè)置在機(jī)器人上的GPS系統(tǒng)采集機(jī)器人的當(dāng)前位置;利用設(shè)置在機(jī)器人上的攝像頭采集機(jī)器人當(dāng)前位置的圖像信息。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,利用視覺語言模型對所述目標(biāo)指令和所述當(dāng)前位置的圖像信息進(jìn)行語義分析,生成導(dǎo)航思維鏈,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,利用語言評分模型對所述導(dǎo)航思維鏈進(jìn)行分析,確定機(jī)器人的下一位置,以生成機(jī)器人的導(dǎo)航路線,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,對所述導(dǎo)航思維鏈中的多條路徑進(jìn)行評分的公式為:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,在多個評分中選擇評分最高的路徑作為機(jī)器人的下一位置的公式為:
7.一種基于大語言模型思維鏈的機(jī)器人定位導(dǎo)航裝置,其特征在于,包括:
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述數(shù)據(jù)采集模塊具體包括:
9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述思維鏈路生成模塊
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述導(dǎo)航?jīng)Q策模塊具體用于對所述導(dǎo)航思維鏈中的多條路徑進(jìn)行評分,在多個評分中選擇評分最高的路徑作為機(jī)器人的下一位置,根據(jù)所述下一位置和所述當(dāng)前位置生成機(jī)器人的導(dǎo)航路線。
...【技術(shù)特征摘要】
1.一種基于大語言模型思維鏈的機(jī)器人定位導(dǎo)航方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,利用設(shè)置在機(jī)器人上的gps系統(tǒng)采集機(jī)器人的當(dāng)前位置;利用設(shè)置在機(jī)器人上的攝像頭采集機(jī)器人當(dāng)前位置的圖像信息。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,利用視覺語言模型對所述目標(biāo)指令和所述當(dāng)前位置的圖像信息進(jìn)行語義分析,生成導(dǎo)航思維鏈,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,利用語言評分模型對所述導(dǎo)航思維鏈進(jìn)行分析,確定機(jī)器人的下一位置,以生成機(jī)器人的導(dǎo)航路線,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,對所述導(dǎo)航思維鏈中的多條路徑進(jìn)行評分的公式為:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,在...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:陳張,羅謙,吳澤文,張晉博,程敏,
申請(專利權(quán))人:億嘉和科技股份有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。