System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及智能問答,特別是涉及一種基于融合感知rag的開源協作個性化問答方法和系統。
技術介紹
1、隨著開源軟件項目的不斷發展,越來越多的開發者參與到開源協作中。開源軟件的協作模式可能存在特定的工作流程和貢獻機制,這使得參與者必須掌握一定的開源協作知識,才能有效地進行代碼貢獻、問題解決、項目管理等活動。特別是對于開源新手來說,他們需要了解該項目的貢獻文檔、協同流程、所需遵循的標準等內容,以便能夠順利參與到項目中。
2、開發者通常需要通過人工瀏覽開源項目的文檔或手冊、參加討論會、向社區請教等方式,來獲取相關信息和指導。這些方式存在顯著的時間成本高、效率低的問題。為了節省時間和提高效率,開發者們通常會求助于搜索引擎或智能問答工具。搜索引擎依賴關鍵詞匹配,往往無法提供針對具體開發者需求的個性化答案,而且由于開源項目的協作內容和流程復雜多樣,搜索引擎查詢往往難以快速、準確地引導開發者找到最相關的內容。智能問答工具(如“文心一言”等)可以在一定程度上解答開發者的疑問,但它們缺乏對開發者個人背景和上下文的自動和實時感知能力,難以提供量身定制的答案,尤其是在開源協作流程、貢獻標準等具體領域中。
技術實現思路
1、基于此,有必要針對上述技術問題,提供一種基于融合感知rag的開源協作個性化問答方法和系統。
2、一種基于融合感知rag的開源協作個性化問答方法,所述方法包括:
3、獲取開發者提問,根據開發者提問從預先構建的開源協作rag基礎知識庫中檢索,輸出前k個最相
4、對開發者分別進行實時的項目級環境感知和任務級環境感知,生成項目級環境感知語句和任務級環境感知語句;
5、對開發者分別進行個體經驗感知和個體技術專長感知,生成個體經驗感知語句和個體技術專長感知語句;
6、根據所述相關文本集合、項目級環境感知語句、任務級環境感知語句、個體經驗感知語句和個體技術專長感知語句得到上下文,根據所述上下文和所述開發者提問構建提示詞,將所述提示詞輸入大語言模型,得到回答內容。
7、在其中一個實施例中,還包括:所述開源協作rag基礎知識庫包括開源社區中的多源數據;所述多源數據包括社區文檔數據、技術文檔數據、代碼文件數據和社區討論數據。
8、在其中一個實施例中,還包括:判斷開發者是否處于某個開源項目的主頁,若不是,則跳過項目級環境感知;若開發者處于某個開源項目的主頁,則獲取開發者在當前開源項目的前序活動參與度,根據開源項目信息和所述前序活動參與度生成項目級環境感知語句。
9、在其中一個實施例中,還包括:判斷開發者是否處于某個開發任務的討論頁面,若不是,則跳過任務級環境感知;若開發者處于某個開發任務的討論頁面,則根據開發任務信息生成項目級環境感知語句。
10、在其中一個實施例中,還包括:統計開發者在開源平臺的歷史活躍度,根據歷史活躍度生成個體經驗感知語句;所述歷史活躍度包括開發者在開源平臺的參與開源項目個數、提交代碼貢獻次數和開發任務提交次數。
11、在其中一個實施例中,還包括:統計開發者在軟件開發上的技術專長信息,根據所述技術專長信息生成個體技術專長感知語句;所述技術專長信息包括使用最頻繁的前k個編程語言集合和使用最頻繁的前k個編程框架集合。
12、一種基于融合感知rag的開源協作個性化問答系統,所述系統包括:
13、提問檢索模塊,用于獲取開發者提問,根據開發者提問從預先構建的開源協作rag基礎知識庫中檢索,輸出前k個最相關文本,構建相關文本集合;
14、環境感知模塊,用于對開發者分別進行實時的項目級環境感知和任務級環境感知,生成項目級環境感知語句和任務級環境感知語句;
15、個體特征感知模塊,用于對開發者分別進行個體經驗感知和個體技術專長感知,生成個體經驗感知語句和個體技術專長感知語句;
16、回答生成模塊,用于根據所述相關文本集合、項目級環境感知語句、任務級環境感知語句、個體經驗感知語句和個體技術專長感知語句得到上下文,根據所述上下文和所述開發者提問構建提示詞,將所述提示詞輸入大語言模型,得到回答內容。
17、上述基于融合感知rag的開源協作個性化問答方法和系統,首先,基于開發者的項目級感知和任務級感知,系統能夠準確識別開發者當前所處的開源項目和具體任務,從而生成與開發者當前情境高度相關的回答。其次,通過對開發者的個性經驗和技術專長的感知,系統能夠評估其技術水平、經驗背景及熟悉的編程語言與框架,確保回答與其能力和需求相匹配,避免了通用且不適用的解答,將這些多維度信息與rag知識庫檢索結果結合,能夠為大語言模型提供了一個更加豐富和精準的上下文,能夠生成更加個性化且有效的答案。本專利技術實施例,有效提高了問答的相關性和實用性,同時避免了無關信息的干擾,大大減少了開發者查找信息的時間和精力,能夠提升開源項目協作的效率和質量。
本文檔來自技高網...【技術保護點】
1.一種基于融合感知RAG的開源協作個性化問答方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述開源協作RAG基礎知識庫包括開源社區中的多源數據;所述多源數據包括社區文檔數據、技術文檔數據、代碼文件數據和社區討論數據。
3.根據權利要求1所述的方法,其特征在于,根據開發者提問進行項目級環境感知,生成項目級環境感知語句,包括:
4.根據權利要求1所述的方法,其特征在于,根據開發者提問進行任務級環境感知,生成任務級環境感知語句,包括:
5.根據權利要求1所述的方法,其特征在于,根據開發者提問進行個體經驗感知,生成個體經驗感知語句,包括:
6.根據權利要求1所述的方法,其特征在于,根據開發者提問進行個體技術專長感知,生成個體技術專長感知語句,包括:
7.一種基于融合感知RAG的開源協作個性化問答系統,其特征在于,所述系統包括:
8.根據權利要求7所述的系統,其特征在于,所述開源協作RAG基礎知識庫包括開源社區中的多源數據;所述多源數據包括社區文檔數據、技術文檔數據、代碼文件
9.根據權利要求7所述的系統,其特征在于,根據開發者提問進行項目級環境感知,生成項目級環境感知語句,包括:
10.根據權利要求7所述的系統,其特征在于,根據開發者提問進行任務級環境感知,生成任務級環境感知語句,包括:
...【技術特征摘要】
1.一種基于融合感知rag的開源協作個性化問答方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述開源協作rag基礎知識庫包括開源社區中的多源數據;所述多源數據包括社區文檔數據、技術文檔數據、代碼文件數據和社區討論數據。
3.根據權利要求1所述的方法,其特征在于,根據開發者提問進行項目級環境感知,生成項目級環境感知語句,包括:
4.根據權利要求1所述的方法,其特征在于,根據開發者提問進行任務級環境感知,生成任務級環境感知語句,包括:
5.根據權利要求1所述的方法,其特征在于,根據開發者提問進行個體經驗感知,生成個體經驗感知語句,包括:
【專利技術屬性】
技術研發人員:李志星,袁遠,王濤,邢建英,謝徐超,宋振龍,張根,魏登萍,周桐慶,蔣句平,吳秋霖,
申請(專利權)人:中國人民解放軍國防科技大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。