System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及信息檢索咨詢,特別是一種基于相關性分析的信息技術咨詢服務方法及系統。
技術介紹
1、信息技術咨詢服務領域近年來經歷了顯著的技術進步,特別是在自然語言處理和信息檢索方面。早期的咨詢服務主要依賴于簡單的關鍵詞匹配和基礎的信息檢索技術,如布爾檢索和向量空間模型。隨著技術的發展,更復雜的算法被引入,如潛在語義分析(lsa)和概率主題模型(如lda)。這些方法在一定程度上提高了檢索的準確性和相關性。近年來,深度學習技術的應用,如循環神經網絡(rnn)和轉換器模型(如bert),進一步推動了自然語言理解和信息檢索的發展,使得系統能夠更好地理解用戶查詢的語義和上下文。
2、然而,盡管取得了這些進展,現有的信息技術咨詢服務系統仍然存在一些顯著的限制。首先,多數系統在處理復雜、多模態的用戶查詢時表現不佳,在整合文本和語音輸入方面存在困難。其次,現有系統往往采用靜態的檢索模型,難以適應用戶的個性化需求和不同領域的專業術語。第三,在構建用戶需求模型時,大多數系統未能充分利用語言學特征和語義結構信息,導致對用戶意圖的理解不夠深入。此外,現有的相關性分析方法通常只考慮有限的維度,如tf-idf或余弦相似度,忽視了文檔的時效性和用戶交互歷史等重要因素。最后,在答案生成階段,許多系統仍然依賴于簡單的抽取式方法,無法提供足夠精細和定制化的回答。
技術實現思路
1、鑒于上述現有存在的問題,提出了本專利技術。
2、因此,本專利技術提供了一種基于相關性分析的信息技術咨詢服務方法及系
3、為解決上述技術問題,本專利技術提供如下技術方案:
4、第一方面,本專利技術實施例提供了一種基于相關性分析的信息技術咨詢服務方法,其包括,提取用戶咨詢請求中的關鍵詞,通過用戶需求模型識別所述關鍵詞中的用戶需求;處理所述用戶需求,執行參數化檢索,對所述參數化檢索的檢索結果進行相關性分析,基于相關性分析的結果生成相關性列表;分析所述相關性列表中的每一條目,輸出符合所述用戶需求的答案集合;整合所述答案集合,形成互動式的問答界面,供用戶查看。
5、作為本專利技術所述基于相關性分析的信息技術咨詢服務方法的一種優選方案,其中:所述用戶咨詢請求的類型包括文本形式、語音形式和文語融合形式。
6、作為本專利技術所述基于相關性分析的信息技術咨詢服務方法的一種優選方案,其中:提取用戶咨詢請求中的關鍵詞,包括如下步驟:對所述用戶咨詢請求進行預處理;所述預處理包括:若所述用戶咨詢請求為語音形式,則轉換為文本形式;若所述用戶咨詢請求為文語融合形式,則分離為文本部分和語音部分,將語音部分轉換為文本形式,并添加語音標記,與文本部分合并;將所有類型的用戶咨詢請求統一轉換為標準化文本格式,并保留所述語音標記。
7、對所述標準化文本進行語言學預處理,得到詞項列表;所述詞項列表中的每個詞項包含詞根形式和對應的詞性標注。
8、計算所述詞項列表中每個詞項的重要程度,具體包括如下步驟:計算所有詞項的標準tf-idf值;其中,對于擁有語音標記的詞項,基于所述標準tf-idf值進行二次處理:
9、m(t,d)=tf-idf(t,d)×(1+log(1+f(t)));
10、其中,m(t,d)表示擁有語音標記的詞項t對文檔d的融合重要度得分;tf-idf(t,d)表示詞項t對文檔d的標準tf-idf值;f(t)為語音特征綜合函數,用于評估詞項t在語音部分的重要性,由語音顯著度、語義關聯度和上下文重要性確定。
11、將m(t,d)作為擁有語音標記的詞項的重要程度;對于沒有語音標記的詞項,將所述標準tf-idf值作為重要程度。
12、將所有詞項按照所述重要程度進行降序排序,遍歷排序后的詞項列表,挑選所述重要程度大于所述篩選閾值的詞項作為關鍵詞;所述篩選閾值根據所有詞項出現的頻率設定。
13、作為本專利技術所述基于相關性分析的信息技術咨詢服務方法的一種優選方案,其中:所述語音特征綜合函數表示為:
14、
15、所述語音顯著度表示為:
16、
17、所述語義關聯度表示為:
18、
19、所述上下文重要性表示為:
20、
21、其中,a(t)表示語音顯著度;b(t)表示語義關聯度;c(t)表示上下文重要性;d(t)表示詞項t的音節持續時間比率;e表示平均音節持續時間;g(t)表示詞項相對音量;h表示平均音量;j(t)表示詞向量相似度;k(t)表示頻率排名歸一化得分;l(t)表示上下文關聯度;n(t)表示詞項t在句子中的位置得分。
22、構建所述用戶需求模型的過程包括如下步驟,對所述關鍵詞進行實體識別,并將識別出的實體進行標記和分類,形成實體信息;分析包含所述關鍵詞的用戶咨詢請求的原始文本,并構建包含所述關鍵詞的依存關系樹;將所述實體信息嵌入所述依存關系樹中,在所述依存關系樹的相應節點標注對應的實體信息,形成包含實體信息的結構化依存關系樹,并作為用戶需求模型。
23、作為本專利技術所述基于相關性分析的信息技術咨詢服務方法的一種優選方案,其中:處理所述用戶需求,執行參數化檢索,包括如下步驟:
24、基于所述用戶需求構建多層次參數化查詢樹,將查詢參數映射到所述多層次參數化查詢樹的不同層級節點;其中,每個節點包含查詢參數類型、取值范圍和權重;基于所述多層次參數化查詢樹執行參數化檢索;所述參數化檢索包括從所述多層次參數化查詢樹的根節點開始,按預設遍歷順序訪問每個節點,根據節點的查詢參數類型、取值范圍和權重構建查詢條件,組合成完整查詢語句并執行,直到達到預設檢索深度或覆蓋所有節點,最后合并所有節點的檢索結果,得到所述參數化檢索的檢索結果。
25、作為本專利技術所述基于相關性分析的信息技術咨詢服務方法的一種優選方案,其中:對所述參數化檢索的檢索結果進行相關性分析,基于相關性分析的結果生成相關性列表,包括如下步驟:采用bm25算法對所述參數化檢索的檢索結果進行相關性分析,輸出相關性得分,作為相關性分析的結果;按照所述相關性得分對所述參數化檢索的檢索結果進行降序排序,并篩選出所述相關性得分高于相關性得分閾值的檢索結果;對篩選后的檢索結果進行去重處理,并根據去重處理后的檢索結果生成相關性列表。
26、作為本專利技術所述基于相關性分析的信息技術咨詢服務方法的一種優選方案,其中:分析所述相關性列表中的每一條目,輸出符合用戶需求的答案集合,包括如下步驟:將所述相關性列表中的每一條目的文檔分割成單獨的句子,對每個句子進行分詞處理,為每個詞匯單位添加詞性標簽;基于所述詞性標簽,識別句子中的動作和參與者,構建語義角色標注;利用所述語義角色標注,計算句子中包含的關鍵詞與所述用戶需求模型中的關鍵詞的重合度;結合所述語義角色標注和所述重合度,評估每個句子的依存關系結構本文檔來自技高網...
【技術保護點】
1.一種基于相關性分析的信息技術咨詢服務方法,其特征在于:包括,
2.如權利要求1所述的基于相關性分析的信息技術咨詢服務方法,其特征在于:所述用戶咨詢請求的類型包括文本形式、語音形式和文語融合形式。
3.如權利要求2所述的基于相關性分析的信息技術咨詢服務方法,其特征在于:提取用戶咨詢請求中的關鍵詞,包括如下步驟:
4.如權利要求3所述的基于相關性分析的信息技術咨詢服務方法,其特征在于:所述語音特征綜合函數表示為:
5.如權利要求4所述的基于相關性分析的信息技術咨詢服務方法,其特征在于:處理所述用戶需求,執行參數化檢索,包括如下步驟:
6.如權利要求5所述的基于相關性分析的信息技術咨詢服務方法,其特征在于:對所述參數化檢索的檢索結果進行相關性分析,基于相關性分析的結果生成相關性列表,包括如下步驟:
7.如權利要求6所述的基于相關性分析的信息技術咨詢服務方法,其特征在于:分析所述相關性列表中的每一條目,輸出符合用戶需求的答案集合,包括如下步驟:
8.一種基于相關性分析的信息技術咨詢服務系統,基于權利要
9.一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,其特征在于:所述處理器執行所述計算機程序時實現權利要求1~7任一所述的基于相關性分析的信息技術咨詢服務方法的步驟。
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于:所述計算機程序被處理器執行時實現權利要求1~7任一所述的基于相關性分析的信息技術咨詢服務方法的步驟。
...【技術特征摘要】
1.一種基于相關性分析的信息技術咨詢服務方法,其特征在于:包括,
2.如權利要求1所述的基于相關性分析的信息技術咨詢服務方法,其特征在于:所述用戶咨詢請求的類型包括文本形式、語音形式和文語融合形式。
3.如權利要求2所述的基于相關性分析的信息技術咨詢服務方法,其特征在于:提取用戶咨詢請求中的關鍵詞,包括如下步驟:
4.如權利要求3所述的基于相關性分析的信息技術咨詢服務方法,其特征在于:所述語音特征綜合函數表示為:
5.如權利要求4所述的基于相關性分析的信息技術咨詢服務方法,其特征在于:處理所述用戶需求,執行參數化檢索,包括如下步驟:
6.如權利要求5所述的基于相關性分析的信息技術咨詢服務方法,其特征在于:對所述參數化檢索的檢索結果進行相關性分析,基于相關...
【專利技術屬性】
技術研發人員:秦小軍,陳生平,熊勇,張燕芳,
申請(專利權)人:廣東科澤信息技術股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。