System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及信息查詢領域,具體而言,涉及一種信息查詢方法、裝置、電子設備及可讀存儲介質。
技術介紹
1、在信息檢索領域,隨著網絡數據的爆炸性增長,快速準確地從大量文檔中提取有用信息成為一項挑戰。傳統方法,如基于關鍵詞的查詢,盡管普遍,但在處理復雜的查詢需求時存在局限性。
2、針對上述的問題,目前尚未提出有效的解決方案。
技術實現思路
1、本專利技術實施例提供了一種信息查詢方法、裝置、電子設備及可讀存儲介質,以至少解決相關技術中,難以準確查詢對應信息的技術問題。
2、根據本專利技術實施例的一個方面,提供了一種信息查詢方法,包括:獲取目標對象輸入的查詢詞;確定與所述查詢詞對應的多個目標關鍵詞;對于每個目標關鍵詞,確定與每個目標關鍵詞分別對應的多個目標詞頻,并確定與每個目標關鍵詞分別對應的逆文檔頻率,確定每個目標關鍵詞分別對應的多個詞距離因子,其中,所述多個目標詞頻為對分別對應的初始詞頻進行對數平滑處理得到的,多個初始詞頻為對應目標關鍵詞分別在多個目標查詢文檔中出現的次數,與,對應目標查詢文檔中出現的所有詞語的比例,所述逆文檔頻率依據第一數量,第二數量,第三數量,以及第四數量得到,所述第一數量為多個領域相關文檔的文檔總數,所述第二數量為所述多個領域相關文檔中,含有對應目標關鍵詞的文檔數量,所述第三數量為所述多個領域相關文檔中詞語總數,所述第四數量為所述多個領域相關文檔中目標關鍵詞出現的次數,所述多個領域相關文檔為與對應目標關鍵詞相關的領域所包括的文檔;依據與每個
3、可選地,確定與所述查詢詞對應的多個目標關鍵詞,包括:確定所述查詢詞與目標拓撲圖中多個節點分別對應的關聯度,其中,所述多個節點與多個關鍵詞一一對應;依據多個關聯度,確定用于查詢結果的多個目標關鍵詞。
4、可選地,確定所述查詢詞與目標拓撲圖中多個節點分別對應的關聯度之前,還包括:獲取初始拓撲圖與更新拓撲參數,其中,所述更新拓撲參數包括新增關鍵詞對應的新增關鍵詞信息,以及與初始關鍵詞對應的初始關鍵詞信息,所述初始拓撲圖中包括多個目標節點;依據所述初始關鍵詞對應的初始關鍵詞信息,更新所述初始拓撲圖中多個目標節點的權重,并依據所述新增關鍵詞對應的新增關鍵詞信息,在所述初始拓撲圖中增加新增節點,并確定所述新增節點的權重,得到目標拓撲圖,其中,所述新增節點與所述新增關鍵詞對應。
5、可選地,獲取初始拓撲圖,包括:獲取樣本文本;提取所述樣本文本中的多個初始關鍵詞;依據所述多個初始關鍵詞分別對應的詞頻與位置,確定與所述多個初始關鍵詞分別對應的初始權重值;確定與所述多個初始關鍵詞分別對應的關聯詞語;依據所述多個初始關鍵詞,與所述多個初始關鍵詞分別對應的初始權重值與關聯詞語,構建所述初始拓撲圖,其中,所述初始拓撲圖包括多個目標節點,所述多個目標節點與所述多個初始關鍵詞一一對應。
6、可選地,確定每個目標關鍵詞分別對應的詞距離因子,包括:對于每個目標關鍵詞,確定所述目標關鍵詞分別在多個目標查詢文檔中第一次出現的第一位置編號,以及最后一次出現的第二位置編號,以及所述多個目標查詢文檔中所述目標關鍵詞分別出現的數量;依據所述目標關鍵詞分別在多個目標查詢文檔中第一次出現的第一位置編號,以及最后一次出現的第二位置編號,以及所述多個目標查詢文檔中所述目標關鍵詞分別出現的數量,確定所述每個目標關鍵詞分別對應的多個詞距離因子。
7、可選地,確定與每個目標關鍵詞分別對應的逆文檔頻率,包括:對于每個目標關鍵詞,確定所述第一數量與所述第二數量的比例,得到第一比例,并確定所述第三數量與所述第四數量的比例,得到第二比例;確定預定系數值與所述第二比例的和;依據對數化的第一比例,與對數化的所述和,確定與每個目標關鍵詞分別對應的逆文檔頻率。
8、可選地,依據所述多個目標關鍵詞分別對應的子查詢結果,確定與所述查詢詞對應的目標查詢結果之后,還包括:接收所述目標對象對所述目標查詢結果的反饋結果;依據所述反饋結果,調節依據查詢詞調用關鍵詞的方式。
9、根據本專利技術實施例的一個方面,提供了一種信息查詢裝置,包括:獲取模塊,用于獲取目標對象輸入的查詢詞;第一確定模塊,用于確定與所述查詢詞對應的多個目標關鍵詞;第二確定模塊,用于對于每個目標關鍵詞,確定與每個目標關鍵詞分別對應的多個目標詞頻,并確定與每個目標關鍵詞分別對應的逆文檔頻率,確定每個目標關鍵詞分別對應的多個詞距離因子,其中,所述多個目標詞頻為對分別對應的初始詞頻進行對數平滑處理得到的,多個初始詞頻為對應目標關鍵詞分別在多個目標查詢文檔中出現的次數,與,對應目標查詢文檔中出現的所有詞語的比例,所述逆文檔頻率依據第一數量,第二數量,第三數量,以及第四數量得到,所述第一數量為多個領域相關文檔的文檔總數,所述第二數量為所述多個領域相關文檔中,含有對應目標關鍵詞的文檔數量,所述第三數量為所述多個領域相關文檔中詞語總數,所述第四數量為所述多個領域相關文檔中目標關鍵詞出現的次數,所述多個領域相關文檔為與對應目標關鍵詞相關的領域所包括的文檔;第三確定模塊,用于依據與每個目標關鍵詞分別對應的多個目標詞頻,與每個目標關鍵詞分別對應的逆文檔頻率,與每個目標關鍵詞分別對應的多個詞距離因子,確定出與所述多個目標關鍵詞分別對應的子查詢結果;第四確定模塊,用于依據所述多個目標關鍵詞分別對應的子查詢結果,確定與所述查詢詞對應的目標查詢結果。
10、根據本專利技術實施例的一個方面,提供了一種電子設備,包括:處理器;用于存儲所述處理器可執行指令的存儲器;其中,所述處理器被配置為執行所述指令,以實現如上述任一項所述的信息查詢方法。
11、根據本專利技術實施例的一個方面,提供了一種計算機可讀存儲介質,當所述計算機可讀存儲介質中的指令由電子設備的處理器執行時,使得電子設備能夠執行上述任一項所述的信息查詢方法。
12、在本專利技術實施例中,獲取目標對象輸入的查詢詞。確定與查詢詞對應的多個目標關鍵詞。對于每個目標關鍵詞,確定與每個目標關鍵詞分別對應的多個目標詞頻,并確定與每個目標關鍵詞分別對應的逆文檔頻率,確定每個目標關鍵詞分別對應的多個詞距離因子,其中,多個目標詞頻為對分別對應的初始詞頻進行對數平滑處理得到的,多個初始詞頻為對應目標關鍵詞分別在多個目標查詢文檔中出現的次數,與,對應目標查詢文檔中出現的所有詞語的比例,逆文檔頻率依據第一數量,第二數量,第三數量,以及第四數量得到,第一數量為多個領域相關文檔的文檔總數,第二數量為多個領域相關文檔中,含有對應目標關鍵詞的文檔數量,第三數量為多個領域相關文檔中詞語總數,第四數量為多個領域相關文檔中目標關鍵詞出現的次數,多個領域相關文檔為與對應目標關鍵詞相關的領域所包括的文檔。依據與每個目標關鍵詞分別對應的多個本文檔來自技高網...
【技術保護點】
1.一種信息查詢方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,確定與所述查詢詞對應的多個目標關鍵詞,包括:
3.根據權利要求2所述的方法,其特征在于,確定所述查詢詞與目標拓撲圖中多個節點分別對應的關聯度之前,還包括:
4.根據權利要求3所述的方法,其特征在于,獲取初始拓撲圖,包括:
5.根據權利要求1所述的方法,其特征在于,確定每個目標關鍵詞分別對應的詞距離因子,包括:
6.根據權利要求1所述的方法,其特征在于,確定與每個目標關鍵詞分別對應的逆文檔頻率,包括:
7.根據權利要求1至6中任意一項所述的方法,其特征在于,依據所述多個目標關鍵詞分別對應的子查詢結果,確定與所述查詢詞對應的目標查詢結果之后,還包括:
8.一種信息查詢裝置,其特征在于,包括:
9.一種電子設備,其特征在于,包括:
10.一種計算機可讀存儲介質,其特征在于,當所述計算機可讀存儲介質中的指令由電子設備的處理器執行時,使得電子設備能夠執行如權利要求1至7中任一項所述的信息查詢方法。
...【技術特征摘要】
1.一種信息查詢方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,確定與所述查詢詞對應的多個目標關鍵詞,包括:
3.根據權利要求2所述的方法,其特征在于,確定所述查詢詞與目標拓撲圖中多個節點分別對應的關聯度之前,還包括:
4.根據權利要求3所述的方法,其特征在于,獲取初始拓撲圖,包括:
5.根據權利要求1所述的方法,其特征在于,確定每個目標關鍵詞分別對應的詞距離因子,包括:
6.根據權利要求1所述的方法,其特征在于...
【專利技術屬性】
技術研發人員:張宏宇,陳波,杜宏宇,陳曉東,李瑛,高鑫,方曉,楊閏熹,劉乙丁,郝城,陳宇,
申請(專利權)人:國網北京市電力公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。