System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及人工智能,特別是涉及一種資料查詢方法、裝置、計算機設備、計算機可讀存儲介質和計算機程序產品。
技術介紹
1、知識產權資料搜索查詢系統是一種專門設計用于檢索和管理知識產權的軟件或在線平臺,主要包括但不限于專利、商標、著作權等相關數據,這些系統對從事研發、創新和知識產權管理的個人和組織至關重要,因為它們提供了尋找現有技術、避免侵權、監控競爭對手活動以及制定知識產權策略的必要工具。
2、現有的基于人工智能的知識產權資料搜索查詢系統在使用的過程中存在語義理解不足以及缺乏足夠的深度和廣度,使系統無法準確把握用戶查詢的實際意圖,從而返回與用戶需求不完全匹配的結果,導致無法提供滿足用戶需求的精確數據,影響系統的搜索效率。
技術實現思路
1、基于此,有必要針對上述技術問題,提供一種能夠查詢更加精確的數據的資料查詢方法、裝置、計算機設備、計算機可讀存儲介質和計算機程序產品。
2、第一方面,本申請提供了一種資料查詢方法,包括:
3、獲取資料查詢請求;
4、將所述資料查詢請求輸入文本分析模型中的表征模型,進行特征提取,生成高維表征;
5、將所述高維表征輸入文本分析模型中的標簽預測層,生成標簽序列;
6、通過向量空間模型確定所述標簽序列中每個標簽的權重;根據所述權重和所述標簽序列,生成初始查詢結果;
7、對所述初始查詢結果進行評估和優化,生成資料查詢結果。
8、在其中一個實施例中,將所述高維表征輸入文
9、基于所述高維表征,生成高維表征對應的條件概率;基于所述條件概率,生成標簽序列。
10、在其中一個實施例中,通過向量空間模型確定所述標簽序列中每個標簽的權重,包括:
11、基于所述標簽序列進行查詢,得到初始文檔;確定所述標簽序列中所有標簽在初始文檔中的詞頻;確定所述標簽序列中所有標簽在初始文檔中的逆文檔頻率;基于所述詞頻和所述逆文檔頻率,確定標簽序列中每個標簽的權重。
12、在其中一個實施例中,根據所述權重和所述標簽序列,生成初始查詢結果,包括:
13、根據所述權重,對標簽序列中的各個標簽進行整合,生成整合結果;根據所述整合結果,結合布爾運算符,生成標簽語句;根據所述標簽語句,生成初始查詢結果。
14、在其中一個實施例中,所述根據所述標簽語句,生成初始查詢結果,包括:
15、基于所述標簽語句中的布爾運算符和所述布爾運算符對應的標簽,查詢文檔;所述布爾搜索運算符包括:and運算符、or運算符和not運算符中的至少一種;按照標簽的權重,對查詢到的文檔進行排序,作為初始查詢結果。
16、在其中一個實施例中,表征模型的訓練包括:
17、獲取文本數據;隨機遮擋所述文本數據中的詞匯,將所述遮擋后的文本數據作為模型輸入;將無遮擋的所述文本數據作為真實標簽;基于所述模型輸入和所述標簽,對表征模型進行預訓練;得到預訓練的表征模型;獲取資料數據集;根據所述資料數據集對所述預訓練的表征模型進行再訓練,得到訓練好的表征模型。
18、第二方面,本申請還提供了一種資料查詢裝置,包括:
19、獲取模塊,用于獲取資料查詢請求;
20、表征模塊,用于將所述資料查詢請求輸入文本分析模型中的表征模型,進行特征提取,生成高維表征;
21、預測模塊,用于將所述高維表征輸入文本分析模型中的標簽預測層,生成標簽序列;
22、查詢模塊,用于通過向量空間模型確定所述標簽序列中每個標簽的權重;根據所述權重和所述標簽序列,生成初始查詢結果;
23、優化模塊,用于對所述初始查詢結果進行評估和優化,生成資料查詢結果。
24、第三方面,本申請還提供了一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,所述處理器執行所述計算機程序時實現以下步驟:
25、獲取資料查詢請求;
26、將所述資料查詢請求輸入文本分析模型中的表征模型,進行特征提取,生成高維表征;
27、將所述高維表征輸入文本分析模型中的標簽預測層,生成標簽序列;
28、通過向量空間模型確定所述標簽序列中每個標簽的權重;根據所述權重和所述標簽序列,生成初始查詢結果;
29、對所述初始查詢結果進行評估和優化,生成資料查詢結果。
30、第四方面,本申請還提供了一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行時實現以下步驟:
31、獲取資料查詢請求;
32、將所述資料查詢請求輸入文本分析模型中的表征模型,進行特征提取,生成高維表征;
33、將所述高維表征輸入文本分析模型中的標簽預測層,生成標簽序列;
34、通過向量空間模型確定所述標簽序列中每個標簽的權重;根據所述權重和所述標簽序列,生成初始查詢結果;
35、對所述初始查詢結果進行評估和優化,生成資料查詢結果。
36、第五方面,本申請還提供了一種計算機程序產品,包括計算機程序,該計算機程序被處理器執行時實現以下步驟:
37、獲取資料查詢請求;
38、將所述資料查詢請求輸入文本分析模型中的表征模型,進行特征提取,生成高維表征;
39、將所述高維表征輸入文本分析模型中的標簽預測層,生成標簽序列;
40、通過向量空間模型確定所述標簽序列中每個標簽的權重;根據所述權重和所述標簽序列,生成初始查詢結果;
41、對所述初始查詢結果進行評估和優化,生成資料查詢結果。
42、上述資料查詢方法、裝置、計算機設備、計算機可讀存儲介質和計算機程序產品,首先獲取資料查詢請求;然后將所述資料查詢請求輸入文本分析模型中的表征模型,進行特征提取,生成高維表征;將所述高維表征輸入文本分析模型中的標簽預測層,生成標簽序列;之后通過向量空間模型確定所述標簽序列中每個標簽的權重;根據所述權重和所述標簽序列,生成初始查詢結果;最后對所述初始查詢結果進行評估和優化,生成資料查詢結果。通過文本分析模型和標簽預測層,生成關鍵的標簽序列,再使用向量空間模型對標簽序列中的每個標簽賦予權重,可以精準的搜索到所需要的資料,提高搜索效率。
本文檔來自技高網...【技術保護點】
1.一種資料查詢方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述將所述高維表征輸入文本分析模型中的標簽預測層,生成標簽序列,包括:
3.根據權利要求1所述的方法,其特征在于,所述通過向量空間模型確定所述標簽序列中每個標簽的權重,包括:
4.根據權利要求1所述的方法,其特征在于,所述根據所述權重和所述標簽序列,生成初始查詢結果,包括:
5.根據權利要求4所述的方法,其特征在于,所述根據所述標簽語句,生成初始查詢結果,包括:
6.根據權利要求1所述的方法,其特征在于,所述表征模型的訓練包括:
7.一種資料查詢裝置,其特征在于,所述裝置包括:
8.一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,其特征在于,所述處理器執行所述計算機程序時實現權利要求1至6中任一項所述的方法的步驟。
9.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1至6中任一項所述的方法的步驟。
10.一種計算機程
...【技術特征摘要】
1.一種資料查詢方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述將所述高維表征輸入文本分析模型中的標簽預測層,生成標簽序列,包括:
3.根據權利要求1所述的方法,其特征在于,所述通過向量空間模型確定所述標簽序列中每個標簽的權重,包括:
4.根據權利要求1所述的方法,其特征在于,所述根據所述權重和所述標簽序列,生成初始查詢結果,包括:
5.根據權利要求4所述的方法,其特征在于,所述根據所述標簽語句,生成初始查詢結果,包括:
6.根據權利要求1所述的方法,其特...
【專利技術屬性】
技術研發人員:郭坤,胡章云,黃龍,潘波佳,陳影君,付健,傅治,賴利城,劉松,侯登輝,
申請(專利權)人:南方電網數字平臺科技廣東有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。