System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及知識問答,特別涉及一種海洋牧場裝備智能問答架構建立方法及系統。
技術介紹
1、知識圖譜是通過節點和邊的方式來表示和存儲現實世界中的實體及其相互關系的圖形化數據結構。大語言模型是一種基于深度學習技術的人工智能系統,能夠理解和生成自然語言,廣泛應用于翻譯、對話、寫作輔助等領域。
2、目前,欠缺面向海洋牧場裝備領域的知識圖譜問答的研究,無法更好地滿足實際需要,亟需一種海洋牧場裝備智能問答架構建立方法及系統。
技術實現思路
1、鑒于此,本申請提供一種海洋牧場裝備智能問答架構建立方法及系統,可以建立海洋牧場裝備智能問答架構,輸出的查詢結果較為準確,可以滿足用戶對海洋牧場裝備的知識需求。
2、具體而言,包括以下的技術方案:
3、第一方面,本申請提供海洋牧場裝備智能問答架構建立方法,所述方法包括:
4、根據海洋牧場裝備數據庫、海洋牧場裝備相關企業生產資料和生產經驗,構建海洋牧場裝備領域數據集,并基于所述海洋牧場裝備領域數據集,構建海洋牧場裝備知識圖譜,其中,所述海洋牧場裝備知識圖譜所涉及的知識包括海洋牧場裝置基礎數據、海洋牧場裝置使用方法、海洋牧場裝置故障診斷知識和海洋牧場裝置維護保養數據;
5、根據所述海洋牧場裝備領域數據集和海洋牧場裝備從業人員的使用需求信息,構建意圖洞察引擎;
6、根據bertgate-crf實體抽取模型,抽取用戶原始查詢語句的實體和屬性,其中,所述bertgate-crf實體抽取模型包括be
7、根據tmn時序記憶網絡預設自然語言理解模型和所述用戶原始查詢語句的實體和屬性,識別用戶原始查詢語句的意圖類別;
8、基于所述意圖類別,確定用戶完整查詢語句;
9、將所述用戶完整查詢語句輸入至海洋牧場裝備知識圖譜中,輸出與用戶原始查詢語句對應的查詢結果。
10、在一些實施例中,所述根據海洋牧場裝備數據庫、海洋牧場裝備相關企業生產資料和生產經驗,構建海洋牧場裝備領域數據集,并基于所述海洋牧場裝備領域數據集,構建海洋牧場裝備知識圖譜,包括:
11、抽取和匯總海洋牧場裝備數據庫、海洋牧場裝備相關企業生產資料和生產經驗中的海洋牧場裝備相關內容,得到海洋牧場裝備領域數據集;
12、對所述海洋牧場裝備領域數據集進行隨機抽樣,得到樣本數據集,對所述樣本數據集進行實體類別標注,得到第一標注數據集,其中,實體類別包括建造公司、主要功能、維護措施、注意事項、安裝方式、定義和設施;
13、通過正則表達式,對所述第一標注數據集進行清洗,得到清洗數據集,其中,所述海洋牧場裝備領域數據集中每條數據分別包括一種實體類別的海洋牧場、所述實體類別的海洋牧場對應的相關屬性和屬性值;
14、通過cersa標注方式,對所述清洗數據集進行序列標注,得到第二標注數據集;
15、通過bertgate-crf實體抽取模型抽取第二標注數據集的實體關系,并對所述第二標注數據集的實體關系進行驗證,得到所述第二標注數據集的實體與實體之間的關系;
16、基于neo4j和所述第二標注數據集的實體與關系,構建海洋牧場裝備知識圖譜。
17、在一些實施例中,所述根據所述海洋牧場裝備領域數據集和海洋牧場裝備從業人員的使用需求信息,構建意圖洞察引擎,包括:
18、基于所述海洋牧場裝備領域數據集和海洋牧場裝備從業人員的使用需求信息,構建海洋牧場裝備問答語料數據庫;
19、標注所述海洋牧場裝備問答語料數據庫中數據的實體和詢問意圖,構建問句意圖標注庫;
20、基于所述問句意圖標注庫和預設匹配機制,確定用戶可能搜索的問題,建立意圖洞察引擎。
21、在一些實施例中,所述根據bertgate-crf實體抽取模型,抽取用戶原始查詢語句的實體和屬性,包括:
22、根據bertgate-crf實體抽取模型,抽取用戶原始查詢語句的實體和屬性;
23、通過cersa標注方式,標注所述用戶原始查詢語句的實體和屬性;
24、對所述用戶原始查詢語句的實體和屬性進行規范處理。
25、在一些實施例中,得到所述tmn時序記憶網絡預設自然語言理解模型包括如下訓練步驟:
26、對所述意圖洞察引擎按照7:3的比例劃分為訓練集、驗證集,并對訓練集和驗證集中的問句進行預處理操作,所述預處理操作包括去除停用詞、去除重復詞和去除問句分詞;
27、對預處理后所述訓練集中的問句,通過tf-idf模型進行特征提取,得到第一特征向量,其中,所述第一特征向量的每個維度代表一個單詞,數值表示單詞在所述預處理后所述訓練集中的問句中的重要程度;
28、對預處理后所述訓練集中的問句,通過預訓練bert模型進行編碼,得到第二特征向量;
29、將第一特征向量和第二特征向量通過加權平均進行融合處理,得到混合特征向量;
30、將混合特征向量輸入至分類模型,得到中間意圖分類結果和中間分類模型,所述中間意圖分類結果包括訓練集中的問句的預測分類標簽,所述分類模型包括具有自注意力機制的雙向tmn時序記憶網絡、與所述雙向tmn時序記憶網絡連接的bpnn網絡、與所述bpnn網絡連接的全連接層、softmax激活函數和multi-class?hinge?loss損失函數;
31、響應于所述分類模型的中間意圖分類結果和中間分類模型滿足訓練完成條件,停止訓練。
32、在一些實施例中,得到所述tmn時序記憶網絡預設自然語言理解模型包括如下驗證步驟:
33、基于所述驗證集對訓練完成的中間分類模型進行分類性能評估,得到分類性能評估結果,其中,所述分類性能評估結果包括準確率、精確率、召回率、f1分數;
34、響應于所述分類性能評估結果滿足評估條件,將所述訓練完成的中間分類模型作為tmn時序記憶網絡預設自然語言理解模型;響應于所述分類性能評估結果不滿足評估條件,基于反向傳播算法和adam優化器對訓練完成的中間分類模型進行參數調整,直至所述分類性能評估結果滿足評估條件。
35、在一些實施例中,所述預訓練bert模型包括mlm網絡和與mlm網絡連接的nsp網絡,mlm網絡用于預測被掩碼單詞與真實單詞的差距,nsp網絡用于判斷兩個問句是否相鄰連貫。
36、在一些實施例中,所述基于所述意圖類別,確定用戶完整查詢語句,包括:
37、基于所述意圖洞察引擎,構建面向海洋牧場裝備知識圖譜的查詢語句模板;
38、基于所述查詢語句模板和所述意圖類別,將用戶原始查詢語句補充完整,生成用戶完整查詢語句。
39、在一些實施例中,所述訓練完成條件為從所有訓練輪次得到的中間意圖分類結果中任意抽取三次中間意圖分類結果的準確率不低于90%,所述評估條件為中間分類模型的準確率、精確率、召回率、f1分數連續三本文檔來自技高網...
【技術保護點】
1.海洋牧場裝備智能問答架構建立方法,其特征在于,所述方法包括:
2.根據權利要求1所述的海洋牧場裝備智能問答架構建立方法,其特征在于,所述根據海洋牧場裝備數據庫、海洋牧場裝備相關企業生產資料和生產經驗,構建海洋牧場裝備領域數據集,并基于所述海洋牧場裝備領域數據集,構建海洋牧場裝備知識圖譜,包括:
3.根據權利要求1或2所述的海洋牧場裝備智能問答架構建立方法,其特征在于,所述根據所述海洋牧場裝備領域數據集和海洋牧場裝備從業人員的使用需求信息,構建意圖洞察引擎,包括:
4.根據權利要求1所述的海洋牧場裝備智能問答架構建立方法,其特征在于,所述根據BERTGATE-CRF實體抽取模型,抽取用戶原始查詢語句的實體和屬性,包括:
5.根據權利要求1所述的海洋牧場裝備智能問答架構建立方法,其特征在于,得到所述TMN時序記憶網絡預設自然語言理解模型包括如下訓練步驟:
6.根據權利要求5所述的海洋牧場裝備智能問答架構建立方法,其特征在于,得到所述TMN時序記憶網絡預設自然語言理解模型包括如下驗證步驟:
7.根據權利要求5所
8.根據權利要求4所述的海洋牧場裝備智能問答架構建立方法,其特征在于,所述基于所述意圖類別,確定用戶完整查詢語句,包括:
9.根據權利要求6所述的海洋牧場裝備智能問答架構建立方法,其特征在于,所述訓練完成條件為從所有訓練輪次得到的中間意圖分類結果中任意抽取三次中間意圖分類結果的準確率不低于90%,所述評估條件為中間分類模型的準確率、精確率、召回率、F1分數連續三輪不下降。
10.海洋牧場裝備智能問答架構建立系統,其特征在于,所述系統包括:
...【技術特征摘要】
1.海洋牧場裝備智能問答架構建立方法,其特征在于,所述方法包括:
2.根據權利要求1所述的海洋牧場裝備智能問答架構建立方法,其特征在于,所述根據海洋牧場裝備數據庫、海洋牧場裝備相關企業生產資料和生產經驗,構建海洋牧場裝備領域數據集,并基于所述海洋牧場裝備領域數據集,構建海洋牧場裝備知識圖譜,包括:
3.根據權利要求1或2所述的海洋牧場裝備智能問答架構建立方法,其特征在于,所述根據所述海洋牧場裝備領域數據集和海洋牧場裝備從業人員的使用需求信息,構建意圖洞察引擎,包括:
4.根據權利要求1所述的海洋牧場裝備智能問答架構建立方法,其特征在于,所述根據bertgate-crf實體抽取模型,抽取用戶原始查詢語句的實體和屬性,包括:
5.根據權利要求1所述的海洋牧場裝備智能問答架構建立方法,其特征在于,得到所述tmn時序記憶網絡預設自然語言理解模型包括如下訓練步驟:
6.根據權利要...
【專利技術屬性】
技術研發人員:張海瑜,張雪輝,高志武,李世雄,李瑞,孫博宇,張健柏,王辰,顏玲,朱煙飛,李志飛,
申請(專利權)人:中國農業大學煙臺研究院,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。