System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及自然語言處理技術,尤其涉及一種關系抽取模型建立方法、裝置、電子設備及存儲介質。
技術介紹
1、針對政企客戶,尤其是要客,客戶經理會定期拜訪客戶,做深入訪談,訪談內容包括商品使用反饋,潛在客戶意向收集等。
2、目前,在對政企客戶訪談記錄文本進行處理時,傳統方法是客戶經理對政企客戶進行訪談,記錄訪談內容,由于收集的訪談記錄為文本型非結構化數據,需對訪談記錄進行人工分析,由此識別訪談記錄中企業、商家等業務相關方之間的關系。
3、然而,現有的方法在識別訪談記錄中企業與商家等相關方關系時,存在效果不好的問題。
技術實現思路
1、本申請提供一種關系抽取模型建立方法、裝置、電子設備及存儲介質,用以解決現有的方法在識別訪談記錄中企業與商家等相關方關系時,存在效果不好的問題。
2、第一方面,本申請提供一種關系抽取模型建立方法,包括:
3、獲取文本向量,文本向量為將政企客戶訪談記錄輸入至albert模型后,得到的向量;
4、對文本向量進行albert預訓練,得到動態詞向量,其中,動態詞向量包括政企客戶訪談記錄中的整句向量和特征詞向量;
5、根據特征詞向量和高斯圖生成器,得到有向多視圖,其中,有向多視圖包括節點和有向邊,節點表征特征詞,有向邊表征特征詞之間的關系;
6、根據有向多視圖中節點、以及節點之間的有向邊,確定目標節點、以及目標節點表征的圖特征向量;
7、對圖特征向量和整句向量進行拼接處理,得
8、根據拼接向量和分類器,得到抽取關系分類結果。
9、在本申請中,獲取文本向量,包括:
10、獲取政企客戶訪談記錄;
11、對政企客戶訪談記錄進行分詞,得到分詞序列;
12、根據albert模型的嵌入層,對分詞序列進行轉換,得到文本向量。
13、在本申請中,對文本向量進行albert預訓練,得到動態詞向量,包括:
14、將文本向量輸入至albert模型的transformer層,得到初始動態詞向量,transformer層包括多個堆疊而成的transformer單元;
15、對初始動態詞向量進行特征提取,得到動態詞向量。
16、在本申請中,將文本向量輸入至albert模型的transformer層,得到初始動態詞向量,包括:
17、將文本向量輸入至transformer單元中的多頭自注意力模塊,得到文本向量中所有詞的詞表示;
18、將文本向量輸入至transformer單元中的前饋網絡層,得到詞向量;
19、對文本向量中所有詞的詞表示、以及詞向量進行殘差連接處理和歸一化處理,得到初始動態詞向量。
20、在本申請中,根據有向多視圖中節點、以及節點之間的有向邊,確定目標節點、以及目標節點表征的圖特征向量,包括:
21、將有向多視圖輸入密集連接圖卷積層中,確定有向多視圖的結構信息,結構信息表征節點之間的連接關系;
22、根據動態時間規整池化層和有向多視圖的結構信息,確定有向多視圖中節點的入度和出度;
23、根據有向多視圖中節點的入度和出度,從有向多視圖中提取目標有向多視圖,目標有向多視圖包括目標節點、以及目標節點之間的目標有向邊;
24、根據目標有向多視圖,確定目標節點表征的圖特征向量。
25、在本申請中,在根據有向多視圖中節點的入度和出度,從有向多視圖中提取目標有向多視圖之后,方法還包括:
26、將目標有向多視圖輸入密集連接圖卷積層中,確定目標有向多視圖的結構信息,結構信息表征節點之間的連接關系;
27、根據動態時間規整池化層和目標有向多視圖的結構信息,確定目標有向多視圖中節點的入度和出度;
28、根據目標有向多視圖中節點的入度和出度,從目標有向多視圖中提取全局目標有向多視圖;
29、根據全局目標有向多視圖,確定圖特征向量。
30、在本申請中,分類器為softmax分類器,根據拼接向量和分類器,得到抽取關系分類結果,包括:
31、將拼接向量輸入分類器,得到分類結果;
32、對分類結果進行解碼,得到抽取關系分類結果。
33、第二方面,本申請提供一種關系抽取模型建立裝置,包括:
34、獲取模塊,用于獲取文本向量,文本向量為將政企客戶訪談記錄輸入至albert模型后,得到的向量;
35、albert預訓練模塊,用于對文本向量進行albert預訓練,得到動態詞向量,其中,動態詞向量包括政企客戶訪談記錄中的整句向量和特征詞向量;
36、第一得到模塊,用于根據特征詞向量和高斯圖生成器,得到有向多視圖,其中,有向多視圖包括節點和有向邊,節點表征特征詞,有向邊表征特征詞之間的關系;
37、確定模塊,用于根據有向多視圖中節點、以及節點之間的有向邊,確定目標節點、以及目標節點表征的圖特征向量;
38、拼接模塊,用于對圖特征向量和整句向量進行拼接處理,得到拼接向量;
39、第二得到模塊,用于根據拼接向量和分類器,得到抽取關系分類結果。
40、第三方面,本申請提供了一種電子設備,包括:處理器,以及與處理器通信連接的存儲器;
41、存儲器存儲計算機執行指令;
42、處理器執行存儲器存儲的計算機執行指令,以實現本申請的關系抽取模型建立方法。
43、第四方面,一種計算機可讀存儲介質,計算機可讀存儲介質中存儲有計算機執行指令,計算機執行指令被處理器執行時用于實現本申請的關系抽取模型建立方法。
44、本申請提供的一種關系抽取模型建立方法、裝置、電子設備及存儲介質,通過獲取文本向量,其中,文本向量為將政企客戶訪談記錄輸入至albert模型后,得到的向量,對文本向量進行albert預訓練,得到動態詞向量,其中,動態詞向量包括政企客戶訪談記錄中的整句向量和特征詞向量,根據特征詞向量和高斯圖生成器,得到有向多視圖,其中,有向多視圖包括節點和有向邊,節點表征特征詞,有向邊表征特征詞之間的關系,根據有向多視圖中節點、以及節點之間的有向邊,確定目標節點、以及目標節點表征的圖特征向量,對圖特征向量和整句向量進行拼接處理,得到拼接向量,根據拼接向量和分類器,得到抽取關系分類結果的手段,能夠通過albert模型,根據文本向量化后的訪談記錄內容進行albert預訓練,隨后使用高斯生成器根據albert預訓練的結果表示構造一個有向多視圖,經過篩選后,確定有向多視圖中的目標圖表示,最后將有向多視圖中的目標圖表示和基于albert模型的結果表示連接起來進行關系抽取,避免了人工進行關系識別,由此,解決了現有的方法存在效果不好的問題。
本文檔來自技高網...【技術保護點】
1.一種關系抽取模型建立方法,其特征在于,應用于自然語言處理系統,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述獲取文本向量,包括:
3.根據權利要求1所述的方法,其特征在于,所述對所述文本向量進行ALBERT預訓練,得到動態詞向量,包括:
4.根據權利要求3所述的方法,其特征在于,所述將所述文本向量輸入至所述ALBERT模型的Transformer層,得到初始動態詞向量,包括:
5.根據權利要求1所述的方法,其特征在于,所述根據所述有向多視圖中節點、以及所述節點之間的有向邊,確定目標節點、以及所述目標節點表征的圖特征向量,包括:
6.根據權利要求5所述的方法,其特征在于,在所述根據所述有向多視圖中節點的入度和出度,從所述有向多視圖中提取目標有向多視圖之后,所述方法還包括:
7.根據權利要求1所述的方法,其特征在于,所述分類器為SoftMax分類器,所述根據所述拼接向量和分類器,得到抽取關系分類結果,包括:
8.一種關系抽取模型建立裝置,其特征在于,包括:
9.一種電子
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質中存儲有計算機執行指令,所述計算機執行指令被處理器執行時用于實現如權利要求1至7任一項所述的關系抽取模型建立方法。
...【技術特征摘要】
1.一種關系抽取模型建立方法,其特征在于,應用于自然語言處理系統,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述獲取文本向量,包括:
3.根據權利要求1所述的方法,其特征在于,所述對所述文本向量進行albert預訓練,得到動態詞向量,包括:
4.根據權利要求3所述的方法,其特征在于,所述將所述文本向量輸入至所述albert模型的transformer層,得到初始動態詞向量,包括:
5.根據權利要求1所述的方法,其特征在于,所述根據所述有向多視圖中節點、以及所述節點之間的有向邊,確定目標節點、以及所述目標節點表征的圖特征向量,包括:
6.根據權利...
【專利技術屬性】
技術研發人員:陳苗苗,楊坤,趙新,李子騰,
申請(專利權)人:中國聯合網絡通信集團有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。