System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)涉及工業(yè)數(shù)據(jù)處理,尤其涉及一種工業(yè)配方和工藝知識答案生成方法及裝置。
技術(shù)介紹
1、現(xiàn)有的技術(shù)在各行業(yè)的私有配方與工藝知識管理和應(yīng)用中均有各自的優(yōu)劣。傳統(tǒng)數(shù)據(jù)庫體系穩(wěn)定但智能化不足;專家系統(tǒng)具備一定的推理能力但靈活性差;知識圖譜能處理復(fù)雜關(guān)系但構(gòu)建和維護(hù)成本高。上述三類主要現(xiàn)有技術(shù)雖然在一定程度上解決了紡織行業(yè)中私有工業(yè)配方與工藝知識的管理和應(yīng)用問題,但其靈活性和智能化程度十分有限,仍存在諸多不足之處:
2、(1)構(gòu)建和維護(hù)成本高:傳統(tǒng)數(shù)據(jù)庫和專家系統(tǒng)依賴人工維護(hù),知識圖譜的構(gòu)建和更新也需要大量人力投入。與此同時,隨著時間推移,數(shù)據(jù)量成指數(shù)增加,特別是面對越來越多的非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),維護(hù)和更新數(shù)據(jù)庫和知識圖譜會變得越來越復(fù)雜。
3、(2)缺乏智能化:系統(tǒng)只能根據(jù)預(yù)定義的結(jié)構(gòu)和查詢語句進(jìn)行操作,缺乏靈活的知識推理和自動化處理能力。規(guī)則一旦定義,很難進(jìn)行動態(tài)調(diào)整。由此可見,這些技術(shù)在知識推理和自動化處理方面能力有限,難以滿足動態(tài)和復(fù)雜的工藝需求。
4、(3)檢索效率低:在面對復(fù)雜查詢和大規(guī)模圖譜時,現(xiàn)有技術(shù)的處理能力受到限制,檢索和推理效率較低,難以實時響應(yīng)用戶需求。
技術(shù)實現(xiàn)思路
1、本專利技術(shù)實施例提供一種工業(yè)配方和工藝知識答案生成方法及裝置,降低行業(yè)知識圖譜的構(gòu)建和維護(hù)成本,提升系統(tǒng)的檢索效率,為用戶提供更加智能化和高效的服務(wù)。
2、為實現(xiàn)上述目的,本申請實施例的第一方面提供了一種工業(yè)配方和工藝知識答案生成方法,包括
3、對工業(yè)配方數(shù)據(jù)和工藝知識數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗與預(yù)處理,得到標(biāo)準(zhǔn)化數(shù)據(jù);
4、對所述標(biāo)準(zhǔn)化數(shù)據(jù)進(jìn)行命名實體識別、關(guān)系抽取和數(shù)據(jù)融合,得到實體集合和關(guān)系集合;
5、根據(jù)所述實體集合和所述關(guān)系集合,形成面向工業(yè)配方和工藝知識的領(lǐng)域知識圖譜;
6、根據(jù)所述領(lǐng)域知識圖譜的節(jié)點(diǎn)屬性和邊屬性,建立倒排索引;
7、根據(jù)所述倒排索引和由用戶輸入問題生成的查詢嵌入向量,對所述領(lǐng)域知識圖譜的節(jié)點(diǎn)和邊進(jìn)行編碼和檢索,得到最優(yōu)子圖;
8、將經(jīng)過文本編碼后的所述用戶輸入問題和經(jīng)圖編碼后的所述最優(yōu)子圖輸入預(yù)設(shè)的大語言模型,生成含自證信息的答案。
9、在第一方面的一種可能的實現(xiàn)方式中,所述工業(yè)配方數(shù)據(jù)和工藝知識數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗與預(yù)處理,得到標(biāo)準(zhǔn)化數(shù)據(jù),具體包括:
10、基于唯一標(biāo)識符,刪除所述工業(yè)配方數(shù)據(jù)和工藝知識數(shù)據(jù)中的重復(fù)項;
11、通過線性插值填補(bǔ)所述工業(yè)配方數(shù)據(jù)和工藝知識數(shù)據(jù)中的缺失值;
12、根據(jù)所述工業(yè)配方數(shù)據(jù)和工藝知識數(shù)據(jù)的均值和標(biāo)準(zhǔn)差,對所述工業(yè)配方數(shù)據(jù)和工藝知識數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。
13、在第一方面的一種可能的實現(xiàn)方式中,所述對所述標(biāo)準(zhǔn)化數(shù)據(jù)進(jìn)行命名實體識別、關(guān)系抽取和數(shù)據(jù)融合,得到實體集合和關(guān)系集合,具體包括:
14、采用roberta模型來識別所述標(biāo)準(zhǔn)化數(shù)據(jù)中的實體;
15、使用預(yù)訓(xùn)練語言模型結(jié)合雙向長短期記憶網(wǎng)絡(luò)識別所述實體之間的關(guān)系;
16、對相似度大于匹配閾值的兩個實體進(jìn)行融合,得到實體集合和關(guān)系集合。
17、在第一方面的一種可能的實現(xiàn)方式中,所述根據(jù)所述實體集合和所述關(guān)系集合,形成面向工業(yè)配方和工藝知識的領(lǐng)域知識圖譜,具體包括:
18、將所述實體集合和所述關(guān)系集合填充于預(yù)設(shè)的不同實體關(guān)系中,將所述不同實體關(guān)系中的實體作為節(jié)點(diǎn),所述不同實體關(guān)系中的關(guān)系作為邊導(dǎo)入圖數(shù)據(jù)庫中,形成面向工業(yè)配方和工藝知識的領(lǐng)域知識圖譜。
19、在第一方面的一種可能的實現(xiàn)方式中,所述根據(jù)所述領(lǐng)域知識圖譜的節(jié)點(diǎn)屬性和邊屬性,建立倒排索引,具體包括:
20、根據(jù)所述領(lǐng)域知識圖譜的節(jié)點(diǎn)屬性,建立若干個節(jié)點(diǎn)屬性字段;
21、根據(jù)所述領(lǐng)域知識圖譜的邊屬性,建立若干個邊屬性字段;
22、記錄全部所述節(jié)點(diǎn)屬性字段的節(jié)點(diǎn)序號和全部所述邊屬性字段的邊序號,建立倒排索引。
23、在第一方面的一種可能的實現(xiàn)方式中,所述根據(jù)所述倒排索引和由用戶輸入問題生成的查詢嵌入向量,對所述領(lǐng)域知識圖譜的節(jié)點(diǎn)和邊進(jìn)行編碼和檢索,得到最優(yōu)子圖之前,還包括:
24、將用戶輸入問題輸入應(yīng)用語言模型,應(yīng)用預(yù)設(shè)的編碼策略,生成查詢嵌入向量。
25、在第一方面的一種可能的實現(xiàn)方式中,所述根據(jù)所述倒排索引和由用戶輸入問題生成的查詢嵌入向量,對所述領(lǐng)域知識圖譜的節(jié)點(diǎn)和邊進(jìn)行編碼和檢索,得到最優(yōu)子圖,具體包括:
26、應(yīng)用所述預(yù)設(shè)的編碼策略,對所述領(lǐng)域知識圖譜的節(jié)點(diǎn)和邊分別進(jìn)行編碼;
27、利用k-最近鄰檢索方法,識別出與所述查詢嵌入向量之間相似度最大的所述領(lǐng)域知識圖譜的節(jié)點(diǎn)作為最相關(guān)節(jié)點(diǎn),并識別出與所述查詢嵌入向量之間相似度最大的所述領(lǐng)域知識圖譜的邊作為最相關(guān)邊。
28、在第一方面的一種可能的實現(xiàn)方式中,所述將經(jīng)過文本編碼后的所述用戶輸入問題和經(jīng)圖編碼后的所述最優(yōu)子圖輸入預(yù)設(shè)的大語言模型,生成含自證信息的答案,具體包括:
29、通過文本嵌入器對所述用戶輸入問題進(jìn)行文本編碼,得到查詢輸入;
30、通過含多層感知機(jī)的圖編碼器將所述最優(yōu)子圖與預(yù)設(shè)的大語言模型的向量空間對齊,得到圖輸入;
31、將所述查詢輸入和圖輸入一同輸入所述預(yù)設(shè)的大語言模型,生成含決策建議和自證信息的答案;所述自證信息為所述決策建議的解釋信息。
32、在第一方面的一種可能的實現(xiàn)方式中,所述預(yù)設(shè)的大語言模型為引入增強(qiáng)注意力機(jī)制的開源大語言模型或商用大語言模型。
33、本申請實施例的第二方面提供了一種工業(yè)配方和工藝知識答案生成裝置,包括:
34、標(biāo)準(zhǔn)化模塊,用于對工業(yè)配方數(shù)據(jù)和工藝知識數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗與預(yù)處理,得到標(biāo)準(zhǔn)化數(shù)據(jù);
35、融合模塊,用于對所述標(biāo)準(zhǔn)化數(shù)據(jù)進(jìn)行命名實體識別、關(guān)系抽取和數(shù)據(jù)融合,得到實體集合和關(guān)系集合;
36、圖譜模塊,用于根據(jù)所述實體集合和所述關(guān)系集合,形成面向工業(yè)配方和工藝知識的領(lǐng)域知識圖譜;
37、建立模塊,用于根據(jù)所述領(lǐng)域知識圖譜的節(jié)點(diǎn)屬性和邊屬性,建立倒排索引;
38、子圖模塊,用于根據(jù)所述倒排索引和由用戶輸入問題生成的查詢嵌入向量,對所述領(lǐng)域知識圖譜的節(jié)點(diǎn)和邊進(jìn)行編碼和檢索,得到最優(yōu)子圖;
39、生成模塊,用于將經(jīng)過文本編碼后的所述用戶輸入問題和經(jīng)圖編碼后的所述最優(yōu)子圖輸入預(yù)設(shè)的大語言模型,生成含自證信息的答案。
40、相比于現(xiàn)有技術(shù),本專利技術(shù)實施例提供的一種工業(yè)配方和工藝知識答案生成方法及裝置,通過數(shù)據(jù)清洗與預(yù)處理,確保了數(shù)據(jù)的高質(zhì)量;通過命名實體識別和關(guān)系抽取,系統(tǒng)能夠準(zhǔn)確識別和提取數(shù)據(jù)中的關(guān)鍵實體和它們之間的關(guān)系,為構(gòu)建知識圖譜提供了結(jié)構(gòu)化信息,然后將實體和關(guān)系轉(zhuǎn)換為圖數(shù)據(jù)庫中的節(jié)點(diǎn)和邊,形成了結(jié)構(gòu)化的知識圖譜,便于復(fù)雜關(guān)系的管理和查詢。接著通過建立倒排索引,系統(tǒng)能夠在大規(guī)模數(shù)本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種工業(yè)配方和工藝知識答案生成方法,其特征在于,包括:
2.如權(quán)利要求1所述一種工業(yè)配方和工藝知識答案生成方法,其特征在于,所述工業(yè)配方數(shù)據(jù)和工藝知識數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗與預(yù)處理,得到標(biāo)準(zhǔn)化數(shù)據(jù),具體包括:
3.如權(quán)利要求1所述一種工業(yè)配方和工藝知識答案生成方法,其特征在于,所述對所述標(biāo)準(zhǔn)化數(shù)據(jù)進(jìn)行命名實體識別、關(guān)系抽取和數(shù)據(jù)融合,得到實體集合和關(guān)系集合,具體包括:
4.如權(quán)利要求1所述一種工業(yè)配方和工藝知識答案生成方法,其特征在于,所述根據(jù)所述實體集合和所述關(guān)系集合,形成面向工業(yè)配方和工藝知識的領(lǐng)域知識圖譜,具體包括:
5.如權(quán)利要求1所述一種工業(yè)配方和工藝知識答案生成方法,其特征在于,所述根據(jù)所述領(lǐng)域知識圖譜的節(jié)點(diǎn)屬性和邊屬性,建立倒排索引,具體包括:
6.如權(quán)利要求1所述一種工業(yè)配方和工藝知識答案生成方法,其特征在于,所述根據(jù)所述倒排索引和由用戶輸入問題生成的查詢嵌入向量,對所述領(lǐng)域知識圖譜的節(jié)點(diǎn)和邊進(jìn)行編碼和檢索,得到最優(yōu)子圖之前,還包括:
7.如權(quán)利要求6所述一種工業(yè)配方和工藝知識答案生成方法,其特
8.如權(quán)利要求1所述一種工業(yè)配方和工藝知識答案生成方法,其特征在于,所述將經(jīng)過文本編碼后的所述用戶輸入問題和經(jīng)圖編碼后的所述最優(yōu)子圖輸入預(yù)設(shè)的大語言模型,生成含自證信息的答案,具體包括:
9.如權(quán)利要求7所述一種工業(yè)配方和工藝知識答案生成方法,其特征在于,所述預(yù)設(shè)的大語言模型為引入增強(qiáng)注意力機(jī)制的開源大語言模型或商用大語言模型。
10.一種工業(yè)配方和工藝知識答案生成裝置,其特征在于,包括:
...【技術(shù)特征摘要】
1.一種工業(yè)配方和工藝知識答案生成方法,其特征在于,包括:
2.如權(quán)利要求1所述一種工業(yè)配方和工藝知識答案生成方法,其特征在于,所述工業(yè)配方數(shù)據(jù)和工藝知識數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗與預(yù)處理,得到標(biāo)準(zhǔn)化數(shù)據(jù),具體包括:
3.如權(quán)利要求1所述一種工業(yè)配方和工藝知識答案生成方法,其特征在于,所述對所述標(biāo)準(zhǔn)化數(shù)據(jù)進(jìn)行命名實體識別、關(guān)系抽取和數(shù)據(jù)融合,得到實體集合和關(guān)系集合,具體包括:
4.如權(quán)利要求1所述一種工業(yè)配方和工藝知識答案生成方法,其特征在于,所述根據(jù)所述實體集合和所述關(guān)系集合,形成面向工業(yè)配方和工藝知識的領(lǐng)域知識圖譜,具體包括:
5.如權(quán)利要求1所述一種工業(yè)配方和工藝知識答案生成方法,其特征在于,所述根據(jù)所述領(lǐng)域知識圖譜的節(jié)點(diǎn)屬性和邊屬性,建立倒排索引,具體包括:
6.如權(quán)利要求1所述一種工業(yè)配方和工藝知識答案生成方...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:劉堅,于廣平,陳哲元,李健,袁沐坤,
申請(專利權(quán))人:廣州工業(yè)智能研究院,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。