System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及數(shù)據(jù)處理,更具體地說,本專利技術(shù)涉及一種基于電子行業(yè)大模型的工業(yè)sop識(shí)別系統(tǒng)及方法。
技術(shù)介紹
1、標(biāo)準(zhǔn)作業(yè)程序(sop)是工業(yè)生產(chǎn)中實(shí)現(xiàn)操作規(guī)范化、確保產(chǎn)品質(zhì)量的重要手段;sop通過明確的操作步驟、標(biāo)準(zhǔn)化的作業(yè)要求,為生產(chǎn)過程的各個(gè)環(huán)節(jié)提供了系統(tǒng)性的指導(dǎo);然而,現(xiàn)有的sop管理模式主要依賴于靜態(tài)文檔形式,需要操作員手動(dòng)頻繁查閱紙質(zhì)sop文檔以確認(rèn)操作步驟或驗(yàn)證執(zhí)行結(jié)果,這不僅耗費(fèi)時(shí)間,降低作業(yè)效率,還容易因人工查閱中的疏漏或錯(cuò)誤理解而增加誤操作的風(fēng)險(xiǎn),從而對(duì)生產(chǎn)質(zhì)量和效率產(chǎn)生負(fù)面影響。
2、隨著知識(shí)圖譜技術(shù)的發(fā)展,雖然推動(dòng)了紙質(zhì)sop文檔向工業(yè)數(shù)字化的轉(zhuǎn)型,但目前關(guān)于sop知識(shí)圖譜的構(gòu)建方法主要仍依賴規(guī)則驅(qū)動(dòng),需要依賴預(yù)定義的規(guī)則來抽取實(shí)體和關(guān)系,然而,不同于其他領(lǐng)域的數(shù)據(jù),sop數(shù)據(jù)體量大、覆蓋范圍廣泛,這導(dǎo)致現(xiàn)有關(guān)于sop知識(shí)圖譜存在實(shí)體和關(guān)系構(gòu)建不完整,未能覆蓋sop數(shù)據(jù)中的多樣化知識(shí)點(diǎn),進(jìn)一步導(dǎo)致于sop知識(shí)圖譜的查詢精準(zhǔn)度較低,這限制了其在復(fù)雜工業(yè)場景中的實(shí)際應(yīng)用效果,難以滿足對(duì)高效作業(yè)指導(dǎo)和智能化管理的需求。
技術(shù)實(shí)現(xiàn)思路
1、為了克服現(xiàn)有技術(shù)的上述缺陷,本專利技術(shù)的實(shí)施例提供一種基于電子行業(yè)大模型的工業(yè)sop識(shí)別系統(tǒng)及方法。
2、為實(shí)現(xiàn)上述目的,本專利技術(shù)提供如下技術(shù)方案:
3、一種基于電子行業(yè)大模型的工業(yè)sop識(shí)別方法,所述方法包括:
4、抽取來源于電子行業(yè)數(shù)據(jù)源中的知識(shí)數(shù)據(jù),并根據(jù)知識(shí)數(shù)據(jù)構(gòu)建原始知
5、計(jì)算原始知識(shí)圖譜中每個(gè)原始節(jié)點(diǎn)的節(jié)點(diǎn)度,并根據(jù)節(jié)點(diǎn)度大小篩選出所有孤立節(jié)點(diǎn),并在獲取與孤立節(jié)點(diǎn)相關(guān)的多個(gè)關(guān)聯(lián)節(jié)點(diǎn)之后,對(duì)孤立節(jié)點(diǎn)與關(guān)聯(lián)節(jié)點(diǎn)進(jìn)行關(guān)系挖掘,得到多個(gè)第二關(guān)系;
6、根據(jù)第二關(guān)系對(duì)原始知識(shí)圖譜進(jìn)行結(jié)構(gòu)優(yōu)化,為孤立節(jié)點(diǎn)添加新的關(guān)系邊,得到應(yīng)用于電子行業(yè)的知識(shí)圖譜大模型;
7、獲取待查詢請(qǐng)求,將待查詢請(qǐng)求輸入知識(shí)圖譜大模型中,以識(shí)別出對(duì)應(yīng)的sop數(shù)據(jù),并將其進(jìn)行可視化反饋;所述查詢請(qǐng)求至少包含實(shí)體或關(guān)系的關(guān)鍵詞。
8、進(jìn)一步地,所述實(shí)體包括第一實(shí)體和第二實(shí)體,所述關(guān)系包括第一關(guān)系和第二關(guān)系;
9、其中,所述抽取來源于電子行業(yè)數(shù)據(jù)源中的知識(shí)數(shù)據(jù),包括:
10、將數(shù)據(jù)源中非第一實(shí)體的詞語標(biāo)記為待選詞;
11、計(jì)算每個(gè)待選詞在數(shù)據(jù)源中的tf_idf值;
12、根據(jù)tf_idf值大小對(duì)知識(shí)數(shù)據(jù)進(jìn)行實(shí)體擴(kuò)充,得到多個(gè)第二實(shí)體。
13、進(jìn)一步地,所述根據(jù)tf_idf值大小對(duì)知識(shí)數(shù)據(jù)進(jìn)行實(shí)體擴(kuò)充,包括:
14、將每個(gè)待選詞的tf_idf值與預(yù)設(shè)的tf_idf值閾值進(jìn)行比對(duì);
15、若tf_idf值大于等于預(yù)設(shè)的tf_idf閾值,則將對(duì)應(yīng)的待選詞標(biāo)記為第二實(shí)體;
16、若tf_idf值小于預(yù)設(shè)的tf_idf閾值,則將對(duì)應(yīng)的待選詞標(biāo)記為非第二實(shí)體;
17、統(tǒng)計(jì)所有tf_idf值大于等于預(yù)設(shè)的tf_idf閾值的待選詞,得到多個(gè)第二實(shí)體。
18、進(jìn)一步地,在得到多個(gè)第二實(shí)體之后,包括:
19、提取所有第二實(shí)體和第一實(shí)體;
20、利用word2vec詞袋模型,將第一實(shí)體轉(zhuǎn)換為第一詞向量,以及將第二實(shí)體轉(zhuǎn)換為第二詞向量;
21、計(jì)算所有第二詞向量與每個(gè)第一詞向量的語義距離,并將語義距離與預(yù)設(shè)的語義距離閾值進(jìn)行比對(duì);其中,所述語義距離通過余弦相似度算法計(jì)算得到;
22、若語義距離大于等于預(yù)設(shè)的語義距離閾值,則將第二詞向量對(duì)應(yīng)的第二實(shí)體從多個(gè)第二實(shí)體中剔除;
23、若語義距離小于預(yù)設(shè)的語義距離閾值,則將第二詞向量對(duì)應(yīng)的第二實(shí)體保留在多個(gè)第二實(shí)體中。
24、進(jìn)一步地,所述根據(jù)知識(shí)數(shù)據(jù)構(gòu)建原始知識(shí)圖譜,包括:
25、根據(jù)知識(shí)數(shù)據(jù)構(gòu)建實(shí)體-關(guān)系-屬性的三元組;
26、將三元組中的第一和第二實(shí)體作為原始節(jié)點(diǎn),以及將第一和第二關(guān)系作為原始節(jié)點(diǎn)之間的原始邊,形成原始知識(shí)圖譜。
27、進(jìn)一步地,所述計(jì)算原始知識(shí)圖譜中每個(gè)原始節(jié)點(diǎn)的節(jié)點(diǎn)度,并根據(jù)節(jié)點(diǎn)度大小篩選出孤立節(jié)點(diǎn),包括:
28、遍歷原始知識(shí)圖譜中的所有原始節(jié)點(diǎn),對(duì)每個(gè)原始節(jié)點(diǎn),統(tǒng)計(jì)其入邊數(shù)量和出邊數(shù)量;
29、對(duì)入邊數(shù)量和出邊數(shù)量進(jìn)行求和計(jì)算,得到每個(gè)原始節(jié)點(diǎn)的節(jié)點(diǎn)度;
30、將節(jié)點(diǎn)度與預(yù)設(shè)的節(jié)點(diǎn)度閾值進(jìn)行比對(duì),若節(jié)點(diǎn)度小于等于預(yù)設(shè)的節(jié)點(diǎn)度閾值,則將對(duì)應(yīng)的原始節(jié)點(diǎn)標(biāo)記為孤立節(jié)點(diǎn),若節(jié)點(diǎn)度大于預(yù)設(shè)的節(jié)點(diǎn)度閾值,則不將對(duì)應(yīng)的原始節(jié)點(diǎn)標(biāo)記為孤立節(jié)點(diǎn);
31、統(tǒng)計(jì)所有節(jié)點(diǎn)度小于等于節(jié)點(diǎn)度閾值的原始節(jié)點(diǎn),得到所有孤立節(jié)點(diǎn)。
32、進(jìn)一步地,所述獲取與孤立節(jié)點(diǎn)相關(guān)的多個(gè)關(guān)聯(lián)節(jié)點(diǎn),包括:
33、提取孤立節(jié)點(diǎn)與所有原始節(jié)點(diǎn),并獲取孤立節(jié)點(diǎn)與每一原始節(jié)點(diǎn)在數(shù)據(jù)源中的文本間距;
34、將文本間距與預(yù)設(shè)的文本間距閾值進(jìn)行比對(duì);
35、若文本間距小于等于文本間距閾值,則判定孤立節(jié)點(diǎn)與對(duì)應(yīng)原始節(jié)點(diǎn)在數(shù)據(jù)源中共現(xiàn),并將對(duì)應(yīng)的原始節(jié)點(diǎn)標(biāo)記為與孤立節(jié)點(diǎn)相關(guān)的關(guān)聯(lián)節(jié)點(diǎn);
36、若文本間距大于文本間距閾值,則判定孤立節(jié)點(diǎn)與對(duì)應(yīng)原始節(jié)點(diǎn)在數(shù)據(jù)源中未共現(xiàn),并不將對(duì)應(yīng)的原始節(jié)點(diǎn)標(biāo)記為與孤立節(jié)點(diǎn)相關(guān)的關(guān)聯(lián)節(jié)點(diǎn)。
37、進(jìn)一步地,所述對(duì)孤立節(jié)點(diǎn)與關(guān)聯(lián)節(jié)點(diǎn)進(jìn)行關(guān)系挖掘,包括:
38、定位到孤立節(jié)點(diǎn)與關(guān)聯(lián)節(jié)點(diǎn)在數(shù)據(jù)源中共現(xiàn)的目標(biāo)語句;
39、對(duì)分詞處理后的目標(biāo)語句進(jìn)行依存樹構(gòu)建,得到關(guān)于孤立節(jié)點(diǎn)和關(guān)聯(lián)節(jié)點(diǎn)的依存樹;
40、獲取孤立節(jié)點(diǎn)和關(guān)聯(lián)節(jié)點(diǎn)在依存樹中的最短依存路徑,并獲取依存路徑中的所有謂語動(dòng)詞,并分別解析每個(gè)謂語動(dòng)詞相對(duì)于孤立節(jié)點(diǎn)和關(guān)聯(lián)節(jié)點(diǎn)的依存關(guān)系,并獲取每個(gè)依存關(guān)系的權(quán)重,得到多個(gè)權(quán)重;
41、按數(shù)值從大到小,對(duì)多個(gè)權(quán)重進(jìn)行排序,將排序第一權(quán)重對(duì)應(yīng)的謂語動(dòng)詞,作為第二關(guān)系。
42、一種基于電子行業(yè)大模型的工業(yè)sop識(shí)別系統(tǒng),其基于上述所述的基于電子行業(yè)大模型的工業(yè)sop識(shí)別方法實(shí)現(xiàn),所述系統(tǒng)包括:
43、數(shù)據(jù)處理模塊,用于抽取來源于電子行業(yè)數(shù)據(jù)源中的知識(shí)數(shù)據(jù),并根據(jù)知識(shí)數(shù)據(jù)構(gòu)建原始知識(shí)圖譜;所述知識(shí)數(shù)據(jù)包括實(shí)體、關(guān)系和屬性;
44、關(guān)系挖掘模塊,用于計(jì)算原始知識(shí)圖譜中每個(gè)原始節(jié)點(diǎn)的節(jié)點(diǎn)度,并根據(jù)節(jié)點(diǎn)度大小篩選出所有孤立節(jié)點(diǎn),并在獲取與孤立節(jié)點(diǎn)相關(guān)的多個(gè)關(guān)聯(lián)節(jié)點(diǎn)之后,對(duì)孤立節(jié)點(diǎn)與關(guān)聯(lián)節(jié)點(diǎn)進(jìn)行關(guān)系挖掘,得到多個(gè)第二關(guān)系;
45、數(shù)據(jù)優(yōu)化模塊,用于根據(jù)第二關(guān)系對(duì)原始知識(shí)圖譜進(jìn)行結(jié)構(gòu)優(yōu)化,為孤立節(jié)點(diǎn)添加新的關(guān)系邊,得到應(yīng)用于電子行業(yè)的知識(shí)圖譜大模型;
46、sop識(shí)別模塊,用于獲取待查詢請(qǐng)求,將待查詢請(qǐng)求輸入知識(shí)圖譜大模型中,以識(shí)別出對(duì)應(yīng)的sop數(shù)據(jù),并將其進(jìn)行可視化反饋;所述查詢請(qǐng)求至少包含實(shí)體或關(guān)系的關(guān)鍵詞。
47、相比本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種基于電子行業(yè)大模型的工業(yè)SOP識(shí)別方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的基于電子行業(yè)大模型的工業(yè)SOP識(shí)別方法,其特征在于,所述實(shí)體包括第一實(shí)體和第二實(shí)體,所述關(guān)系包括第一關(guān)系和第二關(guān)系;
3.根據(jù)權(quán)利要求2所述的基于電子行業(yè)大模型的工業(yè)SOP識(shí)別方法,其特征在于,所述根據(jù)TF_IDF值大小對(duì)知識(shí)數(shù)據(jù)進(jìn)行實(shí)體擴(kuò)充,包括:
4.根據(jù)權(quán)利要求3所述的基于電子行業(yè)大模型的工業(yè)SOP識(shí)別方法,其特征在于,在得到多個(gè)第二實(shí)體之后,包括:
5.根據(jù)權(quán)利要求4所述的基于電子行業(yè)大模型的工業(yè)SOP識(shí)別方法,其特征在于,所述根據(jù)知識(shí)數(shù)據(jù)構(gòu)建原始知識(shí)圖譜,包括:
6.根據(jù)權(quán)利要求5所述的基于電子行業(yè)大模型的工業(yè)SOP識(shí)別方法,其特征在于,所述計(jì)算原始知識(shí)圖譜中每個(gè)原始節(jié)點(diǎn)的節(jié)點(diǎn)度,并根據(jù)節(jié)點(diǎn)度大小篩選出孤立節(jié)點(diǎn),包括:
7.根據(jù)權(quán)利要求6所述的基于電子行業(yè)大模型的工業(yè)SOP識(shí)別方法,其特征在于,所述獲取與孤立節(jié)點(diǎn)相關(guān)的多個(gè)關(guān)聯(lián)節(jié)點(diǎn),包括:
8.根據(jù)權(quán)利要求7所述的基于電子行業(yè)大模型的工業(yè)S
9.一種基于電子行業(yè)大模型的工業(yè)SOP識(shí)別系統(tǒng),其特征在于,其基于權(quán)利要求1至8中任意一項(xiàng)所述的基于電子行業(yè)大模型的工業(yè)SOP識(shí)別方法實(shí)現(xiàn),所述系統(tǒng)包括:
...【技術(shù)特征摘要】
1.一種基于電子行業(yè)大模型的工業(yè)sop識(shí)別方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的基于電子行業(yè)大模型的工業(yè)sop識(shí)別方法,其特征在于,所述實(shí)體包括第一實(shí)體和第二實(shí)體,所述關(guān)系包括第一關(guān)系和第二關(guān)系;
3.根據(jù)權(quán)利要求2所述的基于電子行業(yè)大模型的工業(yè)sop識(shí)別方法,其特征在于,所述根據(jù)tf_idf值大小對(duì)知識(shí)數(shù)據(jù)進(jìn)行實(shí)體擴(kuò)充,包括:
4.根據(jù)權(quán)利要求3所述的基于電子行業(yè)大模型的工業(yè)sop識(shí)別方法,其特征在于,在得到多個(gè)第二實(shí)體之后,包括:
5.根據(jù)權(quán)利要求4所述的基于電子行業(yè)大模型的工業(yè)sop識(shí)別方法,其特征在于,所述根據(jù)知識(shí)數(shù)據(jù)構(gòu)建原始知識(shí)圖譜...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:徐成杰,肖莉,彭露,張罡,謝明明,陳思銘,王崢,黃兆宇,蔣海濤,
申請(qǐng)(專利權(quán))人:聯(lián)通江蘇產(chǎn)業(yè)互聯(lián)網(wǎng)有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。