System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及信息抽取,尤其涉及一種信息抽取方法及系統。
技術介紹
1、隨著技術的發展,專家庫中生成了海量的數據,使得手動處理和監控這些信息變得愈加困難。因此,自動化和智能化的信息抽取方法逐漸受到關注。基于機器學習、自然語言處理和深度學習等技術的信息抽取方法得到了廣泛應用,機器學習、自然語言處理和深度學習等技術可以幫助我們從文本中自動提取關鍵信息,并根據預定的模式或規則對信息進行分析和處理。相關技術中,基于保護功能及運行狀態的專家庫模型可能涉及隱私或安全方面的信息,因此對專家庫中有關于保護功能及運行狀態類別的文本信息抽取需要謹慎處理,相關技術中對功能保護和運行狀態的信息識別和提取不夠精細,導致信息提取的安全性不高,影響信息抽取的可靠性和可信度。
技術實現思路
1、本專利技術通過提供一種信息抽取方法及系統,解決了相關技術中對保護功能和運行狀態的信息識別和提取不夠精細,導致信息提取的安全性不高,影響信息抽取的可靠性和可信度的技術問題。
2、本專利技術采用的技術方案如下:
3、第一方面,本專利技術提供了一種信息抽取方法,所述方法包括如下步驟:
4、獲取專家庫的原始文本,對原始文本進行處理,獲得第一文本;
5、在第一文本中提取保護功能特征、運行狀態特征,獲得保護功能類文本的判定準則、運行狀態類文本的判定準則;
6、根據保護功能類文本的判定準則、運行狀態類文本的判定準則,將第一文本分別歸類到保護功能類文本和運行狀態類文本中;
...【技術保護點】
1.一種信息抽取方法,其特征在于,包括如下步驟:
2.如權利要求1所述的一種信息抽取方法,其特征在于,在第一文本中提取保護功能特征、運行狀態特征,包括:
3.如權利要求2所述的一種信息抽取方法,其特征在于,第一實體和第二實體均包括:保護技術、系統組件和狀態描述。
4.如權利要求1所述的一種信息抽取方法,其特征在于,對原始文本進行處理,包括:文本清洗、分詞、詞性標準、詞向量處理。
5.如權利要求4所述的一種信息抽取方法,其特征在于,文本清洗包括:去除空白字符、大小寫轉換、去除特殊符號、詞形還原、去除重復文本和詞干提取。
6.如權利要求2所述的一種信息抽取方法,其特征在于,采用文本分類算法將第一文本分別歸類到保護功能類文本和運行狀態類文本中。
7.如權利要求2所述的一種信息抽取方法,其特征在于,語義分析技術基于BERT模型,用于使用自注意力機制處理輸入文本中不同詞語之間的關系。
8.一種信息抽取系統,其特征在于,包括:
9.如權利要求8所述的一種信息抽取系統,其特征在于,信息處理模塊對專家
10.如權利要求9所述的一種信息抽取系統,其特征在于,文本清洗包括:去除空白字符、大小寫轉換、去除特殊符號、詞形還原、去除重復文本和詞干提取。
...【技術特征摘要】
1.一種信息抽取方法,其特征在于,包括如下步驟:
2.如權利要求1所述的一種信息抽取方法,其特征在于,在第一文本中提取保護功能特征、運行狀態特征,包括:
3.如權利要求2所述的一種信息抽取方法,其特征在于,第一實體和第二實體均包括:保護技術、系統組件和狀態描述。
4.如權利要求1所述的一種信息抽取方法,其特征在于,對原始文本進行處理,包括:文本清洗、分詞、詞性標準、詞向量處理。
5.如權利要求4所述的一種信息抽取方法,其特征在于,文本清洗包括:去除空白字符、大小寫轉換、去除特殊符號、詞形還原、去除重復文本和詞干提取。
6.如權利要求2所述的一種...
【專利技術屬性】
技術研發人員:周海成,石恒初,尹昭舜,張明祥,陳秋濤,張西,王飛,宋銀松,馬加亮,黃航,李秀蘭,楊鵬輝,丁世瓊,黃博,熊曉川,刀婷婷,朱玉珊,楊麗,
申請(專利權)人:云南電網有限責任公司普洱供電局,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。