一種文本數據的處理終端查找方法技術

技術編號：36932681 閱讀：49 留言：0更新日期：2023-03-22 18:55

本發明專利技術涉及文本數據處理技術領域,公開了一種文本數據的處理終端查找方法，在實際使用時，本發明專利技術提前依據文本數據的類別生成對應的規則處理器，每個規則處理器中包括處理終端，當有文本數據輸入時，先提前判斷出與文本數據對應的子分類號，然后對子分類號進行過濾得到有用子分類號，接著依據有用子分類號分配對應的規則處理器，然后在所有規則處理器中確定有用規則處理器，然后分別計算有用規則處理器中的處理終端的處理規則的配置標簽集合與文本數據的文本數標簽集合的相似度，并基于相似度為每個處理終端生成一個總得分值，通過將總得分值最大的處理終端作為數據處理終端，從而可以替代人工進行文本數據的處理對象查找，提高了查找效率。了查找效率。了查找效率。

全部詳細技術資料下載

【技術實現步驟摘要】
一種文本數據的處理終端查找方法

[0001]本專利技術涉及文本數據處理
，具體涉及一種文本數據的處理終端查找方法。

技術介紹

[0002]在事務處理系統中，用戶大多先在輸入界面輸入文本數據，然后工作人員基于文本數據進行分類，按照文本數據的類別將文本數據分發到對應的處理終端上進行處理，具體步驟如下：先人工判斷文本數據所屬的主分類號，然后根據其所屬的主分類號進行數據分類；接著人工根據文本數據的主分類號查看文本數據內容，并依據經驗確定文本數據的子分類號；然后人工依據子分類號進行任務派發，將文本數據發送到派發部門，派發部門接收到文本數據后依據文本數據的主分類號查看文本內容來確定文本數據的處理部門，處理部門對文本數據進行處理。然而這種處理方式在實際使用時存在以下不足：一方面都是通過人工判斷，則需要大量的人工投入，導致效率較低；另外一方面，由于文本數據存在表述不準的可能性，會出現一定的誤判可能性。

技術實現思路

[0003]在鑒于
技術介紹
的不足，本專利技術是提供了一種文本數據的處理終端查找方法，所要解決的技術問題是現有文本數據的處理終端的查找都是通過人工完成，效率較低。
[0004]為解決以上技術問題，本專利技術提供了如下技術方案：一種文本數據的處理終端查找方法，先依據文本數據的主分類號中的子分類號生成對應的規則處理器，每個規則處理器中包括至少一個處理終端，一個處理終端中設有對應的處理規則；包括以下步驟：S1：先獲取所述文本數據的主分類號，然后在所述主分類號的所有子分類號中查找所述文本數據對應的子分...

【技術保護點】

【技術特征摘要】
1.一種文本數據的處理終端查找方法，其特征在于，先依據文本數據的子分類號生成對應的規則處理器，每個規則處理器中包括至少一個處理終端，一個處理終端中設有對應的處理規則；包括以下步驟：S1：先獲取所述文本數據的主分類號，然后在所述主分類號的所有子分類號中查找所述文本數據對應的子分類號；S2：對所述文本數據對應的子分類號進行過濾，將所述文本數據對應的子分類號中與所述文本數據不匹配的子分類號去除掉，剩余的子分類號作為有用子分類號；S3：先基于所述有用子分類號分配規則處理器，然后在所有分配的規則處理器中查找與所述文本數據相匹配的規則處理器，將與所述文本數據相匹配的規則處理器作為有用規則處理器；S4：獲取所述有用規則處理器中的每個處理終端的處理規則的配置標簽，并將每個處理規則的所有配置標簽作為一個配置標簽集合；對所述文本數據進行標簽提取，獲取文本數據的文本標簽，將文本標簽生成為文本標簽集合；S5：對每個配置標簽集合依次進行以下處理：依次選取配置標簽集合中的一個配置標簽，計算選取的配置標簽與文本標簽集合中與選取的配置標簽所對應的文本標簽的相似度；S6：對每個配置標簽集合依次進行以下處理：判斷配置標簽集合中的每個配置標簽的相似度是否大于判定閾值，如果大于則將該相似度乘以配置權重得到該配置標簽的得分值，如果相似度小于判定閾值，則將該配置標簽的得分值置零；S7：將配置標簽集合中的所有配置標簽的得分相加得到配置標簽集合的總得分值；S8：將總得分最高的配置標簽集合所對應的處理終端作為所述文本數據的數據處理終端。2.根據權利要求1所述的一種文本數據的處理終端查找方法，其特征在于，步驟S2具體如下：S20：對每個...

【專利技術屬性】
技術研發人員：柴亞團，陳思遠，
申請(專利權)人：無錫容智技術有限公司，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術