System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 亚洲另类无码一区二区三区,无码粉嫩虎白一线天在线观看,亚洲精品无码专区久久久
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    目標類型文檔的分類方法及裝置、存儲介質制造方法及圖紙

    技術編號:44313318 閱讀:3 留言:0更新日期:2025-02-18 20:26
    本申請公開了一種目標類型文檔的分類方法、裝置、存儲介質,涉及人工智能領域,該目標類型文檔的分類方法包括:根據所述目標類型文檔的第一術語構建混淆矩陣,并根據所述混淆矩陣確定所述第一術語的真正類率TPR和假正類率FPR;根據所述真正類率TPR和所述假正類率FPR確定三角比較測度TCM;在所述三角比較測度TCM與目標值的差值小于預設閾值的情況下,將所述三角比較測度TCM高于預設值的術語確定為第二術語,根據所述第二術語對所述目標類型文檔進行分類。采用上述技術方案,解決了由于忽略了術語在特定類別中的非存在性,導致目標類型文檔的分類不準確的問題。

    【技術實現步驟摘要】

    本申請涉及人工智能領域,具體而言,涉及一種目標類型文檔的分類方法及裝置、存儲介質


    技術介紹

    1、術語在特定類別的非存在性,即一個術語在某類文檔中幾乎不出現或完全不出現的情況,是目標類型文檔分類中區分不同類別的重要依據。例如,在對比兩個科研項目申請書時,如果某個術語在標示創新性高的項目申請書中頻繁出現,而在標示創新性較低的項目申請書中幾乎不出現,那么這個術語就具有很高的區分價值,能夠幫助分類器準確地區分不同類型的申請書。然而,現有的相關技術中往往忽略了術語在特定類別中的非存在性,導致目標類型文檔(例如科技文檔)的分類不準確。

    2、針對相關技術中,由于忽略了術語在特定類別中的非存在性,導致目標類型文檔的分類不準確的問題,目前尚未提出有效的解決方案。

    3、因此,有必要對相關技術予以改良以克服相關技術中的所述缺陷。


    技術實現思路

    1、本申請實施例提供了一種目標類型文檔的分類方法及裝置、存儲介質,以至少解決相關技術中,由于忽略了術語在特定類別中的非存在性,導致目標類型文檔的分類不準確的問題。

    2、根據本申請實施例的一方面,提供一種目標類型文檔的分類方法,包括:根據所述目標類型文檔的第一術語構建混淆矩陣,并根據所述混淆矩陣確定所述第一術語的真正類率tpr和假正類率fpr;根據所述真正類率tpr和所述假正類率fpr確定三角比較測度tcm;在所述三角比較測度tcm與目標值的差值小于預設閾值的情況下,將所述三角比較測度tcm高于預設值的術語確定為第二術語,根據所述第二術語對所述目標類型文檔進行分類。

    3、在一個示例性的實施例中,根據所述目標類型文檔的第一術語構建混淆矩陣之前,所述方法還包括:去除所述目標類型文檔中的目標類型詞語,其中,所述目標類型詞語包括以下至少之一:停用詞、低頻詞和高頻詞;對去除所述目標類型詞語的目標類型文檔進行詞形還原或詞干提取。

    4、在一個示例性的實施例中,根據所述目標類型文檔的第一術語構建混淆矩陣,包括:從所述目標類型文檔中確定包含所述第一術語的正類文檔和不包含所述第一術語的負類文檔;獲取所述第一術語在所述正類文檔中的真正例tp、所述第一術語在所述負類文檔中的假正例fp、所述第一術語在所述負類文檔中的真反例tn和所述第一術語在所述正類文檔中的假反例fn;根據所述真正例tp、所述假正例fp、所述真反例tn和所述假反例fn,構建所述混淆矩陣。

    5、在一個示例性的實施例中,根據所述混淆矩陣確定所述第一術語的真正類率tpr和假正類率fpr,包括:根據以下公式確定所述真正類率tpr:以及根據以下公式確定所述假正類率fpr:

    6、在一個示例性的實施例中,根據所述真正類率tpr和所述假正類率fpr確定三角比較測度tcm,包括:根據以下公式確定所述三角比較測度tcm:

    7、

    8、在一個示例性的實施例中,將所述三角比較測度tcm高于預設值的術語確定為第二術語,包括:從多個第一術語對應的三角比較測度tcm中確定超過所述預設值的目標三角比較測度tcm;將預設數量的所述目標三角比較測度tcm對應的術語確定為所述第二術語。

    9、在一個示例性的實施例中,根據所述第二術語對所述目標類型文檔進行分類,包括:將所述第二術語轉化為特征向量;將所述特征向量輸入至用于訓練所述第二術語的目標分類器,得到所述目標分類器的輸出結果;根據所述輸出結果對所述目標類型文檔進行分類,得到所述目標類型文檔的分類結果。

    10、根據本申請實施例的另一方面,還提供了一種目標類型文檔的分類裝置,包括:第一確定模塊,用于根據所述目標類型文檔的第一術語構建混淆矩陣,并根據所述混淆矩陣確定所述第一術語的真正類率tpr和假正類率fpr;第二確定模塊,用于根據所述真正類率tpr和所述假正類率fpr確定三角比較測度tcm;分類模塊,用于在所述三角比較測度tcm與目標值的差值小于預設閾值的情況下,將所述三角比較測度tcm高于預設值的術語確定為第二術語,根據所述第二術語對所述目標類型文檔進行分類。

    11、根據本申請實施例的又一方面,還提供了一種計算機可讀的存儲介質,該計算機可讀的存儲介質中存儲有計算機程序,其中,該計算機程序被設置為運行時執行上述目標類型文檔的分類方法。

    12、根據本申請實施例的又一方面,還提供了一種電子裝置,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其中,上述處理器通過計算機程序執行上述目標類型文檔的分類方法。

    13、根據本申請實施例的又一方面,還提供了一種計算機程序產品,包括計算機程序,所述計算機程序被處理器執行時實現本申請各個實施例中所述方法的步驟。

    14、通過本申請,根據目標類型文檔的第一術語構建的混淆矩陣確定所述第一術語的真正類率tpr和假正類率fpr;進而根據所述真正類率tpr和所述假正類率fpr確定三角比較測度tcm;當所述三角比較測度tcm與目標值的差值小于預設閾值時,確定所述三角比較測度tcm高于預設值的術語為第二術語,根據所述第二術語對所述目標類型文檔進行分類。從而解決了相關技術中由于忽略了術語在特定類別中的非存在性,導致目標類型文檔的分類不準確的問題。

    本文檔來自技高網...

    【技術保護點】

    1.一種目標類型文檔的分類方法,其特征在于,包括:

    2.根據權利要求1所述的方法,其特征在于,根據所述目標類型文檔的第一術語構建混淆矩陣之前,所述方法還包括:

    3.根據權利要求1所述的方法,其特征在于,根據所述目標類型文檔的第一術語構建混淆矩陣,包括:

    4.根據權利要求3所述的方法,其特征在于,根據所述混淆矩陣確定所述第一術語的真正類率TPR和假正類率FPR,包括:

    5.根據權利要求1所述的方法,其特征在于,根據所述真正類率TPR和所述假正類率FPR確定三角比較測度TCM,包括:

    6.根據權利要求1所述的方法,其特征在于,將所述三角比較測度TCM高于預設值的術語確定為第二術語,包括:

    7.根據權利要求1所述的方法,其特征在于,根據所述第二術語對所述目標類型文檔進行分類,包括:

    8.一種目標類型文檔的分類裝置,其特征在于,包括:

    9.一種計算機可讀的存儲介質,其特征在于,所述計算機可讀的存儲介質包括存儲的程序,其中,所述程序運行時執行權利要求1至7中任一項所述的方法。

    10.一種計算機程序產品,包括計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1至7中任一項所述方法的步驟。

    ...

    【技術特征摘要】

    1.一種目標類型文檔的分類方法,其特征在于,包括:

    2.根據權利要求1所述的方法,其特征在于,根據所述目標類型文檔的第一術語構建混淆矩陣之前,所述方法還包括:

    3.根據權利要求1所述的方法,其特征在于,根據所述目標類型文檔的第一術語構建混淆矩陣,包括:

    4.根據權利要求3所述的方法,其特征在于,根據所述混淆矩陣確定所述第一術語的真正類率tpr和假正類率fpr,包括:

    5.根據權利要求1所述的方法,其特征在于,根據所述真正類率tpr和所述假正類率fpr確定三角比較測度tcm,包括:

    6.根據權...

    【專利技術屬性】
    技術研發人員:邸智馮帆鄭子辰任鑫
    申請(專利權)人:中國華能集團清潔能源技術研究院有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲中文字幕久久无码| av无码久久久久不卡免费网站| 人妻丰满熟妇av无码区不卡| 无码成A毛片免费| 午夜寂寞视频无码专区| 日韩a级无码免费视频| 久久AV高清无码| 精品无人区无码乱码大片国产| 人妻无码αv中文字幕久久琪琪布| 99精品一区二区三区无码吞精| 国产精品无码一二区免费| 无码国产精品一区二区免费3p| 精品无码av无码专区| 无码精品人妻一区二区三区中| 天码av无码一区二区三区四区| 精品久久久久久无码专区| 国产成人无码综合亚洲日韩| a级毛片无码免费真人| 久久精品aⅴ无码中文字字幕不卡| 免费无码看av的网站| 亚洲看片无码在线视频| 亚洲成AV人在线观看天堂无码| 无码激情做a爰片毛片AV片| 亚洲熟妇无码AV不卡在线播放| 无码少妇一区二区性色AV| 精品无码久久久久久久动漫| 无码人妻精品内射一二三AV | 国产精品无码无片在线观看 | 久久久久久亚洲Av无码精品专口| 人妻丝袜无码专区视频网站| 无码av人妻一区二区三区四区| 亚洲AV日韩AV永久无码绿巨人 | 在线看无码的免费网站| 国产午夜无码视频在线观看| 亚洲无码视频在线| 亚洲人成国产精品无码| 黑人无码精品又粗又大又长 | 无码 免费 国产在线观看91| 无码av大香线蕉伊人久久| 无码中文在线二区免费| 少妇仑乱A毛片无码|