System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 五月丁香六月综合缴清无码,久久午夜无码鲁丝片秋霞,久久亚洲中文字幕无码
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基于樣本過濾的模型訓練方法及相關設備技術

    技術編號:42706138 閱讀:28 留言:0更新日期:2024-09-13 11:59
    本公開提供一種基于樣本過濾的模型訓練方法及相關設備。該方法包括:獲取訓練樣本集合;基于所述訓練樣本集合訓練用于識別后門正樣本的判別器,以及基于所述判別器確定所述訓練樣本集合中的第一后門正樣本;基于所述訓練樣本集合的AUM值確定所述訓練樣本集合中的第二后門樣本;將所述第一后門正樣本和所述第二后門樣本的原始標簽去除,得到中間樣本集合;基于所述中間樣本集合在所述訓練樣本集合中的補集與所述中間樣本集合進行半監督訓練,得到訓練好的模型。

    【技術實現步驟摘要】

    本公開涉及模型訓練領域,尤其涉及一種基于樣本過濾的模型訓練方法及相關設備。


    技術介紹

    1、深度神經網絡的有效性依賴于大量的訓練樣本,用戶往往為了節約時間和成本從不受信任的數據源收集數據,這正在成為攻擊者的目標。攻擊者通過改變一部分訓練樣本以改變模型的預測。現有的防御策略還存在良性樣本的精度下降,容易引發未知的錯誤,容易被攻擊者設計的自適應攻擊繞過,受到攻擊中毒率的影響而失效,從而導致訓練得到的模型可靠性低。


    技術實現思路

    1、本公開提出一種基于樣本過濾的模型訓練方法及相關設備,以在一定程度上解決訓練樣本不可靠導致訓練得到的模型可靠性低等技術問題。

    2、本公開第一方面,提供了一種基于樣本過濾的模型訓練方法,包括:

    3、獲取訓練樣本集合;

    4、基于所述訓練樣本集合訓練用于識別后門正樣本的判別器,以及基于所述判別器確定所述訓練樣本集合中的第一后門正樣本;

    5、基于所述訓練樣本集合的aum值確定所述訓練樣本集合中的第二后門樣本;

    6、將所述第一后門正樣本和所述第二后門樣本的原始標簽去除,得到中間樣本集合;

    7、基于所述中間樣本集合在所述訓練樣本集合中的補集與所述中間樣本集合進行半監督訓練,得到訓練好的模型。

    8、本公開第二方面,提供了一種基于樣本過濾的模型訓練裝置,包括:

    9、樣本獲取模塊,用于獲取訓練樣本集合;

    10、第一樣本模塊,用于基于所述訓練樣本集合訓練用于識別后門正樣本的判別器,以及基于所述判別器確定所述訓練樣本集合中的第一后門正樣本;

    11、第二樣本模塊,用于基于所述訓練樣本集合的aum值確定所述訓練樣本集合中的第二后門樣本;

    12、標簽去除模塊,用于將所述第一后門正樣本和所述第二后門樣本的原始標簽去除,得到中間樣本集合;

    13、模型訓練模塊,用于基于所述中間樣本集合在所述訓練樣本集合中的補集與所述中間樣本集合進行半監督訓練,得到訓練好的模型。

    14、本公開第三方面,提供了一種電子設備,包括一個或者多個處理器、存儲器;和一個或多個程序,其中所述一個或多個程序被存儲在所述存儲器中,并且被所述一個或多個處理器執行,所述程序包括用于執行根據第一方面所述的方法的指令。

    15、本公開第四方面,提供了一種包含計算機程序的非易失性計算機可讀存儲介質,當所述計算機程序被一個或多個處理器執行時,使得所述處理器執行第一方面所述的方法。

    16、本公開第五方面,提供了一種計算機程序產品,包括計算機程序指令,當所述計算機程序指令在計算機上執行時,使得計算機執行第一方面所述的方法。

    17、從上面所述可以看出,本公開提供的一種基于樣本過濾的模型訓練方法及相關設備,在訓練階段消除不受信任的訓練集的影響(訓練集中可能含有后門數據)。通過分析后門樣本在訓練時期與干凈樣本表現出的不同的損失差異,設計了一個雙通道的樣本過濾方式以應對不同中毒率情況下的后門樣本。最終將去除標簽的后門樣本與干凈樣本進行半監督學習以訓練干凈的模型。在消除后門攻擊的情況下能夠保持模型在干凈樣本上的預測精度,從而有效地提高了模型的安全性和魯棒性。

    本文檔來自技高網...

    【技術保護點】

    1.一種基于樣本過濾的模型訓練方法,包括:

    2.根據權利要求1的方法,其中,基于所述訓練樣本集合訓練用于識別后門正樣本的判別器,包括:

    3.根據權利要求2的方法,其中,還包括:

    4.根據權利要求3的方法,其中,基于所述判別器確定所述訓練樣本集合中的第一后門正樣本,包括:

    5.根據權利要求1的方法,其中,基于所述訓練樣本集合的AUM值確定所述訓練樣本集合中的第二后門樣本,包括:

    6.根據權利要求2的方法,其中,基于所述Flooding損失、第一閾值數量和第二閾值數量確定所述訓練樣本集合中的第一中間后門正樣本和第一中間后門負樣本,包括:

    7.根據權利要求1的方法,其中,基于所述中間樣本集合在所述訓練樣本集合中的補集與所述中間樣本集合進行半監督訓練,得到訓練好的模型,包括:

    8.一種樣本過濾的模型訓練裝置,包括:

    9.一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上執行的計算機程序,所述處理器執行所述程序時實現如權利要求1至7任意一項所述的方法。

    10.一種非暫態計算機可讀存儲介質,所述非暫態計算機可讀存儲介質存儲計算機指令,所述計算機指令用于使計算機執行權利要求1至7任一所述方法。

    ...

    【技術特征摘要】

    1.一種基于樣本過濾的模型訓練方法,包括:

    2.根據權利要求1的方法,其中,基于所述訓練樣本集合訓練用于識別后門正樣本的判別器,包括:

    3.根據權利要求2的方法,其中,還包括:

    4.根據權利要求3的方法,其中,基于所述判別器確定所述訓練樣本集合中的第一后門正樣本,包括:

    5.根據權利要求1的方法,其中,基于所述訓練樣本集合的aum值確定所述訓練樣本集合中的第二后門樣本,包括:

    6.根據權利要求2的方法,其中,基于所述flooding損失、第一閾值數量和第二閾值數量確定所述訓練樣本集合中的第一中...

    【專利技術屬性】
    技術研發人員:徐國勝王晨宇,肖開源
    申請(專利權)人:北京郵電大學
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲人成人无码网www国产| 宅男在线国产精品无码| 亚洲AV无码一区二区乱子仑| 中文字幕av无码一二三区电影| 无码免费午夜福利片在线| 中文字幕久无码免费久久| av无码久久久久久不卡网站| 无码国产亚洲日韩国精品视频一区二区三区 | gogo少妇无码肉肉视频| 人妻无码αv中文字幕久久琪琪布| 国产成人无码精品久久久露脸| 无码人妻精品一区二区三| 无码人妻精品一区二区蜜桃AV| 毛片免费全部播放无码| 亚洲gv猛男gv无码男同短文| YY111111少妇无码理论片| 无码专区永久免费AV网站| 老司机亚洲精品影院无码| 亚洲精品无码久久久久sm| 亚洲Av无码国产情品久久| 最新亚洲人成无码网站| 亚洲AV日韩AV永久无码色欲| 无码专区AAAAAA免费视频| 一本加勒比hezyo无码专区| 一道久在线无码加勒比| 亚洲AV无码一区二区三区鸳鸯影院| 久久久久久亚洲Av无码精品专口| 亚洲午夜无码久久久久| 国产精品无码av天天爽 | 中文字幕无码播放免费| 久久人妻内射无码一区三区| 国内精品人妻无码久久久影院| av无码精品一区二区三区四区| 色综合无码AV网站| 国产精品无码AV不卡| 国产精品亚洲а∨无码播放麻豆| 无码一区二区波多野结衣播放搜索| 亚洲午夜无码久久久久小说| 制服在线无码专区| 精品国产AV无码一区二区三区| 精品无码国产AV一区二区三区 |