System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本說明書一個或多個實施例涉及計算機領域,尤其涉及證件防偽檢測中的模型訓練數據生成方法和裝置。
技術介紹
1、當前,電子程序身份認證的應用非常廣泛,證件防偽是身份認證的關鍵環節,常見的證件造假方式為,將證件彩打或者黑白打印出來,然后冒充用戶的真實證件去進行身份認證,需要在證件防偽檢測中識別出這一類的證件造假。
2、現有技術中,常常利用大量的真實證件和其對應的打印圖像去訓練檢測模型,檢測模型用于檢測輸入卡證數據對應的類別為真證或假證,其中,用戶的證件信息屬于用戶的隱私數據,需要保護隱私數據不被泄露。由于受到各種環境因素影響,在現實中很難獲得數量和類型充足的打印圖像,從而影響了檢測模型的檢測效果。
技術實現思路
1、本說明書一個或多個實施例描述了一種證件防偽檢測中的模型訓練數據生成方法和裝置,能夠獲得數量和類型充足的打印圖像,相應提升了檢測模型的檢測效果。
2、第一方面,提供了一種證件防偽檢測中的模型訓練數據生成方法,方法包括:
3、針對原始卡證數據集合中的任一原始卡證數據,物理采集其分別對應于多種采集模式的多個打印圖像數據,得到原始卡證數據和多個打印圖像數據構成的第一類訓練數據;其中,原始卡證數據作為模型訓練數據中的正樣本,打印圖像數據作為模型訓練數據中的負樣本;
4、針對任一原始卡證數據,利用生成式人工智能的方式生成其對應的多個偽造卡證數據,得到原始卡證數據和多個偽造卡證數據構成的第二類訓練數據;其中,原始卡證數據作為模型訓練數據中的正
5、根據第一類訓練數據和第二類訓練數據,確定訓練數據集,用于訓練檢測模型,所述檢測模型用于檢測輸入卡證數據對應的類別為真證或假證。
6、在一種可能的實施方式中,所述物理采集其分別對應于多種采集模式的多個打印圖像數據,包括:
7、對應于多種采集模式分別包括的打印條件,控制打印機按照多種打印條件分別打印任一原始卡證數據,以得到多個紙張圖片;
8、對應于多種采集模式分別包括的拍攝條件,控制攝像頭分別在多種拍攝條件下拍攝所述多個紙張圖片,以得到多個打印圖像數據。
9、進一步地,所述打印條件包括:紙張材質;
10、所述控制打印機按照多種打印條件分別打印任一原始卡證數據,包括:
11、控制打印機分別在多種紙張材質的紙張上打印任一原始卡證數據。
12、進一步地,所述打印條件包括:打印機型號;
13、所述控制打印機按照多種打印條件分別打印任一原始卡證數據,包括:
14、依次啟動多種打印機型號分別對應的多個打印機;
15、控制多個打印機打印任一原始卡證數據。
16、進一步地,所述拍攝條件包括:圖像尺寸;
17、所述控制攝像頭分別在多種拍攝條件下拍攝所述多個紙張圖片,包括:
18、控制攝像頭分別按照多種圖像尺寸拍攝所述多個紙張圖片。
19、進一步地,所述拍攝條件包括:背景信息;
20、所述控制攝像頭分別在多種拍攝條件下拍攝所述多個紙張圖片,包括:
21、控制攝像頭分別在多種背景信息下拍攝所述多個紙張圖片。
22、進一步地,所述拍攝條件包括:采集光照;
23、所述控制攝像頭分別在多種拍攝條件下拍攝所述多個紙張圖片,包括:
24、控制攝像頭分別在多種采集光照下拍攝所述多個紙張圖片。
25、進一步地,所述多種采集光照包括打開閃光燈或關閉閃光燈。
26、進一步地,所述控制攝像頭分別在多種拍攝條件下拍攝所述多個紙張圖片,包括:
27、通過具身智能采用機械臂控制攝像頭分別在多種拍攝條件下拍攝所述多個紙張圖片。
28、在一種可能的實施方式中,所述針對任一原始卡證數據,利用生成式人工智能的方式生成其對應的多個偽造卡證數據,包括:
29、將第一原始卡證數據作為內容,將第二原始卡證數據對應的打印圖像數據作為風格,將內容和風格輸入預先訓練的風格遷移網絡,得到第一原始卡證數據符合該風格的偽造卡證數據。
30、進一步地,所述風格遷移網絡采用以下方式進行訓練:
31、獲取第三原始卡證數據和其對應于第一采集模式的第三打印圖像數據,以及第四原始卡證數據對應于第一采集模式的第四打印圖像數據;
32、將第三原始卡證數據作為內容,將第四打印圖像數據作為風格,將內容和風格輸入風格遷移網絡,得到第三原始卡證數據對應的第三偽造卡證數據;
33、根據所述第三偽造卡證數據與第三打印圖像數據,確定預測損失;
34、以最小化預測損失為訓練目標,調整所述風格遷移網絡的參數。
35、在一種可能的實施方式中,所述針對任一原始卡證數據,利用生成式人工智能的方式生成其對應的多個偽造卡證數據,包括:
36、從第一原始卡證數據或其對應的打印圖像數據中提取文字和圖形;
37、將提取的文字和圖形添加到第一圖層;
38、對第一圖層進行扭曲和降解處理,得到處理后的第一圖層;
39、選擇一種紙張紋理添加到第二圖層;
40、對第二圖層進行噪聲添加處理,得到處理后的第二圖層;
41、將第一圖層和第二圖層進行合并,得到合并的文檔圖像;
42、對所述文檔圖像進行模擬真實證件的增強處理,得到第一原始卡證數據對應的偽造卡證數據。
43、在一種可能的實施方式中,所述針對任一原始卡證數據,利用生成式人工智能的方式生成其對應的多個偽造卡證數據,包括:
44、將第一原始卡證數據對應的打印圖像數據,以及用于表征風格的提示詞,輸入多模態大模型,得到第一原始卡證數據對應的符合該風格的偽造卡證數據。
45、第二方面,提供了一種證件防偽檢測中的模型訓練數據生成裝置,裝置包括:
46、采集單元,用于針對原始卡證數據集合中的任一原始卡證數據,物理采集其分別對應于多種采集模式的多個打印圖像數據,得到原始卡證數據和多個打印圖像數據構成的第一類訓練數據;其中,原始卡證數據作為模型訓練數據中的正樣本,打印圖像數據作為模型訓練數據中的負樣本;
47、生成單元,用于針對任一原始卡證數據,利用生成式人工智能的方式生成其對應的多個偽造卡證數據,得到原始卡證數據和多個偽造卡證數據構成的第二類訓練數據;其中,原始卡證數據作為模型訓練數據中的正樣本,偽造卡證數據作為模型訓練數據中的負樣本;
48、確定單元,用于根據所述采集單元得到的第一類訓練數據和所述生成單元得到的第二類訓練數據,確定訓練數據集,用于訓練檢測模型,所述檢測模型用于檢測輸入卡證數據對應的類別為真證或假證。
49、第三方面,提供了一種計算機可讀存儲介質,其上存儲有計算機程序,當所述計算機程序在計算機中執行時,令計算機執行第一方面的方法。
...【技術保護點】
1.一種證件防偽檢測中的模型訓練數據生成方法,所述方法包括:
2.如權利要求1所述的方法,其中,所述物理采集其分別對應于多種采集模式的多個打印圖像數據,包括:
3.如權利要求2所述的方法,其中,所述打印條件包括:紙張材質;
4.如權利要求2所述的方法,其中,所述打印條件包括:打印機型號;
5.如權利要求2所述的方法,其中,所述拍攝條件包括:圖像尺寸;
6.如權利要求2所述的方法,其中,所述拍攝條件包括:背景信息;
7.如權利要求2所述的方法,其中,所述拍攝條件包括:采集光照;
8.如權利要求7所述的方法,其中,所述多種采集光照包括打開閃光燈或關閉閃光燈。
9.如權利要求2所述的方法,其中,所述控制攝像頭分別在多種拍攝條件下拍攝所述多個紙張圖片,包括:
10.如權利要求1所述的方法,其中,所述針對任一原始卡證數據,利用生成式人工智能的方式生成其對應的多個偽造卡證數據,包括:
11.如權利要求10所述的方法,其中,所述風格遷移網絡采用以下方式進行訓練:
13.如權利要求1所述的方法,其中,所述針對任一原始卡證數據,利用生成式人工智能的方式生成其對應的多個偽造卡證數據,包括:
14.一種證件防偽檢測中的模型訓練數據生成裝置,所述裝置包括:
15.一種計算機可讀存儲介質,其上存儲有計算機程序,當所述計算機程序在計算機中執行時,令計算機執行權利要求1-13中任一項的所述的方法。
16.一種計算設備,包括存儲器和處理器,所述存儲器中存儲有可執行代碼,所述處理器執行所述可執行代碼時,實現權利要求1-13中任一項的所述的方法。
...【技術特征摘要】
1.一種證件防偽檢測中的模型訓練數據生成方法,所述方法包括:
2.如權利要求1所述的方法,其中,所述物理采集其分別對應于多種采集模式的多個打印圖像數據,包括:
3.如權利要求2所述的方法,其中,所述打印條件包括:紙張材質;
4.如權利要求2所述的方法,其中,所述打印條件包括:打印機型號;
5.如權利要求2所述的方法,其中,所述拍攝條件包括:圖像尺寸;
6.如權利要求2所述的方法,其中,所述拍攝條件包括:背景信息;
7.如權利要求2所述的方法,其中,所述拍攝條件包括:采集光照;
8.如權利要求7所述的方法,其中,所述多種采集光照包括打開閃光燈或關閉閃光燈。
9.如權利要求2所述的方法,其中,所述控制攝像頭分別在多種拍攝條件下拍攝所述多個紙張圖片,包括:
10.如權利要求1所述的方法,其中,所述針對任一原...
【專利技術屬性】
技術研發人員:陳志軍,
申請(專利權)人:螞蟻區塊鏈科技上海有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。