System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及驗證碼識別,尤其涉及一種多模態aigc圖文匹配問答驗證碼識別方法。
技術介紹
1、隨著網絡環境日益復雜以及安全意識的不斷提升,驗證碼作為一項關鍵的安全措施,已被廣泛部署于各類在線服務中以抵御自動化攻擊及惡意軟件的侵擾。傳統上,字符驗證碼是通過光學字符識別(ocr)技術來破解的主要目標。然而,為應對不斷升級的安全挑戰,驗證碼的設計趨向于更加復雜多樣。
2、中國專利申請公開號為cn111753281a的專利文獻公開了一種驗證碼識別方法,該方法包括:利用訓練過的神經網絡模型,識別輸入的驗證碼的類型;所述神經網絡模型根據驗證碼的類型,選擇對應的驗證碼識別模塊;利用所述驗證碼識別模塊識別所述驗證碼。
3、由此可見,所述驗證碼識別方法存在以下問題:該方法依賴于訓練過的神經網絡模型,導致對特定類型驗證碼的識別能力有限;識別模塊的選擇是基于已識別的驗證碼類型,如果模型未能準確識別驗證碼的類型,則后續的識別過程會受到影響,導致識別錯誤;該方法對復雜或變形驗證碼的適應性較差,難以處理具有較高噪聲或干擾的驗證碼,從而影響識別效果。
技術實現思路
1、為此,本專利技術提供一種多模態aigc圖文匹配問答驗證碼識別方法,用以克服現有技術中由于對特定類型驗證碼的識別依賴性導致的適應性不足和識別準確率低的問題。
2、為實現上述目的,本專利技術提供一種多模態aigc圖文匹配問答驗證碼識別方法,包括:
3、采集預設生成模型在預設生成時長內生成的實時圖像和與
4、分別提取各所述實時圖像和各所述實時文本的對象,得到圖像對象和文本對象;
5、根據預設場景庫、所述圖像對象和所述文本對象確定場景匹配度,根據場景匹配度確定若干臨時圖像;
6、根據所述臨時圖像的粗糙度、邊緣清晰度和色彩對比度確定若干第一訓練集圖像;
7、根據所述臨時圖像對應的所述實時文本的長度和關鍵詞豐富度確定若干第二訓練集圖像;
8、根據預設調整時長內所述第一訓練集圖像和所述第二訓練集圖像的重合率確定重合波動值,根據重合波動值和預設標準重合波動值調整所述預設生成時長,直至重合波動值小于或等于預設標準重合波動值,得到若干總訓練集圖像;
9、根據所述總訓練集圖像分別訓練預設圖像模型和預設文本模型,得到訓練圖像模型和訓練文本模型;
10、根據所述訓練圖像模型提取驗證碼圖片的圖像特征,得到若干圖像特征;
11、根據所述訓練文本模型提取所述驗證碼圖片的文本特征,得到若干文本特征;
12、根據所述圖像特征和所述文本特征確定圖像相似序列;
13、根據所述圖像相似序列輸出識別結果。
14、進一步地,所述根據預設調整時長內所述第一訓練集圖像和所述第二訓練集圖像的重合率確定重合波動值包括:
15、計算所述第一訓練集圖像和所述第二訓練集圖像的重合率,在重合率大于預設標準重合率時計算重合率的標準差,形成重合波動值。
16、進一步地,所述根據重合波動值和預設標準重合波動值調整所述預設生成時長包括:
17、在所述重合波動值大于所述預設標準重合波動值時,根據重合波動值和預設標準重合波動值的相對偏差、預設時長調整系數調整所述預設生成時長。
18、進一步地,所述根據所述圖像特征和所述文本特征確定圖像相似序列包括:
19、計算所述圖像特征和所述文本特征的余弦相似度,對全部余弦相似度進行從大到小的排序,形成圖像相似序列。
20、進一步地,所述根據所述圖像相似序列輸出識別結果包括:
21、從所述圖像相似序列中的第一位獲取預設數量的圖像,形成識別結果并輸出。
22、進一步地,所述根據預設場景庫、所述圖像對象和所述文本對象確定場景匹配度包括:
23、分別提取所述圖像對象和所述文本對象的特征向量,得到圖像特征向量和文本特征向量;
24、根據所述圖像特征向量和所述文本特征向量計算歐氏距離,根據歐氏距離和預設標準距離確定一致特征向量;
25、根據所述一致特征向量和所述預設場景庫中的場景特征向量確定場景匹配度。
26、進一步地,所述根據場景匹配度確定若干臨時圖像包括:
27、在場景匹配度大于預設標準匹配度時,判定所述實時圖像為臨時圖像。
28、進一步地,在所述粗糙度大于或等于預設標準粗糙度,且所述邊緣清晰度大于預設標準清晰度時,判定所述臨時圖像為第一訓練集圖像。
29、進一步地,在所述粗糙度小于預設標準粗糙度,且所述邊緣清晰度大于預設標準清晰度時,對比所述色彩對比度和預設標準對比度,在色彩對比度大于預設標準對比度時判定所述臨時圖像為第一訓練集圖像。
30、進一步地,所述根據所述臨時圖像對應的所述實時文本的長度和關鍵詞豐富度確定若干第二訓練集圖像包括:
31、在所述長度大于預設標準長度,且所述關鍵詞豐富度大于預設標準豐富度時,判定所述臨時圖像為第二訓練集圖像。
32、與現有技術相比,本專利技術的有益效果在于,通過多層次的判定與篩選機制,提升了圖像與文本的匹配精度,確保了生成的訓練集質量更高,適應性更強,其引入的多種圖像質量指標和文本特征的綜合分析,使得模型在處理驗證碼時具備更強的魯棒性和準確性,通過創新的多模態訓練策略,不僅提高了驗證碼識別的效率,還在實際應用中能夠有效降低誤識率,為安全性和用戶體驗提供了保障,有效解決了由于對特定類型驗證碼的識別依賴性導致的適應性不足和識別準確率低的問題。
33、進一步地,通過計算第一訓練集圖像和第二訓練集圖像的重合率并結合標準差來判斷圖像間的相似性波動,從而確保選擇出的訓練集圖像在內容和特征上高度一致。當重合率超過預設標準時,通過計算其標準差,可以有效識別出重合波動較大的圖像組合,這有助于及時調整訓練數據集,剔除不相關或低質量的圖像。
34、進一步地,通過監測重合波動值與預設標準重合波動值的關系,能夠實時優化生成過程,減少生成數據的不確定性,確保訓練集圖像和文本的匹配度保持在合理范圍內。
35、進一步地,通過精確計算圖像和文本特征的相似性,能夠有效提高圖文匹配的準確度。通過排序,可以優先輸出最符合的結果,優化驗證碼的識別效果,提升整體系統的性能和可靠性。
36、進一步地,通過從圖像相似度排序中選取最匹配的圖像,系統能夠更快速、準確地確定最終識別結果,提高了驗證碼的正確率,并確保輸出結果與輸入的圖像和文本高度匹配。
37、進一步地,通過精確提取和比較特征向量,能夠有效提高圖像與文本之間的匹配精度,從而提升整體驗證碼識別系統的可靠性和準確性。
38、進一步地,通過匹配度判定機制,能夠篩選出具有較高相關性的臨時圖像,不僅提高了圖文匹配的準確性,還增強了系統在處理復雜場景時的魯棒性。
39、進一步地,通過選取高質量的圖像作本文檔來自技高網...
【技術保護點】
1.一種多模態AIGC圖文匹配問答驗證碼識別方法,其特征在于,包括:
2.根據權利要求1所述的多模態AIGC圖文匹配問答驗證碼識別方法,其特征在于,所述根據預設調整時長內所述第一訓練集圖像和所述第二訓練集圖像的重合率確定重合波動值包括:
3.根據權利要求2所述的多模態AIGC圖文匹配問答驗證碼識別方法,其特征在于,所述根據重合波動值和預設標準重合波動值調整所述預設生成時長包括:
4.根據權利要求3所述的多模態AIGC圖文匹配問答驗證碼識別方法,其特征在于,所述根據所述圖像特征和所述文本特征確定圖像相似序列包括:
5.根據權利要求4所述的多模態AIGC圖文匹配問答驗證碼識別方法,其特征在于,所述根據所述圖像相似序列輸出識別結果包括:
6.根據權利要求5所述的多模態AIGC圖文匹配問答驗證碼識別方法,其特征在于,所述根據預設場景庫、所述圖像對象和所述文本對象確定場景匹配度包括:
7.根據權利要求6所述的多模態AIGC圖文匹配問答驗證碼識別方法,其特征在于,所述根據場景匹配度確定若干臨時圖像包括:
8.
9.根據權利要求8所述的多模態AIGC圖文匹配問答驗證碼識別方法,其特征在于,在所述粗糙度小于預設標準粗糙度,且所述邊緣清晰度大于預設標準清晰度時,對比所述色彩對比度和預設標準對比度,在色彩對比度大于預設標準對比度時判定所述臨時圖像為第一訓練集圖像。
10.根據權利要求9所述的多模態AIGC圖文匹配問答驗證碼識別方法,其特征在于,所述根據所述臨時圖像對應的所述實時文本的長度和關鍵詞豐富度確定若干第二訓練集圖像包括:
...【技術特征摘要】
1.一種多模態aigc圖文匹配問答驗證碼識別方法,其特征在于,包括:
2.根據權利要求1所述的多模態aigc圖文匹配問答驗證碼識別方法,其特征在于,所述根據預設調整時長內所述第一訓練集圖像和所述第二訓練集圖像的重合率確定重合波動值包括:
3.根據權利要求2所述的多模態aigc圖文匹配問答驗證碼識別方法,其特征在于,所述根據重合波動值和預設標準重合波動值調整所述預設生成時長包括:
4.根據權利要求3所述的多模態aigc圖文匹配問答驗證碼識別方法,其特征在于,所述根據所述圖像特征和所述文本特征確定圖像相似序列包括:
5.根據權利要求4所述的多模態aigc圖文匹配問答驗證碼識別方法,其特征在于,所述根據所述圖像相似序列輸出識別結果包括:
6.根據權利要求5所述的多模態aigc圖文匹配問答驗證碼識別方法,其特征在于,所述根據預設場景庫、所述圖像對象和...
【專利技術屬性】
技術研發人員:畢詩楠,羅夢研,
申請(專利權)人:上海漣隱網絡科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。