System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于人工智能,尤其涉及一種釣魚郵件中認知偏差利用的識別方法。
技術介紹
1、互聯網的飛速發展極大地改變了人們的生活質量與方式,帶來了前所未有的便利和機遇。然而,隨著網絡的普及,不法分子也開始利用這一平臺發起各種網絡攻擊,如木馬病毒、跨站腳本攻擊、sql注入等,以竊取用戶隱私和財產。盡管網絡防御技術不斷進步,攻擊者在技術層面的成功率有所下降,但他們轉而利用人性的弱點,采取更為隱蔽的社會工程學攻擊手段。社會工程學攻擊不直接針對技術系統,而是針對人的心理。攻擊者通過精心設計的欺騙、操縱或誤導策略,誘使用戶在不自覺中執行有害操作或泄露敏感信息。這種攻擊方式依賴于對人類行為的深刻理解和心理戰術的巧妙運用,使其成為網絡安全的重大威脅。
2、借助互聯網的發展,電子郵件已成為全球溝通中不可或缺的一部分,statista的數據顯示,2022年全球電子郵件用戶數量已達到42.6億,預計到2026年將增長至47.3億。同時,預計到2025年,全球每日電子郵件的發送和接收量將達到3760億封。電子郵件的廣泛使用也吸引了眾多攻擊者,使其成為社會工程學攻擊的主要載體,尤其是釣魚郵件攻擊。釣魚郵件攻擊不斷演變和擴散,對全球的經濟穩定和個人信息安全造成了顯著的負面影響。這些郵件通常采用精心策劃的欺詐手段,誘導用戶在不經意間泄露個人信息、銀行賬戶詳情,甚至安裝惡意軟件。根據coremail的統計,2023年第四季度,中國國內釣魚郵件的數量高達1.41億封,與去年同期相比增長了111%,幾乎是前一年同期的兩倍。
3、目前的研究工作
4、這一研究的難點在于,首先,目前沒有一個明確的框架或理論基礎專門針對釣魚郵件中的認知偏差進行識別和理解。其次,相關實驗數據和實證研究非常缺乏,尤其是釣魚郵件究竟包含了哪些認知偏差需要結合專家經驗進行大規模標注。最后,這個研究方向位于心理學和網絡安全技術的交叉領域,需要人員跨越學科邊界,整合不同領域的知識和方法。
技術實現思路
1、為解決現有技術未能充分識別釣魚郵件中心理操縱手段的問題,本專利技術提供一種釣魚郵件中認知偏差利用的識別方法,精準識別和分析釣魚郵件內容中設計用于操縱用戶心理的策略,揭示了攻擊者的心理操縱機制,為制定有效的防范措施提供了科學依據,從而更有效地降低用戶受騙的風險。
2、一種釣魚郵件中認知偏差利用的識別方法,采用人工智能分類模型識別釣魚郵件中的認知偏差,其中,人工智能分類模型的訓練方法為:
3、采用預訓練的語言表征模型bert提取出釣魚郵件數據集中各釣魚郵件的文本特征;
4、采用tf-idf方法獲取各釣魚郵件中每個單詞的詞權重;
5、采用文本情感分析模型vader獲取各釣魚郵件的情緒得分;
6、將各釣魚郵件的文本特征、每個單詞的詞權重、情緒得分進行融合,得到各釣魚郵件對應的特征向量;
7、各釣魚郵件對應的特征向量分別送入長短期記憶網絡lstm和多層感知機mlp,分別對應得到各釣魚郵件對應的認知偏差類別向量預測值與認知偏差類別向量預測值;其中,認知偏差類別向量由權威偏差、錨定效應、緊迫性偏差、好奇心效應、零風險偏差、社會認同構成;
8、將與進行加權融合,得到各釣魚郵件對應的最終的認知偏差類別向量預測值;
9、根據各釣魚郵件對應的認知偏差類別向量標簽值與認知偏差類別向量預測值之間的差別構建交叉熵損失函數分別對lstm和mlp進行反向傳播,以此調節lstm和mlp的網絡參數,直到得到最終的lstm和mlp。
10、進一步地,所述認知偏差類別向量標簽值的獲取方法為:
11、采用預訓練的情感分析模型獲取釣魚郵件數據集中各釣魚郵件的情感傾向;
12、采用文本分析技術提取釣魚郵件數據集中各釣魚郵件包含的與認知偏差相關的關鍵詞和短語,其中,所述認知偏差包括權威偏差、錨定效應、緊迫性偏差、好奇心效應、零風險偏差、社會認同;
13、專家根據各釣魚郵件的情感傾向以及與認知偏差相關的關鍵詞和短語標注出釣魚郵件數據集中各釣魚郵件對應的認知偏差類別向量標簽值。
14、進一步地,通過多個專家對同一個釣魚郵件進行認知偏差類別向量標簽值的標注,并將出現次數最多的標注結果作為當前釣魚郵件對應的認知偏差類別向量標簽值。
15、進一步地,認知偏差類別向量為由0和1組成的6個比特位的向量,其中,若任一比特位為1,則表示釣魚郵件中存在該比特位對應的認知偏差,若任一比特位為0,則表示釣魚郵件中不存在該比特位對應的認知偏差。
16、進一步地,在獲取各釣魚郵件的文本特征、每個單詞的詞權重、情緒得分前,首先對各釣魚郵件進行清洗,其中,清洗的方法為:
17、去除各釣魚郵件中的html標簽;
18、將各釣魚郵件中的所有文本被統一轉換為小寫或大寫;
19、剔除各釣魚郵件中的非指定語言;
20、剔除各釣魚郵件中的特殊字符和停用詞;
21、對各釣魚郵件中的單詞進行詞干提取和詞形還原。
22、有益效果:
23、1、本專利技術提供一種釣魚郵件中認知偏差利用的識別方法,旨在檢測釣魚郵件中的認知偏差,通過結合自然語言處理、機器學習以及人工智能技術,精準識別和分析釣魚郵件內容中設計用于操縱用戶心理的認知偏差,揭示了攻擊者的心理操縱機制;本專利技術的識別方法不僅增強了對釣魚郵件策略的理解,而且為制定有效的防范措施提供了科學依據,從而更有效地降低用戶受騙的風險,是一種從認知層面上增強釣魚郵件防御的新方法。
24、2、本專利技術提供一種釣魚郵件中認知偏差利用的識別方法,通過專家經驗對釣魚郵件中的認知偏差進行深入分析和定義,進而構建釣魚郵件認知偏差數據集,這不僅可以促進精準模型的開發,還能夠深化對于釣魚郵件操縱心理機制的理解。
25、3、本專利技術提供一種釣魚郵件中認知偏差利用的識別方法,數據清洗保證數據的質量,便于后續分析模型和模型訓練;具體的,從郵件文本中刪除所有html代碼,留下純文本內容,以便進行后續分析;將所有文本統一轉換為小寫或大寫,消除字母大小寫在文本處理中的差異;根據需要分析的語言,篩選出特定的語言郵件文本,排除其他語言的干擾;刪除文本中的非字母數字字符如標點符號和常見的無實義詞,如“的”,“和”等,以簡化文本數據;通過詞干提取減少單詞到其根形式的差別,或者通過詞形還原將單詞恢復到其原始詞形,統一詞匯形式,有助于文本分析處理。
26、4、本專利技術提供一種釣魚郵件中認知偏差利本文檔來自技高網...
【技術保護點】
1.一種釣魚郵件中認知偏差利用的識別方法,其特征在于,采用人工智能分類模型識別釣魚郵件中的認知偏差,其中,人工智能分類模型的訓練方法為:
2.如權利要求1所述的一種釣魚郵件中認知偏差利用的識別方法,其特征在于,所述認知偏差類別向量標簽值的獲取方法為:
3.如權利要求2所述的一種釣魚郵件中認知偏差利用的識別方法,其特征在于,通過多個專家對同一個釣魚郵件進行認知偏差類別向量標簽值的標注,并將出現次數最多的標注結果作為當前釣魚郵件對應的認知偏差類別向量標簽值。
4.如權利要求1或2所述的一種釣魚郵件中認知偏差利用的識別方法,其特征在于,認知偏差類別向量為由0和1組成的6個比特位的向量,其中,若任一比特位為1,則表示釣魚郵件中存在該比特位對應的認知偏差,若任一比特位為0,則表示釣魚郵件中不存在該比特位對應的認知偏差。
5.如權利要求1所述的一種釣魚郵件中認知偏差利用的識別方法,其特征在于,在獲取各釣魚郵件的文本特征、每個單詞的詞權重、情緒得分前,首先對各釣魚郵件進行清洗,其中,清洗的方法為:
【技術特征摘要】
1.一種釣魚郵件中認知偏差利用的識別方法,其特征在于,采用人工智能分類模型識別釣魚郵件中的認知偏差,其中,人工智能分類模型的訓練方法為:
2.如權利要求1所述的一種釣魚郵件中認知偏差利用的識別方法,其特征在于,所述認知偏差類別向量標簽值的獲取方法為:
3.如權利要求2所述的一種釣魚郵件中認知偏差利用的識別方法,其特征在于,通過多個專家對同一個釣魚郵件進行認知偏差類別向量標簽值的標注,并將出現次數最多的標注結果作為當前釣魚郵件對應的認知偏差類別向...
【專利技術屬性】
技術研發人員:鄭康鋒,姚禹霖,武斌,伍淳華,
申請(專利權)人:北京郵電大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。