本申請提供一種結合語義和行為的神經網絡的垃圾郵件檢測方法及系統,該方法包括:通過遞歸神經網絡對用戶的語義信息進行建模,獲得語義特征因子;通過圖神經網絡對用戶的行為模式進行建模,獲得行為模式特征因子;將語義特征因子和行為模式特征因子串聯,構建全局特征空間;利用長短期記憶網絡,模擬全局特征空間的演化特征,預測用戶界面的性質
【技術實現步驟摘要】
結合語義和行為的神經網絡的垃圾郵件檢測方法及系統
[0001]本申請涉及數據處理
,尤其涉及一種結合語義和行為的神經網絡的垃圾郵件檢測方法及系統
。
技術介紹
[0002]垃圾郵件正在成為基于物聯網
(IoT)
的社交媒體應用的主要威脅
。
這將對物聯網網絡空間構成嚴重的安全威脅
。
物聯網領域的垃圾郵件處理主要有兩大類
:1)
基于神經網絡的方法
;2)
基于元啟發式優化算法的方法
。
然而,它們無法有效地處理隱藏的
、
復雜的
、
不斷變化的垃圾郵件活動,特別是在高度不確定的物聯網環境中
。
為了確保一個安全可靠的環境,有效的垃圾郵件發送者檢測或識別機制至關重要
。
[0003]然而,基于物聯網的社交媒體的垃圾郵件發送者的精確檢測在實踐中通常被視為一項具有挑戰性的任務,原因有二
。
首先,在線垃圾郵件與社交網絡高度相關
。
因此,社會關系甚至財務關系等語境信息需要作為輔助進行深入分析
。
其次,優秀的語義特征建模方案發揮著重要作用
。
這是因為網絡垃圾郵件的主要目的是為公眾輿論創造具體的方向
。
考慮到物聯網應用環境更加復雜,建立更多的細粒度特征空間將極大地影響垃圾郵件發送者檢測的效果
。
[0004]近年來,很多的研究致力于垃圾郵件發送者的檢測<br/>。
相關研究可分為兩類
:1)
基于行為模式的方法
;2)
基于語義模式的方法
。
前者集中于社會行為
、
評論行為和轉發行為等主要行為的模式特征
。
后者則從語言統計的角度強調言語內容的語義特征
。
[0005]現有技術方案
1:A. Makkar and N. Kumar,
?“
An efficient deep learning
?
based scheme for web spam detection in IoT environment,
”?
Future Generation Computer Systems, vol. 108, pp. 467
–
487, 2020.
該方法使用了一種在物聯網中檢測網絡垃圾郵件的深度學習模型
。
他們的系統增強了搜索引擎檢測網絡垃圾信息的認知能力
。
該模型通過搜索引擎計算出的網頁排名分數,去除垃圾網頁
。
他們的框架首次將
LSTM
模型用于垃圾郵件檢測,并被用于天氣預報等問題
。
[0006]現有技術方案
2:Ali Hosseinalipour and Reza Ghanbarzadeh. 2022.
?“
A novel approach for spam detection using horse herd optimization algorithm. Neural Computing and Applications.”該方法提出了一種新的基于馬群元啟發式優化算法的垃圾郵件檢測方法 。
首先,將連續的
HOA
轉化為離散算法
;
然后得到算法的輸入變成了基于反目標,然后轉變為多目標
。
最后,將其用于垃圾郵件檢測,即離散化以及多目標問題
。
[0007]現有技術的缺點1:在與監管機制長期對抗的過程中,掩蓋濫發訊息活動的工作日趨成熟,難以被識別
。
例如,許多垃圾郵件發送者通常會像普通用戶一樣進行正常的瀏覽和說話行為
。
在這種情況下,只涉及少量的垃圾郵件操作
。
[0008]現有技術的缺點2:大多數基于元啟發式優化算法的方法都具有很好的分析和理解常規機器語音的能力
。
但是這種方法不適用于復雜多變的內容
。
[0009]因此,目前亟需解決的技術問題是:如何對多源信息進行融合,適用于復雜多變的
內容,提高垃圾郵件發送者識別的準確性
。
技術實現思路
[0010]本申請的目的在于提供一種結合語義和行為的神經網絡的垃圾郵件檢測方法及系統,對多源信息進行融合,適用于復雜多變的內容,提高垃圾郵件發送者識別的準確性
。
[0011]為達到上述目的,本申請提供一種結合語義和行為的神經網絡的垃圾郵件檢測方法,該方法包括:通過遞歸神經網絡對用戶的語義信息進行建模,獲得語義特征因子;通過圖神經網絡對用戶的行為模式進行建模,獲得行為模式特征因子;將語義特征因子和行為模式特征因子串聯,構建全局特征空間;利用長短期記憶網絡,模擬全局特征空間的演化特征,預測用戶界面的性質
。
[0012]如上所述的結合語義和行為的神經網絡的垃圾郵件檢測方法,其中,在每個時間戳上,用戶的語義模式和行為模式分別通過雙向自動編碼模型和圖神經網絡編碼為語義特征因子和行為模式特征因子
。
[0013]如上所述的結合語義和行為的神經網絡的垃圾郵件檢測方法,其中,通過遞歸神經網絡對用戶的語義信息進行建模的方法包括如下子步驟:根據用戶的語義模式,通過雙向自動編碼模型對語義模式編碼,獲取隱藏狀態矢量;根據注意力機制,提取文本內容中的關鍵詞和背景詞,并根據關鍵詞和背景詞,獲得隱藏向量;根據隱藏向量,計算關鍵詞注意權重和背景詞注意權重;根據隱藏狀態矢量和關鍵詞注意權重,獲取關鍵詞增強隱藏狀態向量;根據隱藏狀態矢量和背景詞注意權重,計算背景詞增強隱藏狀態向量;根據關鍵詞增強隱藏狀態向量和背景詞增強隱藏狀態向量,計算語義特征因子
。
[0014]如上所述的結合語義和行為的神經網絡的垃圾郵件檢測方法,其中,通過圖神經網絡對用戶的行為模式進行建模的方法包括如下子步驟:根據用戶的行為模式,建立行為模式向量;通過圖神經網絡學習行為模式的圖嵌入向量;將行為模式的圖嵌入向量轉移到圖神經網絡的卷積層和全連接層,生成編碼結果,獲得行為模式特征因子
。
[0015]如上所述的結合語義和行為的神經網絡的垃圾郵件檢測方法,其中,根據用戶的語義模式,通過雙向自動編碼模型對語義模式編碼,獲取隱藏狀態矢量的方法包括:雙向自動編碼模型利用前向激活操作符和后向激活操作符,提取語義模式的前向隱藏狀態和后向隱藏狀態;將前向隱藏狀態和后向隱藏狀態串聯成隱藏狀態矢量
。
[0016]如上所述的結合語義和行為的神經網絡的垃圾郵件檢測方法,其中,將行為模式的圖嵌入向量轉移到圖神經網絡的卷積層和全連接層,生成編碼結果,獲得行為模式特征因子的方法包括如下步驟:通過卷積層的卷積運算,將圖嵌入向量映射為高階特征;通過全連接層本文檔來自技高網...
【技術保護點】
【技術特征摘要】
1.
一種結合語義和行為的神經網絡的垃圾郵件檢測方法,其特征在于,該方法包括:通過遞歸神經網絡對用戶的語義信息進行建模,獲得語義特征因子;通過圖神經網絡對用戶的行為模式進行建模,獲得行為模式特征因子;將語義特征因子和行為模式特征因子串聯,構建全局特征空間;利用長短期記憶網絡,模擬全局特征空間的演化特征,預測用戶界面的性質
。2.
根據權利要求1所述的結合語義和行為的神經網絡的垃圾郵件檢測方法,其特征在于,在每個時間戳上,用戶的語義模式和行為模式分別通過雙向自動編碼模型和圖神經網絡編碼為語義特征因子和行為模式特征因子
。3.
根據權利要求2所述的結合語義和行為的神經網絡的垃圾郵件檢測方法,其特征在于,通過遞歸神經網絡對用戶的語義信息進行建模的方法包括如下子步驟:根據用戶的語義模式,通過雙向自動編碼模型對語義模式編碼,獲取隱藏狀態矢量;根據注意力機制,提取文本內容中的關鍵詞和背景詞,并根據關鍵詞和背景詞,獲得隱藏向量;根據隱藏向量,計算關鍵詞注意權重和背景詞注意權重;根據隱藏狀態矢量和關鍵詞注意權重,獲取關鍵詞增強隱藏狀態向量;根據隱藏狀態矢量和背景詞注意權重,計算背景詞增強隱藏狀態向量;根據關鍵詞增強隱藏狀態向量和背景詞增強隱藏狀態向量,計算語義特征因子
。4.
根據權利要求2所述的結合語義和行為的神經網絡的垃圾郵件檢測方法,其特征在于,通過圖神經網絡對用戶的行為模式進行建模的方法包括如下子步驟:根據用戶的行為模式,建立行為模式向量;通過圖神經網絡學習行為模式的圖嵌入向量;將行為模式的圖嵌入向量轉移到圖神經網絡的卷積層和全連接層,生成編碼結果,獲得行為模式特征因子
。5.
根據權利要求3所述的結合語義和行為的神經網絡的垃圾郵件檢測方法,其特征在于,根據用戶的語義模式,通過雙向自動編碼模型對語義模式編碼,獲取隱藏狀態矢量的方法包括:雙向自動編碼模型利用前向激活操作符和后向激活操作符,提取語義模式的前向隱藏狀態和后向隱藏狀態;將前向隱藏狀態和后向隱藏狀態串聯成隱藏狀態矢量
。6.
根據權利要求4所...
【專利技術屬性】
技術研發人員:丁峰,江紫寒,郭智威,余恪平,朱小剛,
申請(專利權)人:南昌大學新一代信息技術產業研究院江西炬能物聯技術研究中心有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。