System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 亚洲AV无码乱码在线观看裸奔,国产v亚洲v天堂无码网站,日日摸夜夜爽无码毛片精选
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種面向熱點事件的重點群組識別方法技術

    技術編號:44467037 閱讀:4 留言:0更新日期:2025-03-04 17:39
    本公開提供一種面向熱點事件的重點群組識別方法。包括多源熱點事件觸發的線索發現模塊和基于事件關鍵詞圖的群組發現模塊;多源熱點事件觸發的線索發現模塊輸入為社交通訊平臺上的多源文本信息;通過要素抽取模型,從多源數據流中檢測熱點事件;隨后利用事件要素構建關鍵詞圖以及詞圖之間的關聯;之后在出現信息增量時更新和劃分關鍵詞圖,進行搜索涉及關鍵詞的用戶信息過程;基于事件關鍵詞圖的群組發現模塊的實現過程為:構建社交網絡圖;獲取用戶在所有不同社交網絡下的節點表征;使用步驟二得到的用戶節點表征和子圖關聯區域作為輸入,將數據輸入用于處理多粒度信息的可微池化網絡;對子圖進行判別,從而發現未知群組,即為熱點事件的潛在重點群組。

    【技術實現步驟摘要】

    本公開涉及互聯網領域,更具體地講,涉及一種面向熱點事件的重點群組識別方法


    技術介紹

    1、目前,隨著互聯網時代的到來,人們在日常生活中使用社交通訊平臺進行溝通交流也日趨頻繁。許多用戶通過在社交通訊平臺上組建群組的方式進行消息傳遞、文件共享和視頻會議功能,使個人和團隊能夠快速、高效地溝通和協作,減少了等待時間,加快了信息交換的速度,從而提高了工作效率和生產力。當前,社交平臺上的文娛熱點事件日益增多,這些事件不僅豐富了社交平臺的內容,也帶動了用戶的廣泛討論和參與。為了更好地把握文娛熱點的傳播趨勢和用戶互動模式,積極識別與這些熱點事件相關的群組顯得尤為重要。這不僅有助于平臺更好地理解用戶興趣和行為,也為推動文娛熱點的積極發展提供了數據支持和參考。當前的技術能力主要集中在對群組及賬號信息內容的被動發現上,由于相關群組往往表現出高度的適應性和變化性,需要建立靈活、自適應的重點群組發現系統,以確保對目標群組進行準確的識別和發現。由此可知,需要提供一種面向熱點事件的重點群組識別的技術方案。


    技術實現思路

    1、本公開的實施例的目的在于提供一種面向熱點事件的重點群組識別方法,從熱點事件中發現群組關鍵線索,基于群組線索主動識別發現重點群組。

    2、在一個總的方面,提供一種面向熱點事件的重點群組識別方法,包括多源熱點事件觸發的線索發現模塊和基于事件關鍵詞圖的群組發現模塊;

    3、所述多源熱點事件觸發的線索發現模塊的實現過程為:輸入為社交通訊平臺上的多源文本信息;通過要素抽取模型,從多源數據流中檢測熱點事件,定義選取的事件要素為七元組:

    4、event=<t,desc,locs,pars,key,emo,posts>

    5、其中t是事件的時間戳,表示事件發生時所在的時間片;desc是事件的描述,簡要總結了事件內容和領域;locs是事件的相關地點的集合,一般集合中只有一個地點表示事件發生的地方;pars是參與到事件中的人或者組織的集合;key是描述事件的關鍵詞;emo是事件的意識形態傾向;posts是事件的相關報道;

    6、隨后利用事件要素構建關鍵詞圖以及詞圖之間的關聯;

    7、之后在出現信息增量時更新和劃分關鍵詞圖,進行搜索涉及關鍵詞的用戶信息過程;

    8、所述的基于事件關鍵詞圖的群組發現模塊的實現過程為:步驟一,通過所述搜索涉及關鍵詞的用戶信息過程,在社交通訊平臺進行搜索,獲得用戶相關數據,通過文本聚類、要素抽取等方式篩選出與該事件有關的用戶、用戶間的交互關系以及用戶發帖的內容,構建社交網絡圖;

    9、步驟二,獲取用戶在所有不同社交網絡下的節點表征,采用基于子圖模塊度的優化方法來提取用戶的鄰居子圖,即確定特定事件相關的子圖關聯區域,即篩選與目標事件緊密相關的用戶群體、用戶之間的交互行為,以及他們發布的相關內容。具體方式為:首先,基于步驟一構建的社交網絡圖,用戶在不同社交網絡中的位置(即節點)以及與目標事件的關聯度,構建初始子圖。可以通過節點間的互動頻次來確定初始子圖中的節點。然后,計算子圖模塊度p,

    10、

    11、其中,aij表示節點i和j之間是否存在邊的鄰接矩陣(如果有邊則為1,否則為0)。ki和kj是節點i和j的度,即它們的邊數量。m表示圖中的總邊數。δ(ci,cj)是指示函數,若節點i和j屬于同一子圖(或社區),則其值為1,否則為0。接著,采用貪心算法對子圖中的節點分配進行調整,逐步提高模塊度值,從而形成更具凝聚力的子圖。通過多次迭代,逐漸收斂到一個較為穩定的結構嗎,在模塊度優化過程中持續保持高關聯的節點和邊,篩選出最緊密的用戶群體和用戶之間的交互行為作為特定事件相關的子圖。并通過集成社交行為和內容特征的融合方法,根據用戶的社交行為,例如發布、轉發、評論頻率,社交互動模式(如互動頻繁的好友)等,獲取用戶的行為特征向量,根據從用戶發布的內容中提取特定關鍵詞、情感、主題等特征,以文本處理技術(如自然語言處理中的tf-idf模型)生成內容特征向量。將行為和內容特征向量進行組合,使用融合方法(如加權平均或多層神經網絡)生成用戶的最終特征表示,確保同時保留用戶的行為和內容特征,即每個用戶在特定事件下的節點表征之后多次重復執行步驟一,并且每次都針對不同的事件涉及的社交網絡進行調整,采用經過構建的attention機制,加權不同事件下用戶的節點表征及其對應的關聯區域,綜合得到一個全局的用戶節點表征:

    12、

    13、其中wi是通過所述經過構建的attention機制學習到的針對每個事件的權重;

    14、步驟三,使用步驟二得到的用戶節點表征和子圖關聯區域作為輸入,將數據輸入用于處理多粒度信息的可微池化網絡,所述用于處理多粒度信息的可微池化網絡具體是通過對不同部分的稀疏子圖進行區域性池化操作,挖掘和學習現有稀疏子圖區域中的結構信息,其中多粒度可微池化的子圖嵌入的表示為:

    15、

    16、其中,sdiffpool表示可訓練的池化矩陣,用于學習節點特征向量統一維度,adiffpool表示粗粒度池化圖的鄰接矩陣,指導進行多區域聯合池化特征的篩選與有效表示;

    17、步驟四,將可微池化的子圖嵌入送入到二分類判別器中識別重點群組,對子圖進行判別,從而發現未知群組,即為熱點事件的潛在重點群組。

    18、所述詞圖之間的關聯利用增量式訓練的word2vec模型進行構建,并需要將詞義強相似或地點強關聯的節點之間連邊,構建詞圖語義信息子圖,具體步驟為:首先,使用初始的詞圖數據訓練出基礎的word2vec模型。模型通過常規的word2vec訓練算法(如skip-gram)生成每個詞的初始向量表示。接著,在增量式更新階段,在接收到新詞圖數據或檢測到語義空間中新的熱點詞匯后,增量式訓練將新數據逐步加入模型中,而不改變原有詞向量的結構,具體為:1)在新的數據輸入時,檢查詞匯表中是否存在新詞,若有,則將這些詞加入模型。2)窗口更新與上下文捕捉:基于滑動窗口捕獲新詞周圍的上下文詞匯,以適應新詞的上下文分布,更新相關詞的向量表示。然后,通過詞向量的相似性(如余弦相似度)來確定連邊條件。如果兩詞之間的語義相似度高于特定閾值,則在詞圖中連邊。若新數據中出現特定地理位置或熱點事件的關聯詞(如相鄰位置或事件發生地點),模型會學習這些詞的語義關系并在詞圖中連邊。最后,在詞圖語義信息子圖上進行重疊社區發現算法,即探測圖中所有k-clique,把共享k-1個節點的clique定義為相鄰,聚合到一起得到的最大集合為社區,每個社區即是一個事件代表,之后從索引中恢復該事件代表對應源數據,并抽取信息用于事件表示,去除重復之后得到一個時間片內的事件集合,將單一信源的關鍵詞圖融合成多信源的關鍵詞圖,實現跨信源的詞圖對齊與更新。

    19、所述經過構建的attention機制具體為bert-bilstm-crf-idcnn模型,模型分為三個部分,即bert層、bilstm和icdnn融合層以及crf層;

    2本文檔來自技高網...

    【技術保護點】

    1.一種面向熱點事件的重點群組識別方法,其特征在于,包括多源熱點事件觸發的線索發現模塊和基于事件關鍵詞圖的群組發現模塊;

    2.如權利要求1所述的一種面向熱點事件的重點群組識別方法,其特征在于,所述詞圖之間的關聯利用增量式訓練的Word2vec模型進行構建,并需要將詞義強相似或地點強關聯的節點之間連邊,構建詞圖語義信息子圖,具體步驟為:首先,使用初始的詞圖數據訓練出基礎的Word2Vec模型。模型通過常規的Word2Vec訓練算法生成每個詞的初始向量表示;接著,在增量式更新階段,在接收到新詞圖數據或檢測到語義空間中新的熱點詞匯后,增量式訓練將新數據逐步加入模型中,而不改變原有詞向量的結構,具體為:1)在新的數據輸入時,檢查詞匯表中是否存在新詞,若有,則將這些詞加入模型;2)窗口更新與上下文捕捉:基于滑動窗口捕獲新詞周圍的上下文詞匯,以適應新詞的上下文分布,更新相關詞的向量表示;然后,通過詞向量的相似性來確定連邊條件,如果兩詞之間的語義相似度高于特定閾值,則在詞圖中連邊,若新數據中出現特定地理位置或熱點事件的關聯詞,模型學習這些詞的語義關系并在詞圖中連邊;最后,在詞圖語義信息子圖上進行重疊社區發現算法,即探測圖中所有k-clique,把共享k-1個節點的clique定義為相鄰,聚合到一起得到的最大集合為社區,每個社區即是一個事件代表,之后從索引中恢復該事件代表對應源數據,并抽取信息用于事件表示,去除重復之后得到一個時間片內的事件集合,將單一信源的關鍵詞圖融合成多信源的關鍵詞圖,實現跨信源的詞圖對齊與更新。

    3.如權利要求2所述的一種面向熱點事件的重點群組識別方法,其特征在于,所述經過構建的Attention機制具體為BERT-BiLSTM-CRF-IDCNN模型,模型分為三個部分,即BERT層、BiLSTM和ICDNN融合層以及CRF層;

    4.如權利要求3所述的一種面向熱點事件的重點群組識別方法,其特征在于,所述BERT預訓練層采用Transformer編碼結構,計算方法為:

    5.如權利要求4所述的一種面向熱點事件的重點群組識別方法,其特征在于,在所述BiLSTM模塊中,LSTM引入了門控機制,即輸入門、輸出門和遺忘門,使用內存單元來捕捉單詞之間的遠距離依賴關系,BiLSTM由兩個方向相反的LSTM組成,用于提取全局上下文特征;

    6.如權利要求5所述的一種面向熱點事件的重點群組識別方法,其特征在于,在IDCNN模塊中,在傳統的CNN卷積上添加了擴張寬度,跳過了擴張寬度中間的數據,并保持了卷積核的大小不變,進行卷積操作。

    7.如權利要求6所述的一種面向熱點事件的重點群組識別方法,其特征在于,在CRF模塊中,對于給定的序列x=(x1,x2,x3,…xn)和對應的標簽序列,經過神經網絡的特征提取層后y=(y1,y2,y3,…yn),每個標簽的得分可以通過線性映射得到:

    ...

    【技術特征摘要】

    1.一種面向熱點事件的重點群組識別方法,其特征在于,包括多源熱點事件觸發的線索發現模塊和基于事件關鍵詞圖的群組發現模塊;

    2.如權利要求1所述的一種面向熱點事件的重點群組識別方法,其特征在于,所述詞圖之間的關聯利用增量式訓練的word2vec模型進行構建,并需要將詞義強相似或地點強關聯的節點之間連邊,構建詞圖語義信息子圖,具體步驟為:首先,使用初始的詞圖數據訓練出基礎的word2vec模型。模型通過常規的word2vec訓練算法生成每個詞的初始向量表示;接著,在增量式更新階段,在接收到新詞圖數據或檢測到語義空間中新的熱點詞匯后,增量式訓練將新數據逐步加入模型中,而不改變原有詞向量的結構,具體為:1)在新的數據輸入時,檢查詞匯表中是否存在新詞,若有,則將這些詞加入模型;2)窗口更新與上下文捕捉:基于滑動窗口捕獲新詞周圍的上下文詞匯,以適應新詞的上下文分布,更新相關詞的向量表示;然后,通過詞向量的相似性來確定連邊條件,如果兩詞之間的語義相似度高于特定閾值,則在詞圖中連邊,若新數據中出現特定地理位置或熱點事件的關聯詞,模型學習這些詞的語義關系并在詞圖中連邊;最后,在詞圖語義信息子圖上進行重疊社區發現算法,即探測圖中所有k-clique,把共享k-1個節點的clique定義為相鄰,聚合到一起得到的最大集合為社區,每個社區即是一個事件代表,之后從索引中恢復該事件代表對應源數據,并抽取信息用于事件表示,去除重復之后得...

    【專利技術屬性】
    技術研發人員:湯星詹嘉措景堃
    申請(專利權)人:國家計算機網絡與信息安全管理中心
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 免费无码A片一区二三区| 在线无码视频观看草草视频| 亚洲成AV人片在线播放无码 | 亚洲成a∧人片在线观看无码| 亚洲人片在线观看天堂无码 | 亚洲AV日韩AV永久无码色欲| 宅男在线国产精品无码| 成人免费午夜无码视频| 伊人久久综合无码成人网| 国产久热精品无码激情| 久久无码无码久久综合综合| 亚洲国产成人精品无码久久久久久综合| 久久久无码精品亚洲日韩按摩| 国产精品va在线观看无码| 亚洲精品无码久久久久久| 亚洲AV永久无码精品成人 | 无码一区二区三区中文字幕| 亚洲Av永久无码精品三区在线| 日韩成人无码影院| 亚洲熟妇无码AV不卡在线播放 | 亚洲av永久中文无码精品综合| 国产色无码精品视频免费| 无码精品久久一区二区三区| 亚洲AV无码AV吞精久久| 中日韩精品无码一区二区三区| 无码成A毛片免费| 国产爆乳无码视频在线观看| 伊人久久综合无码成人网| 人妻少妇无码精品视频区| 无码专区6080yy国产电影| 成人免费无码大片A毛片抽搐色欲| 无码乱肉视频免费大全合集| 伊人久久一区二区三区无码| 中文AV人妻AV无码中文视频| 亚洲中文字幕久久无码| 亚洲AV无码片一区二区三区| 亚洲爆乳精品无码一区二区| 国产AV无码专区亚洲AV麻豆丫 | 精品无码中出一区二区| 精品韩国亚洲av无码不卡区| 无码视频免费一区二三区|