System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現(xiàn)步驟摘要】
本專利技術涉及一種數(shù)據(jù)分析預測模型,具體地說是一種基于傳播樹映射與興趣降噪的微博轉(zhuǎn)發(fā)預測模型。
技術介紹
1、數(shù)智時代,以微博為代表的社會化媒體平臺已成為人們獲取和分享信息的核心樞紐。以新浪微博為例,截至2024年3月底,其月活躍用戶數(shù)已達到5.88億,龐大的用戶群體為微博平臺積累海量數(shù)據(jù)。如何從海量數(shù)據(jù)中進行網(wǎng)絡輿情分析已成為信息資源管理、計算機科學等多個領域共同關注的熱點。微博轉(zhuǎn)發(fā)預測作為網(wǎng)絡輿情分析的關鍵環(huán)節(jié),其精準性對提升信息傳播效率、挖掘熱點話題、加強輿情監(jiān)控等研究具有重要參考意義。
2、關于微博轉(zhuǎn)發(fā)預測,現(xiàn)有研究主要通過計算待轉(zhuǎn)發(fā)微博與用戶興趣之間的相似度實現(xiàn)預測任務。由于相似度計算依賴于準確的微博表示和用戶興趣表示,因此學習微博表示和用戶興趣表示是微博轉(zhuǎn)發(fā)預測的核心。對于微博表示學習,現(xiàn)有研究主要基于主題標簽、文本內(nèi)容、表情符號等信息學習微博內(nèi)容特征,以綜合多源內(nèi)容特征表示微博。對于用戶興趣表示學習,現(xiàn)有研究主要從用戶的歷史轉(zhuǎn)發(fā)微博集中挖掘用戶的興趣類別、演化興趣、多樣化興趣等多種興趣表示,以準確刻畫用戶的興趣偏好。
3、對于微博表示學習,現(xiàn)有研究主要通過挖掘微博的內(nèi)容特征建模微博表示,以通過充分地捕獲微博的語義實現(xiàn)微博轉(zhuǎn)發(fā)預測任務。例如:yin等綜合微博的文本內(nèi)容和時間信息提出一種多模態(tài)感知的微博表示學習方法,以通過建模不同特征之間的隱含關系實現(xiàn)預測用戶的微博轉(zhuǎn)發(fā)行為。wang等結(jié)合微博的文本內(nèi)容與數(shù)字標簽對微博表示進行學習,并通過多任務深度學習建模特征之間的潛在關聯(lián),以進一步提升微博轉(zhuǎn)發(fā)
4、對于用戶興趣表示學習,現(xiàn)有研究主要從用戶的歷史轉(zhuǎn)發(fā)微博集中挖掘用戶興趣,以通過理解用戶歷史轉(zhuǎn)發(fā)內(nèi)容準確推斷用戶偏好。在微博轉(zhuǎn)發(fā)預測情景下,傳統(tǒng)研究主要通過人工定義統(tǒng)計規(guī)則量化用戶興趣。例如:徐建民等通過定義用戶的轉(zhuǎn)發(fā)行為習慣、轉(zhuǎn)發(fā)對象習慣和轉(zhuǎn)發(fā)內(nèi)容習慣的方法,量化用戶興趣,從而預測用戶的轉(zhuǎn)發(fā)行為。隨著深度學習技術的快速發(fā)展,循環(huán)神經(jīng)網(wǎng)絡、注意力機制等基于深度學習的用戶興趣學習方法得到廣泛關注。例如:gan等提出一種融合注意力機制的雙層循環(huán)神經(jīng)網(wǎng)絡,并通過挖掘用戶興趣和電影吸引力的演變規(guī)律為用戶興趣表示提供時序建模視角。sun等發(fā)現(xiàn)用戶會通過轉(zhuǎn)發(fā)不感興趣的微博維持友誼,并通過提出一種因果注意力機制學習不同興趣因素對用戶轉(zhuǎn)發(fā)行為的因果影響,進而有效提高微博轉(zhuǎn)發(fā)預測性能。鄭聰?shù)仍谖⒉┺D(zhuǎn)發(fā)預測情景下,利用基于自注意力機制提取用戶對轉(zhuǎn)發(fā)內(nèi)容的偏好程度,并通過注意力機制融合多種用戶偏好,以全面建模用戶興趣表示。
5、微博作為一種典型的短文本文檔,微博的內(nèi)容特征有限,僅依據(jù)微博內(nèi)容特征難以保證微博表示的充分性,進而影響對微博轉(zhuǎn)發(fā)預測的準確性。
技術實現(xiàn)思路
1、本專利技術的目的是提供一種基于傳播樹映射與興趣降噪的微博轉(zhuǎn)發(fā)預測模型,以解決現(xiàn)有預測模型對微博轉(zhuǎn)發(fā)預測的準確性低的問題。
2、本專利技術的目的是這樣實現(xiàn)的:
3、一種基于傳播樹映射與興趣降噪的微博轉(zhuǎn)發(fā)預測模型,包括:
4、傳播樹學習層,與興趣降噪層相連,用于將微博映射為傳播樹,并通過傳播樹學習生成綜合內(nèi)容特征和傳播特征的微博表示;
5、興趣降噪層,分別與傳播樹學習層和預測與訓練層相連,用于對用戶歷史轉(zhuǎn)發(fā)微博集進行降噪學習;以及
6、預測與訓練層,與興趣降噪層相連,用于預測用戶對微博的轉(zhuǎn)發(fā)概率。
7、進一步地,所述傳播樹學習層根據(jù)用戶歷史轉(zhuǎn)發(fā)的微博確定源微博;根據(jù)源微博而衍生出的傳播內(nèi)容映射成節(jié)點,將源微博的傳播關系映射成邊,生成傳播樹;對傳播樹中的節(jié)點進行初始化;將初始化后的傳播樹進行雙重圖池化,生成傳播樹表示;所述傳播內(nèi)容包括評論內(nèi)容和轉(zhuǎn)發(fā)內(nèi)容,所述傳播關系包括轉(zhuǎn)發(fā)關系和評論關系。
8、進一步地,所述傳播樹學習層選用skip-gram算法首先劃分文本內(nèi)容的中關鍵詞,將關鍵詞編碼為詞向量,并平均池化詞向量得到節(jié)點的初始化表示。
9、進一步地,所述傳播樹學習層對初始化后的傳播樹進行傳播路徑池化,生成傳播路徑表示,對傳播路徑池化后的傳播樹進行傳播樹池化,生成傳播樹表示。
10、進一步地,所述傳播樹學習層以節(jié)點的關鍵詞數(shù)量為節(jié)點權重,通過加權融合生成傳播路徑表示。
11、進一步地,所述傳播樹學習層通過超參數(shù)θ對根節(jié)點表示和傳播路徑表示進行加權融合,以生成傳播樹表示。
12、進一步地,所述興趣降噪層根據(jù)傳播樹表示和用戶歷史轉(zhuǎn)發(fā)的微博,生成歷史轉(zhuǎn)發(fā)微博集表示;對歷史轉(zhuǎn)發(fā)微博表示進行興趣降噪學習,生成用戶興趣表示。
13、進一步地,所述興趣降噪層對用戶歷史轉(zhuǎn)發(fā)的每篇微博的id進行編碼,生成id表示;拼接id表示和傳播樹表示,生成歷史轉(zhuǎn)發(fā)微博表示;根據(jù)用戶的歷史轉(zhuǎn)發(fā)順序堆疊微博表示,得到歷史轉(zhuǎn)發(fā)微博集表示。
14、進一步地,所述興趣降噪層根據(jù)微博的發(fā)布時間表示和轉(zhuǎn)發(fā)時間表示生成微博時間表示,拼接微博時間表示和歷史轉(zhuǎn)發(fā)微博表示,生成時間感知的歷史轉(zhuǎn)發(fā)微博集表示;根據(jù)快速傅里葉變換將時間感知的歷史轉(zhuǎn)發(fā)微博集表示映射到頻率域;利用濾波器進行映射到頻率域的數(shù)據(jù)降噪;通過快速傅里葉逆變換將降噪后的數(shù)據(jù)逆映射,生成用戶興趣表示;發(fā)布時間表示和轉(zhuǎn)發(fā)時間表示為時間轉(zhuǎn)化為時間向量并歸一化后的時間表示。
15、進一步地,在利用濾波器進行數(shù)據(jù)降噪之后,對降噪后的數(shù)據(jù)進行隨機失活和層歸一化,計算公式為:
16、
17、其中,為輸入數(shù)據(jù)經(jīng)過第l個濾波器之后的殘差連接、層歸一化和隨機失活的輸出,為第l-1個濾波器的輸出。
18、根據(jù)前饋神經(jīng)網(wǎng)絡對層歸一化后的數(shù)據(jù)進行計算,計算公式為:
19、
20、其中,為經(jīng)過第l個濾波器的數(shù)據(jù)經(jīng)過前饋神經(jīng)網(wǎng)絡的輸出,w1和w2為權重矩陣,b1和b2為偏置向量。
21、進一步地,所述預測與訓練層根據(jù)待預測微博表示和生成的用戶興趣表示,得到用戶的興趣得分,依據(jù)得分大小選取top-k微博作為轉(zhuǎn)發(fā)預測結(jié)果;所述待預測微博表示是待預測微博經(jīng)過傳播樹學習層和興趣降噪層處理得到的。
22、本專利技術提出一種基于傳播樹映射與興趣降噪的微博轉(zhuǎn)發(fā)預測模型,通過優(yōu)化微博表示和用戶興趣表示,進一步提升微博轉(zhuǎn)發(fā)預測性能。本專利技術將每篇微博映射為一棵傳播樹,綜合內(nèi)容特征和傳播特征更充分地學習微博表示,設計雙重圖池化機制進行傳播樹學習,得到綜合內(nèi)容特征與傳播特征的微博表示,以增強微博表示的充分性和準確性;基于用戶歷史本文檔來自技高網(wǎng)...
【技術保護點】
1.一種基于傳播樹映射與興趣降噪的微博轉(zhuǎn)發(fā)預測模型,其特征在于,包括:
2.根據(jù)權利要求1所述的基于傳播樹映射與興趣降噪的微博轉(zhuǎn)發(fā)預測模型,其特征在于,所述傳播樹學習層根據(jù)用戶歷史轉(zhuǎn)發(fā)的微博確定源微博;根據(jù)源微博而衍生出的傳播內(nèi)容映射成節(jié)點,將源微博的傳播關系映射成邊,生成傳播樹;對傳播樹中的節(jié)點進行初始化;將初始化后的傳播樹進行雙重圖池化,生成傳播樹表示;所述傳播內(nèi)容包括評論內(nèi)容和轉(zhuǎn)發(fā)內(nèi)容,所述傳播關系包括轉(zhuǎn)發(fā)關系和評論關系。
3.根據(jù)權利要求2所述的基于傳播樹映射與興趣降噪的微博轉(zhuǎn)發(fā)預測模型,其特征在于,所述傳播樹學習層選用skip-gram算法首先劃分文本內(nèi)容的中關鍵詞,將關鍵詞編碼為詞向量,并平均池化詞向量得到節(jié)點的初始化表示。
4.根據(jù)權利要求3所述的基于傳播樹映射與興趣降噪的微博轉(zhuǎn)發(fā)預測模型,其特征在于,所述傳播樹學習層對初始化后的傳播樹進行傳播路徑池化,生成傳播路徑表示,對傳播路徑池化后的傳播樹進行傳播樹池化,生成傳播樹表示。
5.根據(jù)權利要求4所述的基于傳播樹映射與興趣降噪的微博轉(zhuǎn)發(fā)預測模型,其特征在于,所述傳播樹學
6.根據(jù)權利要求2所述的基于傳播樹映射與興趣降噪的微博轉(zhuǎn)發(fā)預測模型,其特征在于,所述興趣降噪層根據(jù)傳播樹表示和用戶歷史轉(zhuǎn)發(fā)的微博,生成歷史轉(zhuǎn)發(fā)微博集表示;對歷史轉(zhuǎn)發(fā)微博表示進行興趣降噪學習,生成用戶興趣表示。
7.根據(jù)權利要求6所述的基于傳播樹映射與興趣降噪的微博轉(zhuǎn)發(fā)預測模型,其特征在于,所述興趣降噪層對用戶歷史轉(zhuǎn)發(fā)的每篇微博的ID進行編碼,生成ID表示;拼接ID表示和傳播樹表示,生成歷史轉(zhuǎn)發(fā)微博表示;根據(jù)用戶的歷史轉(zhuǎn)發(fā)順序堆疊微博表示,得到歷史轉(zhuǎn)發(fā)微博集表示。
8.根據(jù)權利要求6所述的基于傳播樹映射與興趣降噪的微博轉(zhuǎn)發(fā)預測模型,其特征在于,所述興趣降噪層根據(jù)微博的發(fā)布時間表示和轉(zhuǎn)發(fā)時間表示生成微博時間表示,拼接微博時間表示和歷史轉(zhuǎn)發(fā)微博表示,生成時間感知的歷史轉(zhuǎn)發(fā)微博集表示;根據(jù)快速傅里葉變換將時間感知的歷史轉(zhuǎn)發(fā)微博集表示映射到頻率域;利用濾波器進行映射到頻率域的數(shù)據(jù)降噪;通過快速傅里葉逆變換將降噪后的數(shù)據(jù)逆映射,生成用戶興趣表示;發(fā)布時間表示和轉(zhuǎn)發(fā)時間表示為時間轉(zhuǎn)化為時間向量并歸一化后的時間表示。
9.根據(jù)權利要求6所述的基于傳播樹映射與興趣降噪的微博轉(zhuǎn)發(fā)預測模型,其特征在于,在利用濾波器進行數(shù)據(jù)降噪之后,對降噪后的數(shù)據(jù)進行隨機失活和層歸一化,計算公式為:
10.根據(jù)權利要求6所述的基于傳播樹映射與興趣降噪的微博轉(zhuǎn)發(fā)預測模型,其特征在于,所述預測與訓練層根據(jù)待預測微博表示和生成的用戶興趣表示,得到用戶的興趣得分,依據(jù)得分大小選取Top-K微博作為轉(zhuǎn)發(fā)預測結(jié)果;所述待預測微博表示是待預測微博經(jīng)過傳播樹學習層和興趣降噪層處理得到的。
...【技術特征摘要】
1.一種基于傳播樹映射與興趣降噪的微博轉(zhuǎn)發(fā)預測模型,其特征在于,包括:
2.根據(jù)權利要求1所述的基于傳播樹映射與興趣降噪的微博轉(zhuǎn)發(fā)預測模型,其特征在于,所述傳播樹學習層根據(jù)用戶歷史轉(zhuǎn)發(fā)的微博確定源微博;根據(jù)源微博而衍生出的傳播內(nèi)容映射成節(jié)點,將源微博的傳播關系映射成邊,生成傳播樹;對傳播樹中的節(jié)點進行初始化;將初始化后的傳播樹進行雙重圖池化,生成傳播樹表示;所述傳播內(nèi)容包括評論內(nèi)容和轉(zhuǎn)發(fā)內(nèi)容,所述傳播關系包括轉(zhuǎn)發(fā)關系和評論關系。
3.根據(jù)權利要求2所述的基于傳播樹映射與興趣降噪的微博轉(zhuǎn)發(fā)預測模型,其特征在于,所述傳播樹學習層選用skip-gram算法首先劃分文本內(nèi)容的中關鍵詞,將關鍵詞編碼為詞向量,并平均池化詞向量得到節(jié)點的初始化表示。
4.根據(jù)權利要求3所述的基于傳播樹映射與興趣降噪的微博轉(zhuǎn)發(fā)預測模型,其特征在于,所述傳播樹學習層對初始化后的傳播樹進行傳播路徑池化,生成傳播路徑表示,對傳播路徑池化后的傳播樹進行傳播樹池化,生成傳播樹表示。
5.根據(jù)權利要求4所述的基于傳播樹映射與興趣降噪的微博轉(zhuǎn)發(fā)預測模型,其特征在于,所述傳播樹學習層以節(jié)點的關鍵詞數(shù)量為節(jié)點權重,通過加權融合生成傳播路徑表示;所述傳播樹學習層通過超參數(shù)θ對根節(jié)點表示和傳播路徑表示進行加權融合,以生成傳播樹表示。
6.根據(jù)權利要求2所述的基于傳播樹映射與興趣降噪的微博轉(zhuǎn)發(fā)預測模型,其特征在于,所述興趣降噪層根據(jù)傳播樹表示和用戶歷史轉(zhuǎn)發(fā)...
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。