【技術實現(xiàn)步驟摘要】
跨社交網絡的群體感知與立場分析方法、系統(tǒng)和電子設備
[0001]本專利技術涉及人工智能領域,特別是涉及一種跨社交網絡的群體感知與立場分析方法、系統(tǒng)和電子設備。
技術介紹
[0002]立場檢測是自然語言處理領域的前沿研究分支之一,其目標是通過用戶發(fā)布的信息中檢測出其對話題事件及其關聯(lián)對象的看法或者態(tài)度傾向性,例如“贊成、中立或反對”。立場檢測算法是文本分類算法的一個重要應用分支,相比于情感分析任務,其檢測的數(shù)據(jù)更為隱晦,且和對象目標高度相關,因此,分類任務難度更大。
[0003]傳統(tǒng)的立場檢測任務主要針對線下交流數(shù)據(jù)和線上論壇發(fā)言進行立場檢測,然而隨著新媒體技術的發(fā)展,新型的社交網絡平臺已經成為用戶發(fā)布意見立場的主要渠道,例如國內的新浪、抖音和國外的推特、臉書等平臺。因此,衍生出設計媒體平臺的立場檢測任務,現(xiàn)已有國內外發(fā)布基于社交媒體平臺的數(shù)據(jù)集,并提出具有探索意義的模型和方法。
[0004]此外,傳統(tǒng)的立場檢測是針對用戶級的,但一方面用戶的立場是相互影響演化的,即個體不會完全接受或忽略其他個體的觀點,另一方面,用戶的立場態(tài)度匯聚起來才能形成整體的輿論觀點。因此,許多研究展開群體立場分析與決策預測的相關研究,其核心思路是將用戶作為一個群體,通過研究用戶之間的交互過程,從而預測網絡用戶群體的整體立場態(tài)度,最終形成輿情感知。社交媒體的群體立場檢測任務考慮用戶群體在社交媒體的交互過程,并不斷更新和融合群體對同一問題的意見和態(tài)度,最終形成共識、意見極化或觀點分裂等不同的輿情狀態(tài)。
[0005]基于特征表
【技術保護點】
【技術特征摘要】
1.一種跨社交網絡的群體感知與立場分析方法,其特征在于,所述方法包括如下步驟:S100,獲取Q個社交網絡SN1,SN2,
…
,SN
r
,
…
,SN
Q
;r的取值為1到Q;S200,基于非歐雙曲空間的龐加萊球模型將SN1和SN2進行對齊,得到初始融合網絡以及初始融合網絡中的每個節(jié)點在非歐雙曲空間中的表征向量;執(zhí)行S200;所述表征向量包括內容屬性特征向量和拓撲結構特征向量;S300,設置c=c+1,如果c<Q
?
1,執(zhí)行S400;否則,執(zhí)行S500;S400,基于非歐雙曲空間將當前融合網絡和SN
(c+2)
進行對齊,得到融合網絡(c+1)以及融合網絡(c+1)中的每個節(jié)點在非歐雙曲空間中的表征向量;執(zhí)行S300;S500,將當前融合網絡作為目標融合網絡G=(V,X,E),其中,為G中的節(jié)點集合,v
s
為G中的第s個節(jié)點,s的取值為1到n,n為G中的節(jié)點數(shù)量;內容屬性特征集合X={X1,X2,
…
,X
m
,
…
,X
h(m)
},第m個社區(qū)的內容屬性特征集合},第m個社區(qū)的內容屬性特征集合表示G中的第m個社區(qū)中的節(jié)點v
i
的表征向量;拓撲結構特征集合E={E1,E2,
…
,E
m
,
…
,E
h(m)
},表示G中的第m個社區(qū)的節(jié)點v
i
和v
j
之間的邊的集合;m的取值為1到L,i,j的取值為1到h(m),i≠j,L為G中的社區(qū)數(shù)量,h(m)為第m個社區(qū)中的節(jié)點數(shù)量;S600,獲取G中的第m個社區(qū)的內容屬性特征圖C
m
和拓撲結構圖T
m
;其中,C
m
為基于G中第m個社區(qū)中的各節(jié)點之間的距離獲取得到,m個社區(qū)中的各節(jié)點之間的距離獲取得到,為C
m
對應的鄰接矩陣;為T
m
對應的鄰接矩陣;為C
m
中的第i個節(jié)點的內容屬性特征向量,為T
m
中的第i個節(jié)點的拓撲結構特征向量;S700,將C
m
和T
m
輸入到第一層注意力機制中,分別得到對應的內容屬性融合特征和拓撲結構融合特征拓撲結構融合特征拓撲結構融合特征和分別為C
m
和T
m
中的節(jié)點v
i
的內容屬性融合特征和拓撲結構融合特征;S800,將和輸入到第二層注意力機制中,得到第m個社區(qū)的融合特征Z
m
={z
m1
,z
m2
,
…
,z
mi
,
…
,z
mh(m)
};z
mi
為第m個社區(qū)的節(jié)點v
i
的融合特征;S900,將z
mi
輸入到設定的觀點立場傾向預測模型中,得到對應的預測結果Pc
mi
={Pc
mie
}
He=1
,Pc
mie
為節(jié)點v
i
對應的用戶立場屬于第e個觀點立場的概率,H為觀點立場的數(shù)量;S1000,獲取第m個社區(qū)的觀點立場值k
e
為第e個觀點立場的屬性值。2.根據(jù)權利要求1所述的方法,其特征在于,所述每個融合網絡中的節(jié)點的表征向量通過如下步驟獲取:S10,在需要融合的兩個社交網絡的每個節(jié)點中嵌入雙曲空間龐加萊球模型,構建每個
節(jié)點的節(jié)點表征向量目標約束函數(shù)節(jié)點的節(jié)點表征向量目標約束函數(shù)為網絡x中的節(jié)點和之間的雙曲距離,為網絡x中的節(jié)點的鄰居節(jié)點集合,v
x
為網絡x的節(jié)點集合;網絡s表示兩個社交網絡中的源網絡,網絡t表示兩個社交網絡中的目標網絡;S20...
【專利技術屬性】
技術研發(fā)人員:李曉宇,金力,張澤群,李樹超,劉慶,姚方龍,關世昌,馬豪偉,董鵬程,
申請(專利權)人:中國科學院空天信息創(chuàng)新研究院,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。