System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及校園社交網(wǎng)絡(luò),具體涉及一種校園社交網(wǎng)絡(luò)互動(dòng)信息交流平臺(tái)及方法。
技術(shù)介紹
1、校園社交網(wǎng)絡(luò)互動(dòng)信息交流平臺(tái)是一種專門面向校園群體的在線交流工具,通過建立虛擬校園社交空間,學(xué)生、教師和校方能夠在其中互動(dòng)和分享信息。平臺(tái)集成了動(dòng)態(tài)發(fā)布、即時(shí)通訊、資源共享、興趣小組等多種功能,滿足校園社交需求的同時(shí),支持學(xué)生組織活動(dòng)、學(xué)術(shù)討論、學(xué)習(xí)資源共享和校園通知推送等。通過這種平臺(tái),用戶可以便捷地獲取校園活動(dòng)信息、參與學(xué)術(shù)和社交互動(dòng),促進(jìn)校園內(nèi)的信息流動(dòng)與協(xié)作溝通,提升整體校園生活的便利性與互動(dòng)性。
2、校園社交網(wǎng)絡(luò)互動(dòng)信息交流平臺(tái)進(jìn)行網(wǎng)絡(luò)互動(dòng)信息交流時(shí),不易察覺的機(jī)器人賬號(hào)可能在平臺(tái)中大量存在,通過自動(dòng)化手段參與互動(dòng)或發(fā)布虛假信息,這種行為可能會(huì)引發(fā)虛假輿論,甚至影響學(xué)生的學(xué)術(shù)和生活決策,導(dǎo)致信息混亂,擾亂正常的校園秩序,因此,如何在校園社交網(wǎng)絡(luò)互動(dòng)信息交流平臺(tái)中及時(shí)發(fā)現(xiàn)機(jī)器人賬號(hào)并且采取相應(yīng)的措施來應(yīng)對(duì),是目前亟須解決的問題。
3、在所述
技術(shù)介紹
部分公開的上述信息僅用于加強(qiáng)對(duì)本公開的背景的理解,因此它可以包括不構(gòu)成對(duì)本領(lǐng)域普通技術(shù)人員已知的現(xiàn)有技術(shù)的信息。
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)的目的是提供一種校園社交網(wǎng)絡(luò)互動(dòng)信息交流平臺(tái)及方法,通過對(duì)每個(gè)帖子的評(píng)論內(nèi)容進(jìn)行全面信息收集和特征提取,確保對(duì)賬號(hào)行為的完整性分析,利用預(yù)先訓(xùn)練的機(jī)器學(xué)習(xí)模型對(duì)賬號(hào)進(jìn)行分類后,進(jìn)一步通過多帖子綜合分析,提升了對(duì)潛在機(jī)器人賬號(hào)行為模式的評(píng)估精度,最終,通過將潛在機(jī)器人賬號(hào)劃分為高
2、為了實(shí)現(xiàn)上述目的,本專利技術(shù)提供如下技術(shù)方案:一種校園社交網(wǎng)絡(luò)互動(dòng)信息交流方法,包括以下步驟:
3、對(duì)每一個(gè)校園互動(dòng)的帖子進(jìn)行信息收集,收集該帖內(nèi)所有賬號(hào)的互動(dòng)內(nèi)容,確保捕獲所有相關(guān)評(píng)論;
4、針對(duì)同一個(gè)帖子,對(duì)來自同一賬號(hào)的所有評(píng)論信息進(jìn)行特征提取,在完成特征提取后,對(duì)提取的特征進(jìn)行深入分析,將處理和分析后的特征輸入到預(yù)先訓(xùn)練好的機(jī)器學(xué)習(xí)模型中,對(duì)所有賬號(hào)的互動(dòng)評(píng)論情況進(jìn)行預(yù)測(cè);
5、根據(jù)機(jī)器學(xué)習(xí)模型的預(yù)測(cè)結(jié)果,將該帖子中所有的賬號(hào)劃分為正常賬號(hào)和潛在機(jī)器人賬號(hào);
6、對(duì)于被標(biāo)記為潛在機(jī)器人賬號(hào)的賬戶,獲取該賬號(hào)在多個(gè)帖子下的互動(dòng)評(píng)論情況,建立一個(gè)綜合的分析集合,獲取更全面的數(shù)據(jù)以便更準(zhǔn)確地評(píng)估賬號(hào)的行為模式;
7、對(duì)潛在機(jī)器人賬號(hào)的綜合分析集合進(jìn)行深入的分析,根據(jù)綜合分析的結(jié)果,將潛在機(jī)器人賬號(hào)進(jìn)一步劃分為高危賬號(hào)、一般賬號(hào)和低危賬號(hào),針對(duì)不同類型的賬號(hào),分別采取不同類型的措施。
8、優(yōu)選的,通過實(shí)時(shí)或批量抓取實(shí)現(xiàn)信息收集,實(shí)時(shí)或批量抓取實(shí)現(xiàn)信息收集指的是采用不同的數(shù)據(jù)采集方式,從校園互動(dòng)平臺(tái)上獲取帖子內(nèi)的所有賬號(hào)互動(dòng)內(nèi)容;
9、實(shí)時(shí)抓取是指在帖子發(fā)布后立即啟動(dòng)數(shù)據(jù)采集程序,實(shí)時(shí)監(jiān)控并抓取新出現(xiàn)的評(píng)論和互動(dòng)內(nèi)容;
10、批量抓取則是指在指定時(shí)間間隔內(nèi)對(duì)多個(gè)帖子進(jìn)行集中抓取,將指定時(shí)期內(nèi)的互動(dòng)數(shù)據(jù)統(tǒng)一收集。
11、優(yōu)選的,針對(duì)同一個(gè)帖子,對(duì)來自同一賬號(hào)的所有評(píng)論信息進(jìn)行特征提取,其中,提取的特征包括同一賬號(hào)在多個(gè)評(píng)論中使用高度相似內(nèi)容的比例和同一賬號(hào)在短時(shí)間內(nèi)的評(píng)論頻率,對(duì)同一賬號(hào)在多個(gè)評(píng)論中使用高度相似內(nèi)容的比例和同一賬號(hào)在短時(shí)間內(nèi)的評(píng)論頻率進(jìn)行分析后,分別生成重復(fù)內(nèi)容率因子和活躍頻率異常因子,通過重復(fù)內(nèi)容率因子量化同一賬號(hào)在多個(gè)評(píng)論中使用高度相似內(nèi)容的程度,通過活躍頻率異常因子量化同一賬號(hào)在短時(shí)間內(nèi)評(píng)論頻率的異常程度。
12、優(yōu)選的,將對(duì)來自同一賬號(hào)提取的特征進(jìn)行處理和分析后生成的重復(fù)內(nèi)容率因子和活躍頻率異常因子輸入到預(yù)先訓(xùn)練好的機(jī)器學(xué)習(xí)模型中,基于機(jī)器學(xué)習(xí)模型生成潛在機(jī)器人系數(shù),通過潛在機(jī)器人系數(shù)對(duì)所有賬號(hào)的互動(dòng)評(píng)論情況進(jìn)行預(yù)測(cè)。
13、優(yōu)選的,將通過機(jī)器學(xué)習(xí)模型對(duì)賬號(hào)的互動(dòng)評(píng)論情況進(jìn)行預(yù)測(cè)時(shí)生成的潛在機(jī)器人系數(shù)與預(yù)先設(shè)定的潛在機(jī)器人系數(shù)參考閾值進(jìn)行比對(duì)分析,對(duì)帖子中所有的賬號(hào)進(jìn)行劃分,具體的劃分步驟如下:
14、若潛在機(jī)器人系數(shù)大于等于潛在機(jī)器人系數(shù)參考閾值,則將該賬號(hào)劃分為潛在機(jī)器人賬號(hào);
15、若潛在機(jī)器人系數(shù)小于潛在機(jī)器人系數(shù)參考閾值,則將該賬號(hào)劃分為正常賬號(hào)。
16、優(yōu)選的,針對(duì)同一個(gè)帖子,對(duì)同一賬號(hào)在多個(gè)評(píng)論中使用高度相似內(nèi)容的比例進(jìn)行分析后生成重復(fù)內(nèi)容率因子的具體步驟如下:
17、首先,針對(duì)同一賬號(hào)的所有評(píng)論,計(jì)算每對(duì)評(píng)論之間的內(nèi)容相似度,形成評(píng)論內(nèi)容相似度矩陣,設(shè)該賬號(hào)在某帖子下共有若干條評(píng)論,使用自然語言處理技術(shù)中的文本嵌入模型將每條評(píng)論轉(zhuǎn)換為高維向量,對(duì)于任意兩條評(píng)論ci和cj,計(jì)算其余弦相似度,計(jì)算的表達(dá)式為:
18、,
19、其中,和分別是評(píng)論ci和cj的向量表示,和分別表示向量和向量的歐幾里得范數(shù),sim(ci,cj)表示評(píng)論ci和cj的相似度,i和j表示評(píng)論的索引,取值范圍為[-1,1],通過計(jì)算所有評(píng)論的兩兩相似度,構(gòu)建對(duì)稱矩陣sij,其元素sij=sin(ci,cj),表示評(píng)論ci和cj之間的相似程度;
20、基于相似度矩陣sij,計(jì)算該賬號(hào)評(píng)論集合的重復(fù)內(nèi)容比重,引入一個(gè)相似度閾值θ,當(dāng)sim(ci,cj)≥θ時(shí),視評(píng)論ci和cj為“高度相似”,定義高度相似評(píng)論對(duì)的重復(fù)內(nèi)容比重公式為:
21、,
22、其中,為指示函數(shù),當(dāng)條件成立時(shí)取值為1,否則為0,n為賬號(hào)在該帖子下的評(píng)論總數(shù),rx為重復(fù)內(nèi)容比重,取值范圍為[0,1],表示評(píng)論集合中高度相似內(nèi)容的比例;
23、在獲得重復(fù)內(nèi)容比重rx后,通過非線性轉(zhuǎn)換生成重復(fù)內(nèi)容率因子,用于進(jìn)一步放大高重復(fù)內(nèi)容賬號(hào)的風(fēng)險(xiǎn),重復(fù)內(nèi)容率因子的生成表達(dá)式為:
24、,
25、式中,irg為重復(fù)內(nèi)容率因子,∈為極小值,避免分母為零,通過對(duì)rx進(jìn)行非線性放大,使高重復(fù)內(nèi)容的賬號(hào)具有更高的指數(shù)值,結(jié)合評(píng)論數(shù)量和重復(fù)內(nèi)容比重,對(duì)大規(guī)模評(píng)論中的高相似度進(jìn)行動(dòng)態(tài)放大。
26、優(yōu)選的,針對(duì)同一個(gè)帖子,對(duì)同一賬號(hào)在短時(shí)間內(nèi)的評(píng)論頻率進(jìn)行分析后生成活躍頻率異常因子的具體步驟如下:
27、設(shè)定一個(gè)固定的監(jiān)控時(shí)間窗口δt,用于統(tǒng)計(jì)同一賬號(hào)在該時(shí)間段內(nèi)的評(píng)論行為,設(shè)在監(jiān)控時(shí)間窗口δt內(nèi),該賬號(hào)共發(fā)布了y條評(píng)論,記錄每條評(píng)論的時(shí)間戳t1,t2,…,ty,并計(jì)算相鄰評(píng)論的時(shí)間間隔δtu=tu+1-tu(u=1,2,…,y-1),接下來,定義評(píng)論間隔波動(dòng)系數(shù)φ,用于衡量時(shí)間間隔的波動(dòng)程度,評(píng)論間隔波動(dòng)系數(shù)的計(jì)算表達(dá)式為:
28、,
29、其中,tu+1和tu分別是第u+1和第u時(shí)刻的時(shí)間戳,δtu表示第u+1和第u時(shí)刻的時(shí)間間隔,同理,δtu+1表示第u+2和第u+1時(shí)刻的時(shí)間間隔;
30、在本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種校園社交網(wǎng)絡(luò)互動(dòng)信息交流方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種校園社交網(wǎng)絡(luò)互動(dòng)信息交流方法,其特征在于,通過實(shí)時(shí)或批量抓取實(shí)現(xiàn)信息收集,實(shí)時(shí)或批量抓取實(shí)現(xiàn)信息收集指的是采用不同的數(shù)據(jù)采集方式,從校園互動(dòng)平臺(tái)上獲取帖子內(nèi)的所有賬號(hào)互動(dòng)內(nèi)容;
3.根據(jù)權(quán)利要求1所述的一種校園社交網(wǎng)絡(luò)互動(dòng)信息交流方法,其特征在于,針對(duì)同一個(gè)帖子,對(duì)來自同一賬號(hào)的所有評(píng)論信息進(jìn)行特征提取,其中,提取的特征包括同一賬號(hào)在多個(gè)評(píng)論中使用高度相似內(nèi)容的比例和同一賬號(hào)在短時(shí)間內(nèi)的評(píng)論頻率,對(duì)同一賬號(hào)在多個(gè)評(píng)論中使用高度相似內(nèi)容的比例和同一賬號(hào)在短時(shí)間內(nèi)的評(píng)論頻率進(jìn)行分析后,分別生成重復(fù)內(nèi)容率因子和活躍頻率異常因子,通過重復(fù)內(nèi)容率因子量化同一賬號(hào)在多個(gè)評(píng)論中使用高度相似內(nèi)容的程度,通過活躍頻率異常因子量化同一賬號(hào)在短時(shí)間內(nèi)評(píng)論頻率的異常程度。
4.根據(jù)權(quán)利要求3所述的一種校園社交網(wǎng)絡(luò)互動(dòng)信息交流方法,其特征在于,將對(duì)來自同一賬號(hào)提取的特征進(jìn)行處理和分析后生成的重復(fù)內(nèi)容率因子和活躍頻率異常因子輸入到預(yù)先訓(xùn)練好的機(jī)器學(xué)習(xí)模型中,基于機(jī)器學(xué)習(xí)模型生成潛
5.根據(jù)權(quán)利要求4所述的一種校園社交網(wǎng)絡(luò)互動(dòng)信息交流方法,其特征在于,將通過機(jī)器學(xué)習(xí)模型對(duì)賬號(hào)的互動(dòng)評(píng)論情況進(jìn)行預(yù)測(cè)時(shí)生成的潛在機(jī)器人系數(shù)與預(yù)先設(shè)定的潛在機(jī)器人系數(shù)參考閾值進(jìn)行比對(duì)分析,對(duì)帖子中所有的賬號(hào)進(jìn)行劃分,具體的劃分步驟如下:
6.根據(jù)權(quán)利要求3所述的一種校園社交網(wǎng)絡(luò)互動(dòng)信息交流方法,其特征在于,針對(duì)同一個(gè)帖子,對(duì)同一賬號(hào)在多個(gè)評(píng)論中使用高度相似內(nèi)容的比例進(jìn)行分析后生成重復(fù)內(nèi)容率因子的具體步驟如下:
7.根據(jù)權(quán)利要求6所述的一種校園社交網(wǎng)絡(luò)互動(dòng)信息交流方法,其特征在于,針對(duì)同一個(gè)帖子,對(duì)同一賬號(hào)在短時(shí)間內(nèi)的評(píng)論頻率進(jìn)行分析后生成活躍頻率異常因子的具體步驟如下:
8.根據(jù)權(quán)利要求4所述的一種校園社交網(wǎng)絡(luò)互動(dòng)信息交流方法,其特征在于,對(duì)于被標(biāo)記為潛在機(jī)器人賬號(hào)的賬戶,收集該賬號(hào)在多個(gè)帖子中的互動(dòng)評(píng)論數(shù)據(jù),建立一個(gè)綜合分析集合,設(shè)定帖子集合為C,C={Pp}={P1,P2,…,Pq},其中Pp表示第p個(gè)帖子,對(duì)于每個(gè)帖子,通過預(yù)先訓(xùn)練的機(jī)器學(xué)習(xí)模型計(jì)算該帖子的潛在機(jī)器人系數(shù),然后對(duì)該賬號(hào)的多帖潛在機(jī)器人系數(shù)進(jìn)行加權(quán)平均,公式如下:
9.根據(jù)權(quán)利要求8所述的一種校園社交網(wǎng)絡(luò)互動(dòng)信息交流方法,其特征在于,將綜合行為偏差指數(shù)與預(yù)先設(shè)定的第一綜合行為偏差指數(shù)參考閾值和第二綜合行為偏差指數(shù)參考閾值進(jìn)行比對(duì)分析,其中,第一綜合行為偏差指數(shù)參考閾值小于第二綜合行為偏差指數(shù)參考閾值,將潛在機(jī)器人賬號(hào)進(jìn)一步劃分,具體劃分的步驟如下:
10.一種校園社交網(wǎng)絡(luò)互動(dòng)信息交流平臺(tái),用于實(shí)現(xiàn)上述權(quán)利要求1-9中任意一項(xiàng)所述的校園社交網(wǎng)絡(luò)互動(dòng)信息交流方法,其特征在于,包括信息收集模塊、特征提取與預(yù)測(cè)模塊、初步分類模塊、多帖綜合分析模塊以及風(fēng)險(xiǎn)分級(jí)與管理模塊;
...【技術(shù)特征摘要】
1.一種校園社交網(wǎng)絡(luò)互動(dòng)信息交流方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種校園社交網(wǎng)絡(luò)互動(dòng)信息交流方法,其特征在于,通過實(shí)時(shí)或批量抓取實(shí)現(xiàn)信息收集,實(shí)時(shí)或批量抓取實(shí)現(xiàn)信息收集指的是采用不同的數(shù)據(jù)采集方式,從校園互動(dòng)平臺(tái)上獲取帖子內(nèi)的所有賬號(hào)互動(dòng)內(nèi)容;
3.根據(jù)權(quán)利要求1所述的一種校園社交網(wǎng)絡(luò)互動(dòng)信息交流方法,其特征在于,針對(duì)同一個(gè)帖子,對(duì)來自同一賬號(hào)的所有評(píng)論信息進(jìn)行特征提取,其中,提取的特征包括同一賬號(hào)在多個(gè)評(píng)論中使用高度相似內(nèi)容的比例和同一賬號(hào)在短時(shí)間內(nèi)的評(píng)論頻率,對(duì)同一賬號(hào)在多個(gè)評(píng)論中使用高度相似內(nèi)容的比例和同一賬號(hào)在短時(shí)間內(nèi)的評(píng)論頻率進(jìn)行分析后,分別生成重復(fù)內(nèi)容率因子和活躍頻率異常因子,通過重復(fù)內(nèi)容率因子量化同一賬號(hào)在多個(gè)評(píng)論中使用高度相似內(nèi)容的程度,通過活躍頻率異常因子量化同一賬號(hào)在短時(shí)間內(nèi)評(píng)論頻率的異常程度。
4.根據(jù)權(quán)利要求3所述的一種校園社交網(wǎng)絡(luò)互動(dòng)信息交流方法,其特征在于,將對(duì)來自同一賬號(hào)提取的特征進(jìn)行處理和分析后生成的重復(fù)內(nèi)容率因子和活躍頻率異常因子輸入到預(yù)先訓(xùn)練好的機(jī)器學(xué)習(xí)模型中,基于機(jī)器學(xué)習(xí)模型生成潛在機(jī)器人系數(shù),通過潛在機(jī)器人系數(shù)對(duì)所有賬號(hào)的互動(dòng)評(píng)論情況進(jìn)行預(yù)測(cè)。
5.根據(jù)權(quán)利要求4所述的一種校園社交網(wǎng)絡(luò)互動(dòng)信息交流方法,其特征在于,將通過機(jī)器學(xué)習(xí)模型對(duì)賬號(hào)的互動(dòng)評(píng)論情況進(jìn)行預(yù)測(cè)時(shí)生成的潛在機(jī)器人系數(shù)與預(yù)先設(shè)定的潛在機(jī)器人系數(shù)參考閾值進(jìn)行比對(duì)分析,對(duì)帖子中所有的賬號(hào)進(jìn)行劃分,具體的...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:王依才,郭亞飛,
申請(qǐng)(專利權(quán))人:山東政法學(xué)院,
類型:發(fā)明
國別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。