System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本申請(qǐng)涉及大數(shù)據(jù)分析領(lǐng)域,尤其涉及一種應(yīng)用在學(xué)生群體社交中的社區(qū)劃分方法和裝置。
技術(shù)介紹
1、隨著社交網(wǎng)絡(luò)和大數(shù)據(jù)的快速發(fā)展,針對(duì)群體的行為分析和畫像構(gòu)建已成為學(xué)術(shù)研究和商業(yè)應(yīng)用中的重要領(lǐng)域。特別是在高校中,通過分析學(xué)生的消費(fèi)行為、社交行為等,能夠更好地理解學(xué)生群體的特征,從而提供個(gè)性化的服務(wù)和管理策略。
2、目前,社區(qū)劃分技術(shù)主要依賴于圖論中的各種算法,如fast?unfolding算法、標(biāo)簽傳播算法(lpa)、隨機(jī)游走算法(deepwalk)等。上述算法通過分析圖中的節(jié)點(diǎn)和邊結(jié)構(gòu),利用節(jié)點(diǎn)之間的連接強(qiáng)度(邊的權(quán)重)來劃分社區(qū)。例如,fast?unfolding算法能夠快速高效地通過模塊度(modularity)優(yōu)化將節(jié)點(diǎn)聚合為不同的社區(qū)。然而,上述算法大多只考慮了圖中節(jié)點(diǎn)之間的連接強(qiáng)度,即節(jié)點(diǎn)之間的邊的權(quán)重,但是卻忽略了節(jié)點(diǎn)自身的屬性,此時(shí),當(dāng)節(jié)點(diǎn)屬性差異較大的情況下,基于邊權(quán)重的劃分結(jié)果容易出現(xiàn)偏差,因此存在無法充分挖掘?qū)W生之間的相似性,從而導(dǎo)致社區(qū)劃分的準(zhǔn)確度降低的問題。
3、因此,亟需一種應(yīng)用在學(xué)生群體社交中的社區(qū)劃分方法和裝置。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)?zhí)峁┮环N應(yīng)用在學(xué)生群體社交中的社區(qū)劃分方法和裝置,解決了當(dāng)節(jié)點(diǎn)屬性差異較大的情況下,基于邊權(quán)重的劃分結(jié)果容易出現(xiàn)偏差,存在無法充分挖掘?qū)W生之間的相似性,從而導(dǎo)致社區(qū)劃分的準(zhǔn)確度降低的問題。
2、在本申請(qǐng)的第一方面提供了一種應(yīng)用在學(xué)生群體社交中的社區(qū)劃分方法,方法包括:響應(yīng)于針對(duì)每個(gè)學(xué)
3、可選地,按照預(yù)設(shè)方式對(duì)學(xué)生消費(fèi)數(shù)據(jù)進(jìn)行分組,以獲取分組后的學(xué)生共現(xiàn)對(duì),具體包括:獲取學(xué)生消費(fèi)數(shù)據(jù)中的第一消費(fèi)數(shù)據(jù)與第二消費(fèi)數(shù)據(jù),第一消費(fèi)數(shù)據(jù)與第二消費(fèi)數(shù)據(jù)為學(xué)生消費(fèi)數(shù)據(jù)中任意兩個(gè)不同學(xué)生對(duì)應(yīng)的消費(fèi)數(shù)據(jù);判斷第一消費(fèi)數(shù)據(jù)與第二消費(fèi)數(shù)據(jù)是否滿足同一天記錄的消費(fèi)數(shù)據(jù),且判斷第一消費(fèi)數(shù)據(jù)與第二消費(fèi)數(shù)據(jù)是否滿足同一地點(diǎn)記錄的消費(fèi)數(shù)據(jù);若第一消費(fèi)數(shù)據(jù)與第二消費(fèi)數(shù)據(jù)滿足同一天記錄的消費(fèi)數(shù)據(jù),且第一消費(fèi)數(shù)據(jù)與第二消費(fèi)數(shù)據(jù)滿足同一地點(diǎn)記錄的消費(fèi)數(shù)據(jù),確認(rèn)將第一消費(fèi)數(shù)據(jù)與第二消費(fèi)數(shù)據(jù)分組為同一個(gè)學(xué)生共現(xiàn)對(duì)。
4、可選地,構(gòu)建學(xué)生網(wǎng)絡(luò)圖對(duì)應(yīng)的目標(biāo)結(jié)構(gòu)矩陣,具體包括:根據(jù)圖節(jié)點(diǎn)的屬性,獲取學(xué)生網(wǎng)絡(luò)圖對(duì)應(yīng)的第一圖節(jié)點(diǎn)向量;根據(jù)連接關(guān)系,獲取學(xué)生網(wǎng)絡(luò)圖對(duì)應(yīng)的第二圖節(jié)點(diǎn)向量;根據(jù)第一圖節(jié)點(diǎn)向量構(gòu)建第一矩陣,根據(jù)第二圖節(jié)點(diǎn)向量構(gòu)建第二矩陣;對(duì)第一矩陣和第二矩陣進(jìn)行求和,以獲取求和后的目標(biāo)結(jié)構(gòu)矩陣。
5、可選地,第一矩陣包括第一維度、第二維度以及第三維度,第一維度為圖節(jié)點(diǎn)的數(shù)量維度,第二維度為學(xué)生基本屬性數(shù)據(jù)的類別數(shù)量維度,第三維度為第一矩陣中嵌入向量的維度,在根據(jù)第一圖節(jié)點(diǎn)向量構(gòu)建第一矩陣之后,方法還包括:對(duì)第一矩陣的第二維度進(jìn)行累加求和,以對(duì)第一矩陣進(jìn)行維度變化,進(jìn)行維度變化前的第一矩陣對(duì)應(yīng)的第一時(shí)空復(fù)雜程度,大于進(jìn)行維度變化后的第一矩陣對(duì)應(yīng)的第二時(shí)空復(fù)雜程度。
6、可選地,通過目標(biāo)結(jié)構(gòu)矩陣,根據(jù)學(xué)生社區(qū)劃分模型計(jì)算每個(gè)學(xué)生之間的相似度矩陣,具體包括,通過如下公式計(jì)算相似度矩陣:
7、new_sij=sij+pitpj;
8、其中,new_sij為相似度矩陣,sij為學(xué)生網(wǎng)絡(luò)圖中,第i個(gè)圖節(jié)點(diǎn)與第j個(gè)圖節(jié)點(diǎn)之間的相似度值,為對(duì)sij進(jìn)行歸一化處理,p為m*m矩陣,m為圖節(jié)點(diǎn)的數(shù)量,t為轉(zhuǎn)置矩陣。
9、可選地,根據(jù)節(jié)點(diǎn)相似度算法,并通過如下公式計(jì)算第i個(gè)圖節(jié)點(diǎn)與第j個(gè)圖節(jié)點(diǎn)之間的相似度值:
10、
11、其中,n(i)為與第i個(gè)圖節(jié)點(diǎn)的相鄰的第一圖節(jié)點(diǎn)集合,n(j)為與第j個(gè)圖節(jié)點(diǎn)的相鄰的第二圖節(jié)點(diǎn)集合,c為第一圖節(jié)點(diǎn)集合與第二圖節(jié)點(diǎn)集合的交集,ωc為交集中任意一個(gè)圖節(jié)點(diǎn)的度,ωij為第i個(gè)圖節(jié)點(diǎn)與第j個(gè)圖節(jié)點(diǎn)之間的連接權(quán)重值。
12、可選地,根據(jù)相似度矩陣對(duì)每個(gè)學(xué)生進(jìn)行社區(qū)劃分操作,具體包括:根據(jù)相似度矩陣,計(jì)算第一學(xué)生與第二學(xué)生之間的模塊度,第一學(xué)生與第二學(xué)生為多個(gè)學(xué)生中任意兩個(gè)不同學(xué)生;判斷模塊度是否為正值;若模塊度為正值,則將第一學(xué)生與第二學(xué)生劃分為同一社區(qū),以進(jìn)行社區(qū)劃分操作。
13、在本申請(qǐng)的第二方面提供了一種應(yīng)用在學(xué)生群體社交中的社區(qū)劃分裝置,裝置包括獲取模塊以及處理模塊,其中,
14、獲取模塊,用于響應(yīng)于針對(duì)每個(gè)學(xué)生進(jìn)行社區(qū)劃分操作,獲取學(xué)生特征數(shù)據(jù),學(xué)生特征數(shù)據(jù)包括學(xué)生消費(fèi)數(shù)據(jù)、學(xué)生基本屬性數(shù)據(jù)以及學(xué)生畫像標(biāo)簽數(shù)據(jù);按照預(yù)設(shè)方式對(duì)學(xué)生消費(fèi)數(shù)據(jù)進(jìn)行分組,以獲取分組后的學(xué)生共現(xiàn)對(duì)。
15、處理模塊,用于根據(jù)學(xué)生基本屬性數(shù)據(jù)、學(xué)生畫像標(biāo)簽數(shù)據(jù)以及學(xué)生共現(xiàn)對(duì),構(gòu)建學(xué)生網(wǎng)絡(luò)圖;學(xué)生網(wǎng)絡(luò)圖包括多個(gè)圖節(jié)點(diǎn)和多個(gè)圖節(jié)點(diǎn)之間的連接關(guān)系,多個(gè)圖節(jié)點(diǎn)由基本屬性數(shù)據(jù)和學(xué)生畫像標(biāo)簽數(shù)據(jù)進(jìn)行構(gòu)建,每個(gè)圖節(jié)點(diǎn)和每個(gè)學(xué)生一一對(duì)應(yīng);連接關(guān)系由學(xué)生共現(xiàn)對(duì)進(jìn)行構(gòu)建;根據(jù)圖節(jié)點(diǎn)和連接關(guān)系構(gòu)建學(xué)生網(wǎng)絡(luò)圖對(duì)應(yīng)的目標(biāo)結(jié)構(gòu)矩陣,并通過目標(biāo)結(jié)構(gòu)矩陣,根據(jù)學(xué)生社區(qū)劃分模型計(jì)算每個(gè)學(xué)生之間的相似度矩陣;根據(jù)相似度矩陣對(duì)每個(gè)學(xué)生進(jìn)行社區(qū)劃分操作。
16、在本申請(qǐng)的第三方面提供了一種電子設(shè)備,包括處理器、存儲(chǔ)器、用戶接口及網(wǎng)絡(luò)接口,存儲(chǔ)器用于存儲(chǔ)指令,用戶接口和網(wǎng)絡(luò)接口用于給其他設(shè)備通信,處理器用于執(zhí)行存儲(chǔ)器中存儲(chǔ)的指令,以使電子設(shè)備執(zhí)行如上述任意一項(xiàng)的方法。
17、在本申請(qǐng)的第四方面提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,計(jì)算機(jī)程序被處理器執(zhí)行如上述任意一項(xiàng)的方法。
18、本申請(qǐng)實(shí)施例中提供的一個(gè)或多個(gè)技術(shù)方案,至少具有如下技術(shù)效果或優(yōu)點(diǎn):
19、1、當(dāng)針對(duì)每個(gè)學(xué)生進(jìn)行社區(qū)劃分操作時(shí),獲取學(xué)生特征數(shù)據(jù),并按照預(yù)設(shè)方式對(duì)學(xué)生消費(fèi)數(shù)據(jù)進(jìn)行分組,以獲取分組后的學(xué)生共現(xiàn)對(duì),且根據(jù)學(xué)生基本屬性數(shù)據(jù)、學(xué)生畫像標(biāo)簽數(shù)據(jù)以及學(xué)生共現(xiàn)對(duì),構(gòu)建學(xué)生網(wǎng)絡(luò)圖,學(xué)生網(wǎng)絡(luò)圖包括多個(gè)圖節(jié)點(diǎn)和多個(gè)圖節(jié)點(diǎn)之間的連接關(guān)系;根據(jù)圖節(jié)點(diǎn)和連接關(guān)系構(gòu)建學(xué)生網(wǎng)絡(luò)圖對(duì)應(yīng)的目標(biāo)結(jié)構(gòu)矩陣,并通過目標(biāo)結(jié)構(gòu)矩陣,根據(jù)學(xué)生社區(qū)劃分模型計(jì)算每個(gè)學(xué)生之間的相似度矩陣,從而根據(jù)相似度矩陣對(duì)每個(gè)學(xué)生進(jìn)行社區(qū)劃分操作,進(jìn)而不僅結(jié)合了學(xué)生的消費(fèi)行為和社交網(wǎng)絡(luò)信息,還通過引入學(xué)生基本屬性數(shù)據(jù)、學(xué)生畫像標(biāo)簽數(shù)據(jù),保證了社區(qū)劃分的準(zhǔn)確性和全面性。
20、2、通過對(duì)所述第一矩本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種應(yīng)用在學(xué)生群體社交中的社區(qū)劃分方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述按照預(yù)設(shè)方式對(duì)所述學(xué)生消費(fèi)數(shù)據(jù)進(jìn)行分組,以獲取分組后的學(xué)生共現(xiàn)對(duì),具體包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述構(gòu)建所述學(xué)生網(wǎng)絡(luò)圖對(duì)應(yīng)的目標(biāo)結(jié)構(gòu)矩陣,具體包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述第一矩陣包括第一維度、第二維度以及第三維度,所述第一維度為所述圖節(jié)點(diǎn)的數(shù)量維度,所述第二維度為所述學(xué)生基本屬性數(shù)據(jù)的類別數(shù)量維度,所述第三維度為所述第一矩陣中嵌入向量的維度,在所述根據(jù)所述第一圖節(jié)點(diǎn)向量構(gòu)建第一矩陣之后,所述方法還包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,通過所述目標(biāo)結(jié)構(gòu)矩陣,根據(jù)學(xué)生社區(qū)劃分模型計(jì)算每個(gè)所述學(xué)生之間的相似度矩陣,具體包括,通過如下公式計(jì)算所述相似度矩陣:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述方法還包括:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述相似度矩陣對(duì)每個(gè)所述學(xué)生進(jìn)行所述社區(qū)劃分操作,具體包括:
9.一種電子設(shè)備,其特征在于,包括處理器、通信總線、用戶接口、網(wǎng)絡(luò)接口以及存儲(chǔ)器,所述存儲(chǔ)器用于存儲(chǔ)指令,所述用戶接口和網(wǎng)絡(luò)接口用于給其他設(shè)備通信,所述處理器用于執(zhí)行所述存儲(chǔ)器中存儲(chǔ)的指令,以使所述電子設(shè)備執(zhí)行如權(quán)利要求1至7任意一項(xiàng)所述的方法。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有指令,當(dāng)所述指令被執(zhí)行時(shí),執(zhí)行如權(quán)利要求1至7任意一項(xiàng)所述的方法。
...【技術(shù)特征摘要】
1.一種應(yīng)用在學(xué)生群體社交中的社區(qū)劃分方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述按照預(yù)設(shè)方式對(duì)所述學(xué)生消費(fèi)數(shù)據(jù)進(jìn)行分組,以獲取分組后的學(xué)生共現(xiàn)對(duì),具體包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述構(gòu)建所述學(xué)生網(wǎng)絡(luò)圖對(duì)應(yīng)的目標(biāo)結(jié)構(gòu)矩陣,具體包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述第一矩陣包括第一維度、第二維度以及第三維度,所述第一維度為所述圖節(jié)點(diǎn)的數(shù)量維度,所述第二維度為所述學(xué)生基本屬性數(shù)據(jù)的類別數(shù)量維度,所述第三維度為所述第一矩陣中嵌入向量的維度,在所述根據(jù)所述第一圖節(jié)點(diǎn)向量構(gòu)建第一矩陣之后,所述方法還包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,通過所述目標(biāo)結(jié)構(gòu)矩陣,根據(jù)學(xué)生社區(qū)劃分模型計(jì)算每個(gè)所述學(xué)生之間的相似度矩陣,具體包括...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:房志朋,嚴(yán)鶴,王俊,李舵文,魏鑫,
申請(qǐng)(專利權(quán))人:云啟智慧科技有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。