System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專(zhuān)利技術(shù)屬于聚類(lèi)分析,具體涉及一種基于集合聚集k-means法多群體成員親疏關(guān)系的實(shí)現(xiàn)方法。
技術(shù)介紹
1、工作中有這樣一類(lèi)問(wèn)題需要解決:需要界定大量多群體成員的親疏關(guān)系,這些群體沒(méi)法參與進(jìn)去,只知道群體中有哪些成員。
2、一般來(lái)說(shuō),群體成員親疏關(guān)系通常指的是個(gè)體在群體中與他人之間的親密程度和距離感。“確定群體成員親疏關(guān)系”可以通過(guò)多種方法和工具來(lái)實(shí)現(xiàn)。主要有以下一些方法:一是問(wèn)卷調(diào)查,二是社會(huì)網(wǎng)絡(luò)分析,三是觀察法,四是訪談,五是團(tuán)隊(duì)活動(dòng),六是情感分析,七是通信模式分析,八是聚類(lèi)分析。由于與目標(biāo)群體有距離感,所以一、三、四、五均無(wú)法進(jìn)行,可以進(jìn)行的是社會(huì)網(wǎng)絡(luò)分析、情感分析、通信模式分析、聚類(lèi)分析,這些都?xì)w屬于數(shù)據(jù)分析范疇。
3、社會(huì)網(wǎng)絡(luò)分析(social?network?analysis,簡(jiǎn)稱(chēng)sna):利用數(shù)據(jù)分析工具來(lái)構(gòu)建和分析社會(huì)網(wǎng)絡(luò)圖,這可以幫助識(shí)別群體中的中心人物、邊緣人物以及群體內(nèi)部的子群體。
4、情感分析:通過(guò)分析群體成員之間的溝通內(nèi)容,如電子郵件、社交媒體帖子或會(huì)議記錄,來(lái)識(shí)別情感傾向,從而推斷成員之間的親密度。
5、通信模式分析:分析群體成員之間的通信頻率和模式,如誰(shuí)經(jīng)常與誰(shuí)溝通,溝通的時(shí)長(zhǎng)和內(nèi)容,這可以揭示成員之間的緊密關(guān)系。
6、聚類(lèi)分析:使用聚類(lèi)算法來(lái)識(shí)別群體中的自然分組,這些分組可能基于成員之間的相似性或互動(dòng)模式。
7、社會(huì)網(wǎng)絡(luò)分析(social?network?analysis,簡(jiǎn)稱(chēng)sna)主要缺點(diǎn):需要大量數(shù)據(jù)支持;涉及敏感信息
8、情感分析主要缺點(diǎn):難以理解復(fù)雜的語(yǔ)境,可能導(dǎo)致誤判;涉及隱私泄露和倫理問(wèn)題;難以量化情感強(qiáng)度。導(dǎo)致上述缺點(diǎn)的原因如下:語(yǔ)境和文化差異;隱私和倫理問(wèn)題;情感強(qiáng)度和細(xì)微情感的識(shí)別。
9、通信模式分析主要缺點(diǎn):隱私問(wèn)題;獲取全面的通信數(shù)據(jù)具有挑戰(zhàn)性。導(dǎo)致上述缺點(diǎn)的原因如下:隱私和安全問(wèn)題;收集全面的通信數(shù)據(jù)可能需要跨越多個(gè)平臺(tái)和系統(tǒng),并且整合來(lái)自不同來(lái)源的數(shù)據(jù)需要格式、兼容性和同步性問(wèn)題。
10、聚類(lèi)分析主要缺點(diǎn):某些聚類(lèi)算法(如k-means)需要預(yù)先制定簇的數(shù)量;聚類(lèi)結(jié)果高度依賴(lài)于數(shù)據(jù)的質(zhì)量和特征選擇;對(duì)于大規(guī)模數(shù)據(jù)集,可能需要大量的計(jì)算資源和時(shí)間。導(dǎo)致上述缺點(diǎn)的原因如下:簇的最優(yōu)值通常不是顯而易見(jiàn)的,可能需要試錯(cuò);笛卡爾積可能會(huì)使計(jì)算資源和時(shí)間具有較大耗費(fèi)。
技術(shù)實(shí)現(xiàn)思路
1、為了克服現(xiàn)有技術(shù)的不足,本專(zhuān)利技術(shù)提供了一種基于集合聚集k-means法多群體成員親疏關(guān)系的實(shí)現(xiàn)方法,本專(zhuān)利技術(shù)在一個(gè)大的時(shí)間尺度范圍內(nèi),對(duì)于k-means法聚集的結(jié)果,通過(guò)群體成員間的距離,進(jìn)行歸集、匯總,從而能夠定量刻畫(huà)群體成員親疏、離散關(guān)系,進(jìn)行可視化展現(xiàn),進(jìn)一步界定、凈化成員的歸屬,向著更優(yōu)方向進(jìn)化。
2、本專(zhuān)利技術(shù)解決其技術(shù)問(wèn)題所采用的技術(shù)方案如下:
3、步驟1:由聚集關(guān)系表a作為起點(diǎn),先跟號(hào)碼所屬組b關(guān)聯(lián),得到表c;
4、聚集關(guān)系表a包括的字段有:同一個(gè)聚集中的號(hào)碼在特征f取同一值的情況下,集合s的距離信息;表c比聚集關(guān)系表a僅僅多了群體名;
5、步驟2:由表c對(duì)于日、聚簇、群體進(jìn)行打標(biāo)編號(hào)cluster_id2,得到表d;
6、步驟3:在表d中尋找cluster_id2不同號(hào)碼對(duì)的數(shù)量,并對(duì)同一號(hào)碼對(duì)在某段時(shí)間相聚多少次進(jìn)行求和,結(jié)果為n_cnt,得到表e;
7、步驟4:在表d中尋找cluster_id2不同號(hào)碼對(duì)至少有一個(gè)出現(xiàn)的數(shù)量,并對(duì)同一號(hào)碼對(duì)在某段時(shí)間的次數(shù)進(jìn)行求和,結(jié)果為u_cnt,得到表f;
8、步驟5:表e和表f按號(hào)碼對(duì)進(jìn)行關(guān)聯(lián),并用此公式計(jì)算距離:distance=1-n_cnt/u_cnt,得到表g;
9、步驟6:組內(nèi)號(hào)碼有位置的表a1與g按a1.hm=g.id1關(guān)聯(lián),同時(shí)取全a1的信息,如果g能關(guān)聯(lián)上則取g的信息,得到最終結(jié)果表h;a1.hm表示表a1的號(hào)碼列,g.id1表示表g的號(hào)碼1列。
10、一種計(jì)算機(jī)程序,所述計(jì)算機(jī)程序使得計(jì)算機(jī)執(zhí)行上述親疏關(guān)系的實(shí)現(xiàn)方法。
11、一種電子設(shè)備,包括:處理器及存儲(chǔ)器;所述存儲(chǔ)器用于存儲(chǔ)計(jì)算機(jī)程序,所述處理器用于執(zhí)行所述存儲(chǔ)器存儲(chǔ)的計(jì)算機(jī)程序,以使所述電子設(shè)備執(zhí)行上述親疏關(guān)系的實(shí)現(xiàn)方法。
12、一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述親疏關(guān)系的實(shí)現(xiàn)方法。
13、一種芯片,包括:處理器,用于從存儲(chǔ)器中調(diào)用并運(yùn)行計(jì)算機(jī)程序,使得安裝有所述芯片的設(shè)備執(zhí)行上述親疏關(guān)系的實(shí)現(xiàn)方法。
14、一種計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)存儲(chǔ)介質(zhì),所述計(jì)算機(jī)存儲(chǔ)介質(zhì)存儲(chǔ)計(jì)算機(jī)程序,所述計(jì)算機(jī)程序包括能夠由至少一個(gè)處理器執(zhí)行的指令,當(dāng)所述指令由所述至少一個(gè)處理器執(zhí)行時(shí)實(shí)現(xiàn)上述親疏關(guān)系的實(shí)現(xiàn)方法。
15、本專(zhuān)利技術(shù)的有益效果如下:
16、本專(zhuān)利技術(shù)與前面所述的社會(huì)網(wǎng)絡(luò)分析、情感分析和通信模式分析比起來(lái),有效克服了其缺點(diǎn),并有一些獨(dú)特的優(yōu)勢(shì):
17、一是數(shù)據(jù)源比較單一:只需要成員的位置信息,這樣能夠提升模型創(chuàng)建的效率;
18、二是隱私和安全得到保護(hù):因?yàn)閿?shù)據(jù)源比較單一,客觀上最大限度保護(hù)了隱私和安全;
19、三是獨(dú)辟蹊徑數(shù)學(xué)方法的使用,達(dá)到了“四兩撥千斤”的效果:1).因?yàn)橛小凹暇奂膋-means法”的鋪墊,有較多理論和實(shí)踐方面的準(zhǔn)備和生態(tài),克服諸多缺點(diǎn),變不利為有利,才有了現(xiàn)在的厚積薄發(fā);2).雖然數(shù)據(jù)源單一,有其不利的一面,但可以不著眼于群體成員一時(shí)一事聚集的偶然,在一個(gè)大的時(shí)間尺度范圍內(nèi),通過(guò)統(tǒng)計(jì)掌握群體成員的親疏關(guān)系的必然;3).用兩兩成員之間的關(guān)系的組合來(lái)刻畫(huà)整個(gè)的群體成員關(guān)系。假如某個(gè)群體有n個(gè)成員,考慮次序最多會(huì)有n(n-1)個(gè)兩兩之間的親疏度量。例如,上邊的例子中“群體8”有8個(gè)號(hào)碼,最多會(huì)有8*7(56)種兩兩關(guān)系,實(shí)際只有4種兩兩關(guān)系,5種孤立關(guān)系。最終,可以可視化地展現(xiàn)這樣的關(guān)系??傊?,采用一些簡(jiǎn)單有效的數(shù)學(xué)方法克服了“諸多技術(shù)難點(diǎn)和困境”,達(dá)到較好效果。
20、本專(zhuān)利技術(shù)技術(shù)方案帶來(lái)的有益效果:在一個(gè)大的時(shí)間尺度范圍內(nèi),對(duì)于k-means法聚集的結(jié)果,通過(guò)群體成員間的距離,進(jìn)行歸集、匯總,從而能夠定量刻畫(huà)群體成員親疏、離散關(guān)系,進(jìn)行可視化展現(xiàn),進(jìn)一步界定、凈化成員的歸屬,向著更優(yōu)方向進(jìn)化。
本文檔來(lái)自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種基于集合聚集k-means法多群體成員親疏關(guān)系的實(shí)現(xiàn)方法,其特征在于,包括如下步驟:
2.一種計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序使得計(jì)算機(jī)執(zhí)行如權(quán)利要求1所述方法。
3.一種電子設(shè)備,其特征在于,包括:處理器及存儲(chǔ)器;所述存儲(chǔ)器用于存儲(chǔ)計(jì)算機(jī)程序,所述處理器用于執(zhí)行所述存儲(chǔ)器存儲(chǔ)的計(jì)算機(jī)程序,以使所述電子設(shè)備執(zhí)行如權(quán)利要求1所述方法。
4.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1所述方法。
5.一種芯片,其特征在于,包括:處理器,用于從存儲(chǔ)器中調(diào)用并運(yùn)行計(jì)算機(jī)程序,使得安裝有所述芯片的設(shè)備執(zhí)行如權(quán)利要求1所述方法。
6.一種計(jì)算機(jī)程序產(chǎn)品,其特征在于,所述計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)存儲(chǔ)介質(zhì),所述計(jì)算機(jī)存儲(chǔ)介質(zhì)存儲(chǔ)計(jì)算機(jī)程序,所述計(jì)算機(jī)程序包括能夠由至少一個(gè)處理器執(zhí)行的指令,當(dāng)所述指令由所述至少一個(gè)處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1所述方法。
【技術(shù)特征摘要】
1.一種基于集合聚集k-means法多群體成員親疏關(guān)系的實(shí)現(xiàn)方法,其特征在于,包括如下步驟:
2.一種計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序使得計(jì)算機(jī)執(zhí)行如權(quán)利要求1所述方法。
3.一種電子設(shè)備,其特征在于,包括:處理器及存儲(chǔ)器;所述存儲(chǔ)器用于存儲(chǔ)計(jì)算機(jī)程序,所述處理器用于執(zhí)行所述存儲(chǔ)器存儲(chǔ)的計(jì)算機(jī)程序,以使所述電子設(shè)備執(zhí)行如權(quán)利要求1所述方法。
4.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其...
【專(zhuān)利技術(shù)屬性】
技術(shù)研發(fā)人員:張朝陽(yáng),王磊,徐小民,王喬翊,
申請(qǐng)(專(zhuān)利權(quán))人:電信科學(xué)技術(shù)第十研究所有限公司,
類(lèi)型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。