System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于能源,特別涉及一種基于kpca的雙層聚類算法及在用電行為分析上的應用。
技術介紹
1、在能源互聯網時代,通過建立電力用戶需求側與電網供給側雙向信息流,推動“源網荷”發展,運用大數據分析技術對信息進行有效價值的挖掘,以實現電力供需雙贏雙利。配用電數據作為供需雙側的橋梁,對電力系統進行負荷分析規劃、需求側響應等工作具有重要的參考價值,而傳統分析方法如數據降維處理、聚類分析等依然存在降維效果不理想、聚類效率不佳等問題,具體體現在,針對傳統主成分分析算法無法只考慮變量間的線性相關性,并沒有探索數據間的非線性邏輯;針對單一聚類算法無法同時滿足聚類效率和聚類質量。
技術實現思路
1、針對現有技術的不足,本專利技術提供了一種基于kpca的雙層聚類算法,解決了傳統主成分分析算法無法只考慮變量間的線性相關性,并沒有探索數據間的非線性邏輯,單一聚類算法無法同時滿足聚類效率和聚類質量的問題,使得聚類有效性和穩定性等方面具有顯著提高。
2、本專利技術的另一目的在于提供一種基于kpca降維的雙層聚類算法在用電行為分析上的應用。
3、為實現以上目的,本專利技術一種基于kpca降維的雙層聚類算法,包括以下步驟:
4、步驟一、選取用電負荷數據,進行kpca降維,降低數據的維數;
5、步驟二、采用了雙層聚類算法,外層采用基于余弦相似度的譜聚類算法,獲得形態相似性負荷類簇,內層在外層形態相似性聚類的基礎上采用基于歐式距離的k-means聚類算法,獲得幅值相
6、步驟三、完成用戶用電行為分析。
7、優選的,所述的步驟一具體為,
8、步驟1.1,將原始數據通過核函數完成非線性變化
9、設xj∈rm,j=1,2,…,n表示一組零均值數據,核函數通過映射實現點x到f的映射,可以得到的特征空間中心數據需要滿足的條件如式(1.1)所示。
10、
11、通過非線性映射,特征空間中映射數據的協方差如式(1.2)所示。
12、
13、t為轉置符號;
14、c可通過特征值分解對角化,方法如式(1.3)所示
15、
16、式中,λ表示特征值,v表示特征向量。
17、將式(1.2)代入式(1.3)中可得:
18、
19、考慮到所有λ≠0都存在于φ(x1),φ(x2),…,φ(xn),,將其結果線性表示,如式(1.5)和式(1.6)所示。
20、
21、
22、式中,v=1,2,…,n;ai為常系數。
23、步驟1.2,通過核函數計算核矩陣k
24、定義n階矩陣k如式(1.7)所示
25、kiv=(φ(xi)·φ(xv))???????????????????????????(1.7)
26、化簡式(1.7)可以得到:
27、nλkα=k2α????????????????????????????(1.8)
28、其中α=[α1,α2,…,αn]t為常系數矩陣,n為矩陣階數,為了方便求解
29、化簡式(1.8)可以得到:
30、nλα=kα?????????????????????????????(1.9)
31、通過對式(1.9)的求解可以得到對應的特征值和特征向量,而訓練樣本φ(x)在特征向量空間f中vk方向的投影可以表示為
32、
33、將內積用核函數替換可以得到:
34、
35、若假設式(1.1)不成立,則需調整φ(xi)為:
36、
37、則可以修正核矩陣ki?v如式(1.13)所示。
38、
39、其中kiw為ki1,ki2…kin核矩陣,kwv為k1v,k2v…knv核矩陣,kw,τ為k1,1,k2,2…kn,n核矩陣;
40、步驟1.3,通過方差累計貢獻率法(cpv)確定非線性主成分的數目
41、其計算公式如下:
42、
43、式中:為非線性主成分的貢獻率,是協方差矩陣的前p個樣本數量大特征值之和與所有特征值之和的比值;為了確保能夠保留數據中的大部分有效信息,主成分貢獻率閾值通常情況下設定為cpva≥85%。
44、優選的,所述的步驟二包括:確定初始化聚類中心、確定最佳聚類數目、內層譜聚類和外層k-means聚類。
45、優選的,所述的確定初始化聚類中心具體為,
46、步驟2.1:計算對象之間的平均距離,
47、
48、式中,d(xi,xj)表示對象xi和xj之間的歐式距離;m為總的負荷數目;表示從m個對象中取出2個對象的所有組合的數目;
49、步驟2.2:計算每個對象的密度參數,
50、
51、式中,deventy(p,m)代表密度參數,u代表m-|pi-p|函數關系,p代表循環選取的任意一條負荷數據;pi為其它負荷數據;
52、步驟2.3:選取密度參數最大值對應的數據對象作為第一個聚類中心,并計算數據集中的對象與選出的聚類中心之間的距離,刪除此距離小于m的數據對象;
53、步驟2.4:重復步驟1-3,如果平均距離大于目標值,說明樣本點之間的距離較遠,減小k值;如果密度大于目標值,說明數據集中有較多的聚類中心,增大k值,最終得到其初始化聚類中心。
54、采用dbi指標作為內層聚類數目的選擇依據,并將dbi指標中關于歐式距離的計算改為余弦相似度作為外層聚類數目的選擇依據,即
55、
56、式中,oi表示第i類數據與聚類中心間的余弦距離標準誤差;oj表示第j類數據與聚類中心間的余弦距離標準誤差;k表示聚類數目;dcij表示第i類和第j類的聚類中心的余弦距離;最佳聚類數目的選擇流程包括下述步驟:
57、步驟3.1,確定聚類數目的最大最小值;
58、步驟3.2,譜聚類返回聚類類別;
59、步驟3.3,計算聚類中心的坐標;
60、步驟3.4,計算聚類dbi/dbo指標;
61、步驟3.5,判斷是否達到設定聚類數目的上限;若達到,排序選擇最佳聚類數;若未達到,聚類數目加1后返回步驟3.2。
62、優選的,所述的內層譜聚類具體為,
63、步驟4.1:設向量a為(x1,y1)、向量b為(x2,y2)根據計算負荷曲線之間的相似度;選用相似性判據進行相似度計算,計算出來的距離轉換成方陣
64、步驟4.2:利用高斯核函數來構建相似度矩陣,代替鄰接矩陣,具體公式為:
65、
66、式中,sin(xi,xj)2是第一步相似度計算得到的矩陣中的元素;γ是高斯核函數的參數;
67、步驟4.3:本文檔來自技高網...
【技術保護點】
1.一種基于KPCA的雙層聚類算法,其特征在于包括以下步驟:
2.根據權利要求1所述的一種基于KPCA的雙層聚類算法,其特征在于,所述的步驟一具體為,
3.根據權利要求1所述的一種基于KPCA的雙層聚類算法,其特征在于,所述的步驟二包括:確定初始化聚類中心、確定最佳聚類數目、內層譜聚類和外層k-means聚類。
4.根據權利要求3所述的一種基于KPCA的雙層聚類算法,其特征在于,所述的確定初始化聚類中心具體為,
5.根據權利要求3所述的一種基于KPCA的雙層聚類算法,其特征在于,所述的確定最佳聚類數目具體為,
6.根據權利要求3所述的一種基于KPCA的雙層聚類算法,其特征在于,所述的內層譜聚類具體為,
7.根據權利要求3所述的一種基于KPCA的雙層聚類算法,其特征在于,所述的外層k-means聚類為,
8.根據權利要求1所述的一種基于KPCA的雙層聚類算法,其特征在于,在用電行為分析上的應用。
【技術特征摘要】
1.一種基于kpca的雙層聚類算法,其特征在于包括以下步驟:
2.根據權利要求1所述的一種基于kpca的雙層聚類算法,其特征在于,所述的步驟一具體為,
3.根據權利要求1所述的一種基于kpca的雙層聚類算法,其特征在于,所述的步驟二包括:確定初始化聚類中心、確定最佳聚類數目、內層譜聚類和外層k-means聚類。
4.根據權利要求3所述的一種基于kpca的雙層聚類算法,其特征在于,所述的確定初始化聚類中心具...
【專利技術屬性】
技術研發人員:劉帥,楊春,呂延哲,張妍妍,陳強,王向宇,李巖,衡俊良,楊適澤,劉芳,李天嬌,李東明,張志遙,陳奕文,郭在津,李鵬博,李鵬儒,陳揚淽,
申請(專利權)人:國網遼寧省電力有限公司鐵嶺供電公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。