System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及電力營銷業務化搜索領域,特別涉及一種基于加權主成分分析法的電力營銷共性數據集預處理方法。
技術介紹
1、電力營銷專業數據集中,很多數據中含有大量信息重疊,為提升電力營銷專業數據分析能力,充分挖掘數據深層價值,加深稀疏數據承載力,釋放數據特征最大化能力,減負資源存儲和分析,推動數據業務化發展。
技術實現思路
1、本專利技術提出了一種基于加權主成分分析法對于電力營銷數據集進行冗余分析,以此來提高樣本數據的識別率。具體技術方案如下:
2、一種基于加權主成分分析法的電力營銷共性數據集預處理方法,包括如下過程:
3、s100:對原始數據進行標準化;
4、s200:根據標準化后的數據矩陣求出協方差矩陣v;公式如下:
5、
6、式中,n是數據樣本的數量,是標準化后的數據矩陣,是標準化后的數據矩陣的轉置;
7、s300:為每個樣本賦予一個權重;
8、將得到的原始數據看成矩陣an×m把它的,n行向量歸一化后的算術平均值近似作為權重向量,即:
9、
10、式中,ai′j是矩陣aij的元素,是經過歸一化后的值;
11、s400:求出協方差矩陣矩陣的特征根和特征向量;
12、s500:將特征值排序,選擇其中最大的k個,然后將其對應的k個特征向量分別作為列向量組成特征向量矩陣,計算主成分的貢獻率和累計貢獻率;
13、貢獻率αi:第i個主成分對應的特征值
14、
15、式中,λi是第i個主成分對應的特征值,這個比值越大,說明第i個主成分綜合原指標信息的能力越強;
16、累計貢獻率mk:前k個主成分的特征值之和在全部特征值總和中所占的比重,計算公式如下:
17、
18、s600:將樣本點投影到選取的特征向量上,得到新的數據集。
19、優選的,所述s100中,對原始數據進行標準化到0-1之間。
20、優選的,歸一化公式如下:
21、
22、式中,aivj是矩陣aij的元素經過歸一化后的值。
23、優選的,選取發電戶行業(gc_ind_cls)、消納方式(e_consp_mode)、合同容量(ctrt_cap)、用電戶行為分類(ind_cls)、用電戶用戶分類(cust_cls)、用電戶電壓等級(voltage)、用電戶用電類別(ec_categ)、用電戶的市場化屬性(dereg_attr_cls)、發電量(gpq)、上網電量(net_qty)、自發自用電量(sce_qty)這些字段。
24、本專利技術相對于現有技術的優點在于:
25、本專利技術將高維空間中的多變量問題轉化為低緯度少變量的問題,同時因為電力數據多樣化的特征以及同一個數據表中不同的特征和樣本在識別過程中所起到的作用不同,設定其相應的權重,以加強不同程度各樣本數據的識別率,從而對樣本進行有效的特征提取,剔除離群點的影響,以此來提高樣本數據的識別率。
26、實施例中,以營銷數據集為例,使用加權主成分分析法進行特征篩選,使得數據集的數據處理量減少10%-30%,同時其數據深層價值提升20%左右,計算速度提高20%-50%。
本文檔來自技高網...【技術保護點】
1.一種基于加權主成分分析法的電力營銷共性數據集預處理方法,其特征在于,包括如下過程:
2.根據權利要求1所述一種基于加權主成分分析法的電力營銷共性數據集預處理方法,其特征在于,所述S100中,對原始數據進行標準化到0-1之間。
3.根據權利要求2所述一種基于加權主成分分析法的電力營銷共性數據集預處理方法,其特征在于,歸一化公式如下:
4.根據權利要求1-3任何一項所述一種基于加權主成分分析法的電力營銷共性數據集預處理方法,其特征在于,選取發電戶行業(gc_ind_cls)、消納方式(e_consp_mode)、合同容量(ctrt_cap)、用電戶行為分類(ind_cls)、用電戶用戶分類(cust_cls)、用電戶電壓等級(voltage)、用電戶用電類別(ec_categ)、用電戶的市場化屬性(dereg_attr_cls)、發電量(gpq)、上網電量(net_qty)、自發自用電量(sce_qty)這些字段。
【技術特征摘要】
1.一種基于加權主成分分析法的電力營銷共性數據集預處理方法,其特征在于,包括如下過程:
2.根據權利要求1所述一種基于加權主成分分析法的電力營銷共性數據集預處理方法,其特征在于,所述s100中,對原始數據進行標準化到0-1之間。
3.根據權利要求2所述一種基于加權主成分分析法的電力營銷共性數據集預處理方法,其特征在于,歸一化公式如下:
4.根據權利要求1-3任何一項所述一種基于加權主成分分析法...
【專利技術屬性】
技術研發人員:呂靜賢,劉鯤鵬,任海洋,王穎,宮立華,高儷軒,
申請(專利權)人:國家電網有限公司客戶服務中心,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。