System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 日日日日做夜夜夜夜无码,99久久亚洲精品无码毛片,免费无遮挡无码永久视频
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基于加權主成分分析法的電力營銷共性數據集預處理方法技術

    技術編號:44345606 閱讀:2 留言:0更新日期:2025-02-25 09:33
    本發明專利技術涉及電力營銷業務化搜索領域,特別涉及一種基于加權主成分分析法的電力營銷共性數據集預處理方法。數據集預處理方法,包括如下過程:對原始數據進行標準化;求出相關系數矩陣V;為每個樣本賦予一個權重;求出協方差矩陣矩陣的特征根和特征向量;計算主成分的貢獻率和累計貢獻率;將樣本點投影到選取的特征向量上,得到新的數據集。本發明專利技術將高維空間中的多變量問題轉化為低緯度少變量的問題,同時因為電力數據多樣化的特征以及同一個數據表中不同的特征和樣本在識別過程中所起到的作用不同,設定其相應的權重,以加強不同程度各樣本數據的識別率,從而對樣本進行有效的特征提取,剔除離群點的影響,以此來提高樣本數據的識別率。

    【技術實現步驟摘要】

    本專利技術涉及電力營銷業務化搜索領域,特別涉及一種基于加權主成分分析法的電力營銷共性數據集預處理方法


    技術介紹

    1、電力營銷專業數據集中,很多數據中含有大量信息重疊,為提升電力營銷專業數據分析能力,充分挖掘數據深層價值,加深稀疏數據承載力,釋放數據特征最大化能力,減負資源存儲和分析,推動數據業務化發展。


    技術實現思路

    1、本專利技術提出了一種基于加權主成分分析法對于電力營銷數據集進行冗余分析,以此來提高樣本數據的識別率。具體技術方案如下:

    2、一種基于加權主成分分析法的電力營銷共性數據集預處理方法,包括如下過程:

    3、s100:對原始數據進行標準化;

    4、s200:根據標準化后的數據矩陣求出協方差矩陣v;公式如下:

    5、

    6、式中,n是數據樣本的數量,是標準化后的數據矩陣,是標準化后的數據矩陣的轉置;

    7、s300:為每個樣本賦予一個權重;

    8、將得到的原始數據看成矩陣an×m把它的,n行向量歸一化后的算術平均值近似作為權重向量,即:

    9、

    10、式中,ai′j是矩陣aij的元素,是經過歸一化后的值;

    11、s400:求出協方差矩陣矩陣的特征根和特征向量;

    12、s500:將特征值排序,選擇其中最大的k個,然后將其對應的k個特征向量分別作為列向量組成特征向量矩陣,計算主成分的貢獻率和累計貢獻率;

    13、貢獻率αi:第i個主成分對應的特征值在協方差矩陣的全部特征值之和中所占的比重,計算公式如下:

    14、

    15、式中,λi是第i個主成分對應的特征值,這個比值越大,說明第i個主成分綜合原指標信息的能力越強;

    16、累計貢獻率mk:前k個主成分的特征值之和在全部特征值總和中所占的比重,計算公式如下:

    17、

    18、s600:將樣本點投影到選取的特征向量上,得到新的數據集。

    19、優選的,所述s100中,對原始數據進行標準化到0-1之間。

    20、優選的,歸一化公式如下:

    21、

    22、式中,aivj是矩陣aij的元素經過歸一化后的值。

    23、優選的,選取發電戶行業(gc_ind_cls)、消納方式(e_consp_mode)、合同容量(ctrt_cap)、用電戶行為分類(ind_cls)、用電戶用戶分類(cust_cls)、用電戶電壓等級(voltage)、用電戶用電類別(ec_categ)、用電戶的市場化屬性(dereg_attr_cls)、發電量(gpq)、上網電量(net_qty)、自發自用電量(sce_qty)這些字段。

    24、本專利技術相對于現有技術的優點在于:

    25、本專利技術將高維空間中的多變量問題轉化為低緯度少變量的問題,同時因為電力數據多樣化的特征以及同一個數據表中不同的特征和樣本在識別過程中所起到的作用不同,設定其相應的權重,以加強不同程度各樣本數據的識別率,從而對樣本進行有效的特征提取,剔除離群點的影響,以此來提高樣本數據的識別率。

    26、實施例中,以營銷數據集為例,使用加權主成分分析法進行特征篩選,使得數據集的數據處理量減少10%-30%,同時其數據深層價值提升20%左右,計算速度提高20%-50%。

    本文檔來自技高網...

    【技術保護點】

    1.一種基于加權主成分分析法的電力營銷共性數據集預處理方法,其特征在于,包括如下過程:

    2.根據權利要求1所述一種基于加權主成分分析法的電力營銷共性數據集預處理方法,其特征在于,所述S100中,對原始數據進行標準化到0-1之間。

    3.根據權利要求2所述一種基于加權主成分分析法的電力營銷共性數據集預處理方法,其特征在于,歸一化公式如下:

    4.根據權利要求1-3任何一項所述一種基于加權主成分分析法的電力營銷共性數據集預處理方法,其特征在于,選取發電戶行業(gc_ind_cls)、消納方式(e_consp_mode)、合同容量(ctrt_cap)、用電戶行為分類(ind_cls)、用電戶用戶分類(cust_cls)、用電戶電壓等級(voltage)、用電戶用電類別(ec_categ)、用電戶的市場化屬性(dereg_attr_cls)、發電量(gpq)、上網電量(net_qty)、自發自用電量(sce_qty)這些字段。

    【技術特征摘要】

    1.一種基于加權主成分分析法的電力營銷共性數據集預處理方法,其特征在于,包括如下過程:

    2.根據權利要求1所述一種基于加權主成分分析法的電力營銷共性數據集預處理方法,其特征在于,所述s100中,對原始數據進行標準化到0-1之間。

    3.根據權利要求2所述一種基于加權主成分分析法的電力營銷共性數據集預處理方法,其特征在于,歸一化公式如下:

    4.根據權利要求1-3任何一項所述一種基于加權主成分分析法...

    【專利技術屬性】
    技術研發人員:呂靜賢劉鯤鵬任海洋王穎宮立華高儷軒
    申請(專利權)人:國家電網有限公司客戶服務中心
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 国产爆乳无码一区二区麻豆| 老司机亚洲精品影院无码| 久久精品aⅴ无码中文字字幕| 成在人线av无码免费高潮喷水| 亚洲中文字幕无码一区| 特级毛片内射www无码| 精品久久久无码中文字幕天天| 久久久久亚洲AV无码专区首JN| 亚洲成av人片不卡无码久久| 白嫩少妇激情无码| 无码中文字幕乱在线观看| 久久久久久无码国产精品中文字幕| 亚洲一区无码中文字幕乱码| 国产成人精品一区二区三区无码 | 18禁免费无码无遮挡不卡网站| 下载天堂国产AV成人无码精品网站| 免费A级毛片无码专区| 亚洲中文字幕无码永久在线 | 国产乱子伦精品无码专区| 直接看的成人无码视频网站| 亚洲AV无码久久精品色欲| 国产在线无码不卡影视影院| 国产精品无码国模私拍视频 | 久久中文字幕无码专区| 无码视频一区二区三区| 内射人妻无码色AV天堂| 综合无码一区二区三区四区五区 | 国产精品JIZZ在线观看无码| 97免费人妻无码视频| 高清无码午夜福利在线观看 | 无码人妻av一区二区三区蜜臀| 精品久久久久久无码不卡| 亚洲av中文无码乱人伦在线观看 | 亚洲色中文字幕无码AV| 在线观看免费无码专区| 无码人妻精品中文字幕| 秋霞无码一区二区| 无码射肉在线播放视频| 少妇无码太爽了不卡视频在线看 | 亚洲AV无码精品色午夜果冻不卡| 人妻丰满熟妇AV无码区HD|