System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及一種基于主成分回歸模型的經濟預測方法及系統,屬于經濟學及計算機科學。
技術介紹
1、隨著社會的發展和科技的進步,經濟數據作為最基礎的數據之一,能反映出一個地區的發展現狀與基礎設施建設情況,經濟預測模型的穩定性和預測結果的準確性對社會發展規劃有著至關重要的作用。然而,在實際的社會發展中,經濟數據受到許多因素的影響,導致許多預測模型預測精度較低。
2、現有的經濟預測模型主要包括時間序列預測模型、統計方法預測模型、定性預測模型。時間序列模型主要基于歷史數據進行預測,往往缺乏對對經濟理論的考慮,導致在沒有足夠歷史數據或者數據質量不高的情況下預測效果不佳。統計方法預測模型在處理大量數據時可能會出現信息過載,難以識別哪些因素是影響經濟變化的關鍵變量。定性預測方法依賴于預測者的經驗和判斷,可能缺乏客觀性和準確性。
技術實現思路
1、鑒于上述問題,本專利技術提出一種基于主成分回歸模型的經濟預測方法及系統,以克服統計方法預測中存在的缺點,從而更好的挖掘經濟發展的影響因素,并精準的預測經濟數據。
2、為了實現上述目的,本專利技術提供如下技術方案:
3、第一方面,本專利技術實施例提供一種基于主成分回歸模型的經濟預測方法,其包括:
4、收集歷史經濟數據及其影響因素數據,作為基礎數據;
5、對所述基礎數據進行預處理,并按照不同的時間尺度和數據類型進行分類;
6、對預處理和分類后的數據進行特征工程與標準化處理,并選擇與經濟預
7、采用主成分分析法對所述目標特征指標進行降維處理,以減少特征數據量,保留重要信息;
8、基于多元線性回歸,選定降維處理后的主成分作為自變量,構建回歸模型;
9、對所述回歸模型進行訓練,其中,根據歷史數據通過殘差分析評估預測模型的效果和預測精度;
10、基于訓練后的模型輸出預測結果。
11、基于以上的方法,可選地,所述對所述基礎數據進行預處理包括:
12、使用z-scor方法進行數據集的異常值檢測,其計算公式為:
13、
14、其中,x為單個觀測值,μ為觀測值所在樣本的均值,σ為樣本的標準差;
15、使用牛頓插值法對異常值進行填充,通過牛頓插值擬合曲線,保證插值多項式與擬合的函數在已知點上有相同的函數值和高階導數值,定義的牛頓插值函數為:
16、pn(x)=f(x0)+f[x0,x1](x-x0)+f[x0,x1,x2](x-x0)(x-x1)+…+f[x0,x1,…,xn](x-x0)…(x-xn-1)
17、其中,f[x0,x1,…,xn]為原函數f(x)關于x0,x1,…,xn的n階差商;pn(x)與原函數f(x)之間的關系為:
18、f(x)=pn(x)+rn(x)
19、其中,rn(x)為余項;
20、將數據進行標準化處理,具體公式為:
21、
22、其中,xij為第i個影響因素的第j個觀測值,zxij為標準化后第i個影響因素的第j個觀測值,為第i個影響因素的均值,σi為第i個影響因素的方差。
23、基于以上的方法,可選地,所述對預處理和分類后的數據進行特征工程與標準化處理,包括:
24、使用ridge回歸對預處理和分類后的數據進行特征選擇,具體公式為:
25、
26、其中,β為模型的向量參數,yi為第i個觀測值的目標變量,xi為第i個觀測值的特征向量,n為樣本數量,p為特征數量,λ為正則化參數,用于控制正則化的強度;
27、對選擇的特征進行最大-最小標準化。
28、基于以上的方法,可選地,所述選擇與經濟預測相關性高的目標特征指標,包括:
29、使用斯皮爾曼等級相關系數評估歷史經濟數據與其影響因素數據之間的相關性,具體步驟如下;
30、(1)將數據轉換為等級并在計算過程中適當的處理;
31、(2)計算影響因素與待預測模型歷史數據之間的等級差,公式為:
32、di=rxi-ryi
33、其中,rxi和ryi分別代表兩種變量的等級;
34、(3)計算等級差的平方和:
35、
36、(4)計算斯皮爾曼等級相關系數:
37、
38、其中,n是觀測值的總數;斯皮爾曼等級系數rs的取值范圍是-1到1,正相關性越強rs越接近于1,負相關性越強rs越接近于-1。
39、基于以上的方法,可選地,所述采用主成分分析法對所述目標特征指標進行降維處理,包括:
40、計算協方差矩陣:
41、
42、其中,為標準化后的第i個指標的均值,為標準化后的第m個指標的均值,計算矩陣的特征值、特征向量;
43、求解主成分:
44、
45、其中,p為協方差矩陣的特征個數,λ1,λ2,λ3,…,λp為特征值,v1,v2,v3,…,vp對應的特征向量;
46、計算第i個主成分的貢獻率,計算公式為:
47、
48、其中,ci為第i個主成分的貢獻率。
49、基于以上的方法,可選地,多元線性回歸分析的回歸模型為:
50、
51、式中x1,x2,…,xm是影響因變量y的自變量,β1,…,βm分別為各個自變量對應的相關系數,β0為截距項,ε為誤差項。
52、基于以上的方法,可選地,對模型擬合度的檢驗包括:
53、殘差分析和殘差分布檢驗,所述殘差分布檢驗包括殘差自相關性檢驗和模型預測精度評估。
54、第二方面,本專利技術實施例還提供一種基于主成分回歸模型的經濟預測系統,其包括:
55、數據獲取模塊,用于收集歷史經濟數據及其影響因素數據,作為基礎數據;
56、預處理模塊,用于對所述基礎數據進行預處理,并按照不同的時間尺度和數據類型進行分類;
57、特征篩選模塊,用于對預處理和分類后的數據進行特征工程與標準化處理,并選擇與經濟預測相關性高的目標特征指標;
58、降維處理模塊,用于采用主成分分析法對所述目標特征指標進行降維處理,以減少特征數據量,保留重要信息;
59、模型構建模塊,用于基于多元線性回歸,選定降維處理后的主成分作為自變量,構建回歸模型;
60、模型訓練模塊,用于對所述回歸模型進行訓練,其中,根據歷史數據通過殘差分析評估預測模型的效果和預測精度;
61、預測模塊,用于基于訓練后的模型輸出預測結果。
62、本專利技術提供的基于主成分回歸模型的經濟預測方法及系統,融合了主成分分析和多元回歸的優點,利用主成分分析方法克服統計方法預測中存在的缺點,從而更好的挖掘經濟發展的影響因素,并精準的預測經濟數據。
本文檔來自技高網...【技術保護點】
1.一種基于主成分回歸模型的經濟預測方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述對所述基礎數據進行預處理包括:
3.根據權利要求2所述的方法,其特征在于,所述對預處理和分類后的數據進行特征工程與標準化處理,包括:
4.根據權利要求3所述的方法,其特征在于,所述選擇與經濟預測相關性高的目標特征指標,包括:
5.根據權利要求4所述的方法,其特征在于,所述采用主成分分析法對所述目標特征指標進行降維處理,包括:
6.根據權利要求5所述的方法,其特征在于,多元線性回歸分析的回歸模型為:
7.根據權利要求6所述的方法,其特征在于,對模型擬合度的檢驗包括:
8.一種基于主成分回歸模型的經濟預測系統,其特征在于,包括:
【技術特征摘要】
1.一種基于主成分回歸模型的經濟預測方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述對所述基礎數據進行預處理包括:
3.根據權利要求2所述的方法,其特征在于,所述對預處理和分類后的數據進行特征工程與標準化處理,包括:
4.根據權利要求3所述的方法,其特征在于,所述選擇與經濟預測相關性高的目標特征指標,...
【專利技術屬性】
技術研發人員:陳建華,趙騫,馬蕊,黃新平,岳昊,張潔,關皓聞,高晉,楊悅,魏成梅,田勇,
申請(專利權)人:國網冀北電力有限公司經濟技術研究院,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。