System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及股票預(yù)測(cè),具體地,涉及一種基于重采樣分布估計(jì)的股票預(yù)測(cè)模型在線集成方法及系統(tǒng)。
技術(shù)介紹
1、股票市場(chǎng)作為金融市場(chǎng)的重要組成部分,其波動(dòng)和走勢(shì)對(duì)經(jīng)濟(jì)、企業(yè)和個(gè)人都具有重要影響。在這樣的背景下,股票預(yù)測(cè)成為了許多投資者、交易員和分析師關(guān)注的焦點(diǎn)。通過對(duì)股票價(jià)格、交易量和其他相關(guān)因素進(jìn)行預(yù)測(cè),投資者可以做出更明智的投資決策,從而獲得更好的投資回報(bào)。
2、然而,股票市場(chǎng)的復(fù)雜性和不確定性使得準(zhǔn)確預(yù)測(cè)股票價(jià)格變得十分困難。目前已有許多預(yù)測(cè)方法被用于嘗試解決這個(gè)問題,包括基于統(tǒng)計(jì)學(xué)的方法、機(jī)器學(xué)習(xí)方法以及深度學(xué)習(xí)方法。這些方法各有優(yōu)劣,但在股票市場(chǎng)這種高度動(dòng)態(tài)和不穩(wěn)定的環(huán)境下,單個(gè)預(yù)測(cè)模型往往難以獲得令人滿意的結(jié)果。
3、一方面,現(xiàn)有的預(yù)測(cè)方法往往面臨數(shù)據(jù)量龐大、特征復(fù)雜多變的挑戰(zhàn)。股票市場(chǎng)的價(jià)格受多種因素影響,包括公司業(yè)績(jī)、宏觀經(jīng)濟(jì)因素、政策法規(guī)、市場(chǎng)情緒等。這些因素相互交織,導(dǎo)致數(shù)據(jù)的非線性和高度噪聲化,因此傳統(tǒng)的統(tǒng)計(jì)學(xué)方法往往難以捕捉到這種復(fù)雜性,而且容易出現(xiàn)過擬合或欠擬合的問題。
4、另一方面,使用單個(gè)預(yù)測(cè)模型還容易受到模型本身的限制和選擇的特征的局限性。不同的預(yù)測(cè)模型有各自的適用范圍和假設(shè),而在現(xiàn)實(shí)股票市場(chǎng)中,市場(chǎng)行為和價(jià)格變化的模式可能是多樣且動(dòng)態(tài)變化的。因此,單一模型可能無法全面捕捉到市場(chǎng)的動(dòng)態(tài)特征,導(dǎo)致預(yù)測(cè)準(zhǔn)確性不高。
5、在這樣的背景下,在線集成模型成為了一個(gè)備受關(guān)注的解決方案。在線集成模型通過將多個(gè)預(yù)測(cè)模型相結(jié)合,充分利用各個(gè)模型的優(yōu)勢(shì),彌補(bǔ)各個(gè)模型的不足,
6、綜上所述,市場(chǎng)上亟需一種能夠克服單一模型預(yù)測(cè)方差較大問題,并能夠提高預(yù)測(cè)進(jìn)度的基于在線集成預(yù)測(cè)模型的股票預(yù)測(cè)方法及系統(tǒng)。
7、專利文獻(xiàn)cn111062522a(申請(qǐng)?zhí)枺篶n201911217219.6)公開了一種基于時(shí)間序列鏈的股票預(yù)測(cè)方法,針對(duì)已有股票的歷史數(shù)據(jù)即一條時(shí)間序列的情況,利用極值點(diǎn)的分布,盡可能多的獲取有效子序列長(zhǎng)度,通過時(shí)間序列鏈的查找,來獲得一系列和待預(yù)測(cè)子序列相似并且在演化的子序列,通過對(duì)這些子序列的上漲或下跌的分析,來預(yù)測(cè)待預(yù)測(cè)子序列是否上漲,達(dá)到較高的預(yù)測(cè)正確率。然而該專利無法完全解決上述技術(shù)問題。
技術(shù)實(shí)現(xiàn)思路
1、針對(duì)現(xiàn)有技術(shù)中的缺陷,本專利技術(shù)的目的是提供一種基于重采樣分布估計(jì)的股票預(yù)測(cè)模型在線集成方法及系統(tǒng)。
2、根據(jù)本專利技術(shù)提供的基于重采樣分布估計(jì)的股票預(yù)測(cè)模型在線集成方法,包括:
3、步驟s1:獲取基礎(chǔ)模型預(yù)測(cè)結(jié)果和股票數(shù)據(jù);
4、步驟s2:利用基于循環(huán)神經(jīng)網(wǎng)絡(luò)的時(shí)序特征提取器,提取時(shí)間序列特征;
5、步驟s3:利用基于特征相似性的重采樣器,對(duì)每一條由時(shí)序特征、基礎(chǔ)模型預(yù)測(cè)誤差二者構(gòu)成的樣本進(jìn)行重采樣,為每一個(gè)樣本分配一個(gè)重采樣權(quán)重;
6、步驟s4:在重采樣集上計(jì)算時(shí)序特征和基礎(chǔ)模型預(yù)測(cè)誤差的聯(lián)合概率分布參數(shù),并由此得到線性集成權(quán)重生成器;
7、步驟s5:利用線性集成權(quán)重生成器生成在該數(shù)據(jù)上不同基礎(chǔ)模型的組合權(quán)重,由此得到最終的模型集成預(yù)測(cè)結(jié)果;
8、步驟s6:根據(jù)標(biāo)簽預(yù)測(cè)值和獲取到的標(biāo)簽真實(shí)值計(jì)算預(yù)測(cè)損失,從而優(yōu)化特征提取器和重采樣器。
9、優(yōu)選的,所述基于循環(huán)神經(jīng)網(wǎng)絡(luò)的時(shí)序特征提取器,讀取時(shí)間序列數(shù)據(jù)后,將其輸入神經(jīng)網(wǎng)絡(luò),輸出兩個(gè)不同的特征向量,其一被用于輸入重采樣器進(jìn)行重采樣權(quán)重生成,另一向量與對(duì)應(yīng)的基礎(chǔ)模型預(yù)測(cè)誤差構(gòu)成樣本,進(jìn)行分布估計(jì)。
10、優(yōu)選的,所述步驟s3包括:
11、步驟s3.1:對(duì)所有由時(shí)序特征、基礎(chǔ)模型預(yù)測(cè)誤差二者構(gòu)成的樣本,按時(shí)間劃分為多個(gè)階段;
12、步驟s3.2:對(duì)每個(gè)階段計(jì)算階段內(nèi)的平均特征作為該時(shí)間段的總體特征;
13、步驟s3.3:對(duì)于每條樣本,與所有階段總體特征分別計(jì)算相似度,得到相似度變化趨勢(shì)向量;
14、步驟s3.4:將相似度變化趨勢(shì)向量作為樣本的重采樣特征,輸入神經(jīng)網(wǎng)絡(luò)得到該樣本的重采樣權(quán)重。
15、優(yōu)選的,所述線性集成權(quán)重生成器在與未來分布更接近的重采樣集上進(jìn)行計(jì)算,模型預(yù)測(cè)誤差和提取的時(shí)序特征服從高維高斯分布,其概率分布的計(jì)算公式如下:
16、
17、其中,是樣本高斯分布的均值估計(jì)向量,是樣本高斯分布的協(xié)方差估計(jì)矩陣,an是第n個(gè)樣本的權(quán)重值,xn是第n個(gè)樣本向量,t為樣本總量。
18、優(yōu)選的,在生成線性集成權(quán)重時(shí),需計(jì)算基礎(chǔ)模型預(yù)測(cè)誤差向量e的條件概率分布,并根據(jù)該分布求解最優(yōu)權(quán)重,高維高斯分布下的條件概率分布計(jì)算公式如下:
19、
20、
21、其中,μ1|2是給定向量x2時(shí),向量x1服從的高斯分布的均值向量,∑1|2是x1服從的高斯分布的協(xié)方差矩陣;
22、最優(yōu)組合權(quán)重求解公式如下:
23、
24、其中,w*是最優(yōu)組合權(quán)重向量,1是值全為1的向量,∑是模型預(yù)測(cè)誤差服從的高斯分布中的協(xié)方差矩陣;
25、在本次預(yù)測(cè)階段結(jié)束后,根據(jù)標(biāo)簽預(yù)測(cè)值和獲取到的標(biāo)簽真實(shí)值計(jì)算均方誤差作為損失,從而訓(xùn)練特征提取器和重采樣器。
26、根據(jù)本專利技術(shù)提供的基于重采樣分布估計(jì)的股票預(yù)測(cè)模型在線集成系統(tǒng),包括:
27、模塊m1:獲取基礎(chǔ)模型預(yù)測(cè)結(jié)果和股票數(shù)據(jù);
28、模塊m2:利用基于循環(huán)神經(jīng)網(wǎng)絡(luò)的時(shí)序特征提取器,提取時(shí)間序列特征;
29、模塊m3:利用基于特征相似性的重采樣器,對(duì)每一條由時(shí)序特征、基礎(chǔ)模型預(yù)測(cè)誤差二者構(gòu)成的樣本進(jìn)行重采樣,為每一個(gè)樣本分配一個(gè)重采樣權(quán)重;
30、模塊m4:在重采樣集上計(jì)算時(shí)序特征和基礎(chǔ)模型預(yù)測(cè)誤差的聯(lián)合概率分布參數(shù),并由此得到線性集成權(quán)重生成器;
31、模塊m5:利用線性集成權(quán)重生成器生成在該數(shù)據(jù)上不同基礎(chǔ)模型的組合權(quán)重,由此得到最終的模型集成預(yù)測(cè)結(jié)果;
32、模塊m6:根據(jù)標(biāo)簽預(yù)測(cè)值和獲取到的標(biāo)簽真實(shí)值計(jì)算預(yù)測(cè)損失,從而優(yōu)化特征提取器和重采樣器。
33、優(yōu)選的,所述基于循環(huán)神經(jīng)網(wǎng)絡(luò)的時(shí)序特征提取器,讀取時(shí)間序列數(shù)據(jù)后,將其輸入神經(jīng)網(wǎng)絡(luò),輸出兩個(gè)不同的特征向量,其一被用于輸入重采樣器進(jìn)行重采樣權(quán)重生成,另一向量與對(duì)應(yīng)的基礎(chǔ)模型預(yù)測(cè)誤差構(gòu)成樣本,進(jìn)行分布估計(jì)。
34、優(yōu)選的,所述模塊m3包括:
35、模塊m3.1:對(duì)所有由時(shí)序特征、基礎(chǔ)模型預(yù)測(cè)誤差二者構(gòu)成的樣本,按時(shí)間劃分為多個(gè)階段;
36、模塊m3.2:對(duì)每個(gè)階段計(jì)算階段內(nèi)的平均特征作為該時(shí)間段的總體特征;
<本文檔來自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種基于重采樣分布估計(jì)的股票預(yù)測(cè)模型在線集成方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基于重采樣分布估計(jì)的股票預(yù)測(cè)模型在線集成方法,其特征在于,所述基于循環(huán)神經(jīng)網(wǎng)絡(luò)的時(shí)序特征提取器,讀取時(shí)間序列數(shù)據(jù)后,將其輸入神經(jīng)網(wǎng)絡(luò),輸出兩個(gè)不同的特征向量,其一被用于輸入重采樣器進(jìn)行重采樣權(quán)重生成,另一向量與對(duì)應(yīng)的基礎(chǔ)模型預(yù)測(cè)誤差構(gòu)成樣本,進(jìn)行分布估計(jì)。
3.根據(jù)權(quán)利要求1所述的基于重采樣分布估計(jì)的股票預(yù)測(cè)模型在線集成方法,其特征在于,所述步驟S3包括:
4.根據(jù)權(quán)利要求1所述的基于重采樣分布估計(jì)的股票預(yù)測(cè)模型在線集成方法,其特征在于,所述線性集成權(quán)重生成器在與未來分布更接近的重采樣集上進(jìn)行計(jì)算,模型預(yù)測(cè)誤差和提取的時(shí)序特征服從高維高斯分布,其概率分布的計(jì)算公式如下:
5.根據(jù)權(quán)利要求4所述的基于重采樣分布估計(jì)的股票預(yù)測(cè)模型在線集成方法,其特征在于,在生成線性集成權(quán)重時(shí),需計(jì)算基礎(chǔ)模型預(yù)測(cè)誤差向量E的條件概率分布,并根據(jù)該分布求解最優(yōu)權(quán)重,高維高斯分布下的條件概率分布計(jì)算公式如下:
6.一種基于重采樣分布估計(jì)的股票預(yù)測(cè)模型
7.根據(jù)權(quán)利要求6所述的基于重采樣分布估計(jì)的股票預(yù)測(cè)模型在線集成系統(tǒng),其特征在于,所述基于循環(huán)神經(jīng)網(wǎng)絡(luò)的時(shí)序特征提取器,讀取時(shí)間序列數(shù)據(jù)后,將其輸入神經(jīng)網(wǎng)絡(luò),輸出兩個(gè)不同的特征向量,其一被用于輸入重采樣器進(jìn)行重采樣權(quán)重生成,另一向量與對(duì)應(yīng)的基礎(chǔ)模型預(yù)測(cè)誤差構(gòu)成樣本,進(jìn)行分布估計(jì)。
8.根據(jù)權(quán)利要求6所述的基于重采樣分布估計(jì)的股票預(yù)測(cè)模型在線集成系統(tǒng),其特征在于,所述模塊M3包括:
9.根據(jù)權(quán)利要求6所述的基于重采樣分布估計(jì)的股票預(yù)測(cè)模型在線集成系統(tǒng),其特征在于,所述線性集成權(quán)重生成器在與未來分布更接近的重采樣集上進(jìn)行計(jì)算,模型預(yù)測(cè)誤差和提取的時(shí)序特征服從高維高斯分布,其概率分布的計(jì)算公式如下:
10.根據(jù)權(quán)利要求9所述的基于重采樣分布估計(jì)的股票預(yù)測(cè)模型在線集成系統(tǒng),其特征在于,在生成線性集成權(quán)重時(shí),需計(jì)算基礎(chǔ)模型預(yù)測(cè)誤差向量E的條件概率分布,并根據(jù)該分布求解最優(yōu)權(quán)重,高維高斯分布下的條件概率分布計(jì)算公式如下:
...【技術(shù)特征摘要】
1.一種基于重采樣分布估計(jì)的股票預(yù)測(cè)模型在線集成方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基于重采樣分布估計(jì)的股票預(yù)測(cè)模型在線集成方法,其特征在于,所述基于循環(huán)神經(jīng)網(wǎng)絡(luò)的時(shí)序特征提取器,讀取時(shí)間序列數(shù)據(jù)后,將其輸入神經(jīng)網(wǎng)絡(luò),輸出兩個(gè)不同的特征向量,其一被用于輸入重采樣器進(jìn)行重采樣權(quán)重生成,另一向量與對(duì)應(yīng)的基礎(chǔ)模型預(yù)測(cè)誤差構(gòu)成樣本,進(jìn)行分布估計(jì)。
3.根據(jù)權(quán)利要求1所述的基于重采樣分布估計(jì)的股票預(yù)測(cè)模型在線集成方法,其特征在于,所述步驟s3包括:
4.根據(jù)權(quán)利要求1所述的基于重采樣分布估計(jì)的股票預(yù)測(cè)模型在線集成方法,其特征在于,所述線性集成權(quán)重生成器在與未來分布更接近的重采樣集上進(jìn)行計(jì)算,模型預(yù)測(cè)誤差和提取的時(shí)序特征服從高維高斯分布,其概率分布的計(jì)算公式如下:
5.根據(jù)權(quán)利要求4所述的基于重采樣分布估計(jì)的股票預(yù)測(cè)模型在線集成方法,其特征在于,在生成線性集成權(quán)重時(shí),需計(jì)算基礎(chǔ)模型預(yù)測(cè)誤差向量e的條件概率分布,并根據(jù)該分布求解最優(yōu)權(quán)重,高維高斯分布下的條件概率分布計(jì)算公式如下:
...【專利技術(shù)屬性】
技術(shù)研發(fā)人員:沈艷艷,孫以恒,趙立帆,孔書銘,陳雷,曾雨祥,
申請(qǐng)(專利權(quán))人:上海交通大學(xué),
類型:發(fā)明
國(guó)別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。