【技術實現(xiàn)步驟摘要】
一種股票預測模型構建方法、系統(tǒng)及其應用
[0001]本專利技術涉及金融數(shù)據挖掘
,更具體的說是涉及一種股票預測模型構建方法、系統(tǒng)及其應用。
技術介紹
[0002]目前,現(xiàn)有的股票預測模型主要包括三類方法:
[0003]金融時間序列建模,通過時間序列分析對股票的收益率或波動進行建模和預測,例如ARIMA模型、卡爾曼濾波和GRACH模型;
[0004]深度序列建模,深度序列模型能夠捕捉序列中的非線性關系,通過端到端的訓練自動提取特征;
[0005]圖神經網絡建模,將股票、公司之間的關系進行構圖,從而進行將關系信息納入圖的建模。
[0006]但是,金融時間序列建模依賴于人對市場的觀察與簡單的假設,并不能反映實際的市場環(huán)境;深度序列建模遵循股票時間序列獨立同分布的假設,然而實際金融市場并不滿足這一假設,并且會丟失股票關系信息;然而目前圖神經網絡建模對股票間關系的挖掘和建模過于簡單,未將多樣和動態(tài)關系納入考量。
[0007]因此,如何提供一種股票預測模型構建方法、系統(tǒng)及其應用是本領域技術人員亟需解決的問題。
技術實現(xiàn)思路
[0008]有鑒于此,本專利技術提供了一種股票預測模型構建方法、系統(tǒng)及其應用,在金融時間序列的基礎上,構建股票關系的動態(tài)異質圖,將股票間關系的多樣性與動態(tài)性納入股票關系建模,從而提升模型的預測性能。
[0009]為了實現(xiàn)上述目的,本專利技術采用如下技術方案:
[0010]一種股票預測模型構建方法,包括:
[0011]S1.采 ...
【技術保護點】
【技術特征摘要】
1.一種股票預測模型構建方法,其特征在于,包括:S1.采集原始數(shù)據,原始數(shù)據包括單個交易日內股票的最高價、開盤價、最低價、收盤價和成交量以及公司每季度公開的財務指標數(shù)據,并構建股票特征;S2.構建動態(tài)異質圖,動態(tài)圖的節(jié)點包括股票、上市公司、行業(yè)和地域類型,還包括各節(jié)點特征和時間屬性,動態(tài)圖的邊包括股票之間的價格相關關系、股票與上市公司的從屬關系、股票與行業(yè)的從屬關系、上市公司與行業(yè)的從屬關系以及上市公司與地域的從屬關系,還包括各邊的時間屬性;S3.根據動態(tài)異質圖設計股票時間序列編碼器、上市公司編碼器和行業(yè)及地域編碼器并獲取股票時間序列特征、上市公式特征、行業(yè)特征和地域特征;S4.基于動態(tài)異質圖和獲取的股票時間序列特征、上市公式特征、行業(yè)特征和地域特征,引入注意力機制構建動態(tài)異質圖注意力網絡模型并進行模型訓練。2.根據權利要求1所述的一種股票預測模型構建方法,其特征在于,S1中股票特征包括單個交易日內開盤價、最低價和最高價與收盤價的價格比率特征以及不同交易目的移動平均收益特征;價格比率特征為:μ∈{open,high,low}其中,第j天的開盤價、收盤價、最高價和最低價分別為open
j
,close
j
,high
j
,low
j
;移動平均收益特征為:φ∈{5,10,15,20,25,30}其中,adjclose為調整后的收盤價。3.根據權利要求1所述的一種股票預測模型構建方法,其特征在于,S1還包括對股票的特征值進行z
?
score標準化處理,并對缺失值用0進行填充。4.根據權利要求1所述的一種股票預測模型構建方法,其特征在于,S2中股票之間的價格關系構建方式為:在每個交易日,對每只股票計算與其他所有股票在過去半年內股價間相關性,并從中挑出相關性最大的N只股票與其建邊,計算相關性的方法為:其中,P
i
和P
j
分別為股票i和股票j過去半年的股價。5.根據權利要求1所述的一種股票預測模型構建方法,其特征在于,S3的具體內容為:(1)股票時間序列編碼器:對輸入特征向量進行非線性映射,得到新的特征向量為:其中,為股票S
q
輸入的股票節(jié)點特征形式,W1和b1為可學習的
參數(shù);基于深度序列模型中的雙向LSTM模型對新的特征序列進行編碼,得到每個時間步的股票S
q
的隱藏層表征:的隱藏層表征:通過注意力機制求和:通過注意力機制求和:通過注意力機制求和:其中,v,W2,b2是可學習的參數(shù);與LSTM的最終隱層表征拼接得到股票的時間序列表征:(2)上市公司編碼器:通過雙層MLP和殘差連接的結構用于表征提取,得到上市公司C
i
的表征為:其中,W
C
,W3,W4,b3,b4均為可學習的參數(shù),ReLU為神經網絡中的非線性激活函數(shù),為上市公司C
i
在t時刻的輸入特征;(3)行業(yè)及地域編碼器:對于行業(yè)以及地域類型的節(jié)點,分別設置可訓練的embedding層,行業(yè)I
j
和地域A
k
的表征分別為:征分別為...
【專利技術屬性】
技術研發(fā)人員:章子晗,王靜遠,李超,
申請(專利權)人:北京航空航天大學,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。