• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種股票預測模型構建方法、系統(tǒng)及其應用技術方案

    技術編號:36568426 閱讀:25 留言:0更新日期:2023-02-04 17:25
    本發(fā)明專利技術公開了一種股票預測模型構建方法、系統(tǒng)及其應用,包括:S1.采集單個交易日內股票的最高價、開盤價、最低價、收盤價和成交量以及公司每季度的財務指標數(shù)據,并構建股票特征;S2.構建動態(tài)異質圖,動態(tài)圖的點包括股票、上市公司、行業(yè)和地域類型,邊包括股票之間的價格相關關系、股票與上市公司的從屬關系、股票與行業(yè)的從屬關系、上市公司與行業(yè)的從屬關系以及上市公司與地域的從屬關系;S3.設計股票時間序列編碼器、上市公司編碼器和行業(yè)及地域編碼器并獲取股票時間序列特征、上市公式特征、行業(yè)特征和地域特征;S4.構建動態(tài)異質圖注意力網絡模型并進行訓練;本發(fā)明專利技術將股票間關系的多樣性與動態(tài)性納入股票關系建模,從而提升模型的預測性能。型的預測性能。型的預測性能。

    【技術實現(xiàn)步驟摘要】
    一種股票預測模型構建方法、系統(tǒng)及其應用


    [0001]本專利技術涉及金融數(shù)據挖掘
    ,更具體的說是涉及一種股票預測模型構建方法、系統(tǒng)及其應用。

    技術介紹

    [0002]目前,現(xiàn)有的股票預測模型主要包括三類方法:
    [0003]金融時間序列建模,通過時間序列分析對股票的收益率或波動進行建模和預測,例如ARIMA模型、卡爾曼濾波和GRACH模型;
    [0004]深度序列建模,深度序列模型能夠捕捉序列中的非線性關系,通過端到端的訓練自動提取特征;
    [0005]圖神經網絡建模,將股票、公司之間的關系進行構圖,從而進行將關系信息納入圖的建模。
    [0006]但是,金融時間序列建模依賴于人對市場的觀察與簡單的假設,并不能反映實際的市場環(huán)境;深度序列建模遵循股票時間序列獨立同分布的假設,然而實際金融市場并不滿足這一假設,并且會丟失股票關系信息;然而目前圖神經網絡建模對股票間關系的挖掘和建模過于簡單,未將多樣和動態(tài)關系納入考量。
    [0007]因此,如何提供一種股票預測模型構建方法、系統(tǒng)及其應用是本領域技術人員亟需解決的問題。

    技術實現(xiàn)思路

    [0008]有鑒于此,本專利技術提供了一種股票預測模型構建方法、系統(tǒng)及其應用,在金融時間序列的基礎上,構建股票關系的動態(tài)異質圖,將股票間關系的多樣性與動態(tài)性納入股票關系建模,從而提升模型的預測性能。
    [0009]為了實現(xiàn)上述目的,本專利技術采用如下技術方案:
    [0010]一種股票預測模型構建方法,包括:
    [0011]S1.采集原始數(shù)據,原始數(shù)據包括單個交易日內股票的最高價、開盤價、最低價、收盤價和成交量以及公司每季度公開的財務指標數(shù)據,并構建股票特征;
    [0012]S2.構建動態(tài)異質圖,動態(tài)圖的節(jié)點包括股票、上市公司、行業(yè)和地域類型,還包括各節(jié)點特征和時間屬性,動態(tài)圖的邊包括股票之間的價格相關關系、股票與上市公司的從屬關系、股票與行業(yè)的從屬關系、上市公司與行業(yè)的從屬關系以及上市公司與地域的從屬關系,還包括各邊的時間屬性;
    [0013]S3.根據動態(tài)異質圖設計股票時間序列編碼器、上市公司編碼器和行業(yè)及地域編碼器并獲取股票時間序列特征、上市公式特征、行業(yè)特征和地域特征;
    [0014]S4.基于動態(tài)異質圖和獲取的股票時間序列特征、上市公式特征、行業(yè)特征和地域特征,引入注意力機制構建動態(tài)異質圖注意力網絡模型并進行模型訓練。
    [0015]優(yōu)選的,S1中股票特征包括單個交易日內開盤價、最低價和最高價與收盤價的價
    格比率特征以及不同交易日的移動平均收益特征;
    [0016]價格比率特征為:
    [0017][0018]μ∈{open,high,low}
    [0019]其中,第j天的開盤價、收盤價、最高價和最低價分別為open
    j
    ,close
    j
    ,high
    j
    ,low
    j

    [0020]移動平均收益特征為:
    [0021][0022]φ∈{5,10,15,20,25,30}
    [0023]其中,adjclose為調整后的收盤價。
    [0024]優(yōu)選的,S1還包括對股票的特征值進行z
    ?
    score標準化處理,并對缺失值用0進行填充。
    [0025]優(yōu)選的,S2中股票之間的價格關系構建方式為:在每個交易日,對每只股票計算與其他所有股票在過去半年內股價間相關性,并從中挑出相關性最大的N只股票與其建邊,計算相關性的方法為:
    [0026][0027]其中,P
    i
    和P
    j
    分別為股票i和股票j過去半年的股價。
    [0028]優(yōu)選的,S3的具體內容為:
    [0029](1)股票時間序列編碼器:
    [0030]對輸入特征向量進行非線性映射,得到新的特征向量為:
    [0031][0032]其中,為股票S
    q
    輸入的股票節(jié)點特征形式,W1和b1為可學習的參數(shù);
    [0033]基于深度序列模型中的雙向LSTM模型對新的特征序列進行編碼,得到每個時間步的股票S
    q
    的隱藏層表征:
    [0034][0035][0036]通過注意力機制求和:
    [0037][0038][0039][0040]其中,v,W2,b2是可學習的參數(shù);
    [0041]與LSTM的最終隱層表征拼接得到股票的時間序列表征:
    [0042][0043](2)上市公司編碼器:
    [0044]通過雙層MLP和殘差連接的結構用于表征提取,得到上市公司C
    i
    的表征為:
    [0045][0046]其中,W
    c
    ,W3,W4,b3,b4均為可學習的參數(shù),ReLU為神經網絡中的非線性激活函數(shù),為上市公司C
    i
    在t時刻的輸入特征;
    [0047](3)行業(yè)及地域編碼器:
    [0048]對于行業(yè)以及地域類型的節(jié)點,分別設置可訓練的embedding層,行業(yè)I
    j
    和地域A
    k
    的表征分別為:
    [0049][0050][0051]優(yōu)選的,S4中構建動態(tài)異質圖注意力網絡的具體內容包括:
    [0052](1)相對時序編碼
    [0053]對于給定的節(jié)點v,其對應的輸入時間為t(v),經過時序編碼后為:
    [0054][0055]其中,t(v為節(jié)點v的建立時間,t2v(t(v))[i]表示對節(jié)點v編碼向量的第i維,為周期函數(shù),ω
    i
    和φ
    i
    均為模型可學習的參數(shù);
    [0056](2)動態(tài)異質圖注意力層
    [0057]圖神經網絡的消息傳遞范式為:
    [0058][0059]其中,表示圖神經網絡第l層的輸入,UPDATE
    (l)
    和AGGREGATE
    (l)
    分別為第l層的更新和鄰域聚合操作;
    [0060]對第l層的節(jié)點u,其輸入向量省略t,記為首先基于Transformer中的股票自注意力機制,節(jié)點u的查詢向量、鍵向量和值向量分別為:
    [0061][0062][0063]其中,μ&lt;τ(v),φ(e),τ(u)&gt;表示圖中關系類型三元組&lt;τ(v),φ(e),τ(u)&gt;的縮放
    因子,為自注意力機制中控制點積數(shù)值的縮放因子;
    [0064]在的基礎上引入關于邊的建立時間長短的高斯先驗注意力項Δ
    t
    =t
    ?
    t(e)表示邊e從上一次建立到當前時刻t的時長,f為Δ
    t
    的單調遞增函數(shù)則:
    [0065][0066]其中Z1和Z2為歸一化因子:
    [0067][0068][0069]σ為非線性激活函數(shù),定義引入關系時長敏感的注意力項:
    [0070][0071]其中,w
    (l)
    和b
    (l)<本文檔來自技高網
    ...

    【技術保護點】

    【技術特征摘要】
    1.一種股票預測模型構建方法,其特征在于,包括:S1.采集原始數(shù)據,原始數(shù)據包括單個交易日內股票的最高價、開盤價、最低價、收盤價和成交量以及公司每季度公開的財務指標數(shù)據,并構建股票特征;S2.構建動態(tài)異質圖,動態(tài)圖的節(jié)點包括股票、上市公司、行業(yè)和地域類型,還包括各節(jié)點特征和時間屬性,動態(tài)圖的邊包括股票之間的價格相關關系、股票與上市公司的從屬關系、股票與行業(yè)的從屬關系、上市公司與行業(yè)的從屬關系以及上市公司與地域的從屬關系,還包括各邊的時間屬性;S3.根據動態(tài)異質圖設計股票時間序列編碼器、上市公司編碼器和行業(yè)及地域編碼器并獲取股票時間序列特征、上市公式特征、行業(yè)特征和地域特征;S4.基于動態(tài)異質圖和獲取的股票時間序列特征、上市公式特征、行業(yè)特征和地域特征,引入注意力機制構建動態(tài)異質圖注意力網絡模型并進行模型訓練。2.根據權利要求1所述的一種股票預測模型構建方法,其特征在于,S1中股票特征包括單個交易日內開盤價、最低價和最高價與收盤價的價格比率特征以及不同交易目的移動平均收益特征;價格比率特征為:μ∈{open,high,low}其中,第j天的開盤價、收盤價、最高價和最低價分別為open
    j
    ,close
    j
    ,high
    j
    ,low
    j
    ;移動平均收益特征為:φ∈{5,10,15,20,25,30}其中,adjclose為調整后的收盤價。3.根據權利要求1所述的一種股票預測模型構建方法,其特征在于,S1還包括對股票的特征值進行z
    ?
    score標準化處理,并對缺失值用0進行填充。4.根據權利要求1所述的一種股票預測模型構建方法,其特征在于,S2中股票之間的價格關系構建方式為:在每個交易日,對每只股票計算與其他所有股票在過去半年內股價間相關性,并從中挑出相關性最大的N只股票與其建邊,計算相關性的方法為:其中,P
    i
    和P
    j
    分別為股票i和股票j過去半年的股價。5.根據權利要求1所述的一種股票預測模型構建方法,其特征在于,S3的具體內容為:(1)股票時間序列編碼器:對輸入特征向量進行非線性映射,得到新的特征向量為:其中,為股票S
    q
    輸入的股票節(jié)點特征形式,W1和b1為可學習的
    參數(shù);基于深度序列模型中的雙向LSTM模型對新的特征序列進行編碼,得到每個時間步的股票S
    q
    的隱藏層表征:的隱藏層表征:通過注意力機制求和:通過注意力機制求和:通過注意力機制求和:其中,v,W2,b2是可學習的參數(shù);與LSTM的最終隱層表征拼接得到股票的時間序列表征:(2)上市公司編碼器:通過雙層MLP和殘差連接的結構用于表征提取,得到上市公司C
    i
    的表征為:其中,W
    C
    ,W3,W4,b3,b4均為可學習的參數(shù),ReLU為神經網絡中的非線性激活函數(shù),為上市公司C
    i
    在t時刻的輸入特征;(3)行業(yè)及地域編碼器:對于行業(yè)以及地域類型的節(jié)點,分別設置可訓練的embedding層,行業(yè)I
    j
    和地域A
    k
    的表征分別為:征分別為...

    【專利技術屬性】
    技術研發(fā)人員:章子晗王靜遠李超
    申請(專利權)人:北京航空航天大學
    類型:發(fā)明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 国产精品无码一区二区三区毛片 | 13小箩利洗澡无码视频网站免费| 亚洲中文字幕无码久久2020 | 伊人久久精品无码二区麻豆| 无码孕妇孕交在线观看| 中文字幕亚洲精品无码| YW尤物AV无码国产在线观看| 无码国内精品久久人妻| mm1313亚洲精品无码又大又粗| 国产精品三级在线观看无码| 无码粉嫩小泬无套在线观看| 欧洲精品无码一区二区三区在线播放| 中文字幕无码成人免费视频| 亚洲欧洲自拍拍偷午夜色无码| 毛片亚洲AV无码精品国产午夜| 日韩AV无码久久一区二区| 一本大道东京热无码一区| 精品一区二区三区无码免费直播 | 无码八A片人妻少妇久久| 国产精品无码专区| 无码人妻AⅤ一区二区三区水密桃| 99久久人妻无码精品系列蜜桃 | 亚洲国产精品无码专区在线观看| 岛国av无码免费无禁网站| 一本色道无码道DVD在线观看| 亚洲日韩中文无码久久| 久久久久亚洲AV无码专区网站 | 亚洲美日韩Av中文字幕无码久久久妻妇| 人妻aⅴ无码一区二区三区| 亚洲av永久无码精品秋霞电影影院 | 亚洲AV日韩AV无码污污网站| 精品人妻系列无码一区二区三区| 亚洲AV无码一区二区三区系列| 亚洲日韩中文无码久久| 在线a亚洲v天堂网2019无码| 国产午夜片无码区在线播放| 无码少妇精品一区二区免费动态| 无码国产福利av私拍| 无码人妻精品中文字幕| 精品无码人妻一区二区三区| 亚洲成av人片不卡无码|