System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及機器學習以及數據處理,特別是涉及一種外來信息與市場因子關系的分析方法、系統、介質及設備。
技術介紹
1、在對外來信息與市場因子的分析應用場景下,早期需要人工地解讀新聞和市場數據,分析師研究大量的新聞文章、報告和市場數據,并通過經驗和專業知識來識別可能的關聯和趨勢,這種方法需要耗費大量的時間和精力,并且容易受到主觀因素的影響。總的來說,在外來信息與市場因子關系分析任務上,缺乏自動化和大規模分析的手段。
2、隨著計算機科學和數據科學領域的技術發展,人們逐漸引入了更先進的技術和方法,其中,使用自然語言處理技術來幫助處理和分析大量的文本數據,從而使模型理解外來信息的語義,正確解讀外來信息的內容,對此,好的語言模型是正確解讀和推理文本的基礎。
3、近年來,大型語言模型(large?language?model,llms)在自然語言處理領域展現出了出色的能力,包括自然語言生成、語言翻譯、文本摘要、對話系統等應用。其中一些經典模型如gpt-4、bert和xlnet等已經得到廣泛應用,gpt的全稱是generative?pre-trainedtransformer,是一種基于互聯網的、可用數據來訓練的、文本生成的深度學習模型,特別是gpt系列的后續模型(如gpt3、gpt3.5、gpt4),借助更大的語料庫和更多的參數,展現出了強大的語言理解和邏輯推理能力。然而,在實際應用時,發現gpt并不總能提供高質量的答案,其中,gpt的回答高度依賴于提問的指令(prompt),如何構造好的prompt從而獲得滿意的回
技術實現思路
1、本專利技術的目的在于提供一種外來信息與市場因子關系的分析方法、系統、介質及設備,用于解決外來信息與市場因子關系的分析的問題。
2、第一方面,本申請提供了一種外來信息與市場因子關系的分析方法,所述方法包括:
3、構建基于gpt的新聞描述單元以獲取新聞總結描述;
4、構建市場狀態描述單元以獲取市場狀態描述,其中,所述市場狀態描述至少包括價格趨勢、價格波動率和交易活躍程度;
5、獲取系統原則,結合預設輸出格式以及預設思維鏈得到提示生成器;
6、將所述新聞總結描述以及所述市場狀態描述輸入到所述提示生成器得到提示數據,并將所述提示數據輸入至預設gpt模型中得到分析結果。
7、在本申請一個可能的實現方式中,所述構建基于gpt的新聞描述單元以獲取新聞總結描述,具體包括:
8、獲取外來信息進行逐段預處理得到目標新聞數據,所述目標新聞數據包括新聞特征,其中,所述新聞特征至少包括公司代碼、日期、新聞標題以及新聞正文;
9、將所述目標新聞數據逐段輸入至預設gpt模型中進行處理得到所述新聞總結描述。
10、在本申請一個可能的實現方式中,所述獲取外來信息進行逐段預處理得到目標新聞數據,具體包括:
11、連接新聞的標題和正文以合并成一段完整文本;
12、對所述完整文本內的標點符號進行規范處理;
13、檢查每一段完整文本的段落長度值,并與預設值比較,其中,若所述段落長度值大于所述預設值,則對當前完整文本進行分段切割直到切割后的新聞段落長度值小于或者等于所述預設值。
14、在本申請一個可能的實現方式中,將所述目標新聞數據逐段輸入至預設gpt模型中時,上一段的總結描述作為上文與下一段的新聞數據連接后作為所述預設gpt模型的新輸入數據,其中,若所述新輸入數據的段落長度值超出預設值,則將所述新輸入數據進行分段切割直到切割后的新輸入數據的段落長度值小于或者等于所述預設值。
15、在本申請一個可能的實現方式中,所述構建市場狀態描述單元以獲取市場狀態描述,具體包括:
16、獲取原始市場狀態時序數據,其中,所述原始市場狀態時序數據的時序特征至少包括公司代碼、日期、開盤價序列、收盤價序列、最高價序列、最低價序列、成交量序列和換手率序列;
17、利用統計模型以及tsfresh庫將所述原始市場狀態時序數據進行處理和轉換,以生成所述市場狀態描述。
18、在本申請一個可能的實現方式中,所述獲取系統原則,結合預設輸出格式以及預設思維鏈得到提示生成器,具體包括:
19、獲取用戶端輸入的系統原則來限定所述提示生成器與所述gpt模型的響應領域;
20、采用上下文學習方式作為所述預設輸出格式以確定所述提示生成器的文本輸出格式;
21、基于所述思維鏈中的推理要求和推理格式確定所述提示生成器的推理結論。
22、在本申請一個可能的實現方式中,所述方法還包括計算評估指標,其中,所述評估指標包括精確率和召回率。
23、第二方面,本申請提供了一種外來信息與市場因子關系的分析系統,所述系統包括:
24、新聞描述模塊,用于構建基于gpt的新聞描述單元以獲取新聞總結描述;
25、市場狀態描述模塊,用于構建市場狀態描述單元以獲取市場狀態描述,其中,所述市場狀態描述至少包括價格趨勢、價格波動率和交易活躍程度;
26、獲取模塊,用于獲取系統原則,結合預設輸出格式以及預設思維鏈得到提示生成器;
27、輸入模塊,用于將所述新聞總結描述以及所述市場狀態描述輸入到所述提示生成器得到提示數據,并將所述提示數據輸入至預設gpt模型中得到分析結果。
28、第三方面,本申請提供了一種上述的計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執行時實現所述外來信息與市場因子關系的分析方法。
29、第四方面,本申請提供了一種上述的電子設備,所述電子設備包括:處理器及存儲器;其中,所述存儲器用于存儲計算機程序,所述處理器用于加載執行所述計算機程序,以使所述電子設備執行所述的外來信息與市場因子關系的分析方法。
30、如上所述,本專利技術的外來信息與市場因子關系的分析方法、系統、介質及設備,通過對指令進行嚴謹和巧妙的設計,利用gpt模型能夠實現對外來信息與市場因子關系的快速且準確地分析和預測,以提供參考給用戶,幫助其分析市場動態。
本文檔來自技高網...【技術保護點】
1.一種外來信息與市場因子關系的分析方法,其特征在于,包括:
2.根據權利要求1所述的外來信息與市場因子關系的分析方法,其特征在于,所述構建基于GPT的新聞描述單元以獲取新聞總結描述,具體包括:
3.根據權利要求2所述的外來信息與市場因子關系的分析方法,其特征在于,所述獲取外來信息進行逐段預處理得到目標新聞數據,具體包括:
4.根據權利要求2所述的外來信息與市場因子關系的分析方法,其特征在于,將所述目標新聞數據逐段輸入至預設GPT模型中時,上一段的總結描述作為上文與下一段的新聞數據連接后作為所述預設GPT模型的新輸入數據,其中,若所述新輸入數據的段落長度值超出預設值,則將所述新輸入數據進行分段切割直到切割后的新輸入數據的段落長度值小于或者等于所述預設值。
5.根據權利要求2所述的外來信息與市場因子關系的分析方法,其特征在于,所述構建市場狀態描述單元以獲取市場狀態描述,具體包括:
6.根據權利要求5所述的外來信息與市場因子關系的分析方法,其特征在于,所述獲取系統原則,結合預設輸出格式以及預設思維鏈得到提示生成器,具體包括:
7.根據權利要求6所述的外來信息與市場因子關系的分析方法,其特征在于,所述方法還包括計算評估指標,其中,所述評估指標包括精確率和召回率。
8.一種外來信息與市場因子關系的分析系統,其特征在于,包括:
9.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時實現權利要求1至7任一項所述外來信息與市場因子關系的分析方法。
10.一種電子設備,其特征在于,所述電子設備包括:處理器及存儲器;其中,所述存儲器用于存儲計算機程序,所述處理器用于執行所述存儲器存儲的計算機程序,以使所述電子設備執行如權利要求1至7中任一項所述外來信息與市場因子關系的分析方法。
...【技術特征摘要】
1.一種外來信息與市場因子關系的分析方法,其特征在于,包括:
2.根據權利要求1所述的外來信息與市場因子關系的分析方法,其特征在于,所述構建基于gpt的新聞描述單元以獲取新聞總結描述,具體包括:
3.根據權利要求2所述的外來信息與市場因子關系的分析方法,其特征在于,所述獲取外來信息進行逐段預處理得到目標新聞數據,具體包括:
4.根據權利要求2所述的外來信息與市場因子關系的分析方法,其特征在于,將所述目標新聞數據逐段輸入至預設gpt模型中時,上一段的總結描述作為上文與下一段的新聞數據連接后作為所述預設gpt模型的新輸入數據,其中,若所述新輸入數據的段落長度值超出預設值,則將所述新輸入數據進行分段切割直到切割后的新輸入數據的段落長度值小于或者等于所述預設值。
5.根據權利要求2所述的外來信息與市場因子關系的分析方法,其特征在于,所述構建市場狀態描述單元以獲...
【專利技術屬性】
技術研發人員:楊煒祖,李從愷,
申請(專利權)人:上海源廬加佳信息科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。