System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及數據處理和人工智能,尤其涉及一種基于大模型的智能數據生成方法、系統、設備及介質。
技術介紹
1、在當今競爭激烈的商業環境中,企業的資金管理至關重要。有效的資金管理不僅可以確保企業的正常運營,還可以為企業的發展提供有力的支持。為了實現高效的資金管理,企業需要構建各種維度的業務報表、數據視圖和數據倉庫,以深入挖掘司庫數據資產的價值,為資金管理決策提供準確、及時的信息支持。
2、然而,隨著企業業務的不斷發展和數據量的急劇增加,傳統的司庫報表生成方式面臨著諸多挑戰。首先,傳統方式通常依賴于人工操作和固定模板,這不僅效率低下,而且難以滿足靈活多變的業務需求。例如,當企業需要根據特定的業務場景生成定制化的報表時,人工操作往往需要耗費大量的時間和精力,且容易出現錯誤和遺漏。其次,由于司庫數據的復雜性和多樣性,人工篩選和分析數據容易出現錯誤和遺漏,影響決策的準確性和及時性。此外,傳統的檢索方式難以在海量數據中快速準確地找到所需信息,降低了工作效率。
技術實現思路
1、本專利技術實施例提供一種基于大模型的智能數據生成方法,以解決相關技術存在的問題,技術方案如下:
2、第一方面,本專利技術實施例提供了一種基于大模型的智能數據生成方法,包括:
3、獲取對話信息,基于llm語言模型處理對話信息確定關鍵信息,并根據關鍵信息確定檢索意圖種類;
4、基于多路召回算法執行檢索意圖種類相關的多個檢索任務,每個檢索任務均從預設數據庫中檢索得到與關鍵信息相關
5、調用與檢索意圖種類相關聯的工具組件,通過工具組件對目標數據進行處理,生成與目標數據相關的數據報表。
6、在一種實施方式中,檢索意圖包括表文件檢索、圖文件檢索、實時數據檢索、特定數據指標查詢意圖、數據范圍限定檢索意圖和數據對比意圖。
7、在一種實施方式中,還包括:
8、基于數據分頁算法分批獲取司庫數據,司庫數據包括財務數據、業務數據、交易數據;
9、基于異常檢測算法確定司庫數據的異常值,對異常值進行數據清洗,得到有效數據;
10、識別有效數據的特征信息,根據特征信息對有效數據進行標注和分類,得到目標司庫數據;
11、將目標司庫數據存入數據庫中,得到預設數據庫。
12、在一種實施方式中,還包括:
13、在檢索意圖種類為實時數據檢索的情況下,連接實時數據源;
14、從實時數據源中獲取與關鍵信息相關的最新數據進行展示。
15、在一種實施方式中,多路召回算法包括稀疏bm25召回算法、稠密向量召回算法以及大模型重寫召回算法。
16、在一種實施方式中,還包括:
17、根據對話信息確定標注需求,根據標注需求確定需要標注的報表節點以及標注內容;
18、對數據報表中相應的報表節點上自動標注相應的標注內容,得到更新后的數據報表。
19、在一種實施方式中,工具組件包括文生圖組件,文生圖組件用于運行指定圖形繪制算法繪制出與目標數據相關的圖形文件,圖形文件包括折線圖、柱狀圖、餅圖。
20、第二方面,本專利技術實施例提供了一種基于大模型的智能數據生成方法。
21、第三方面,本專利技術實施例提供了一種電子設備,該裝置包括:存儲器和處理器。其中,該存儲器和該處理器通過內部連接通路互相通信,該存儲器用于存儲指令,該處理器用于執行該存儲器存儲的指令,并且當該處理器執行該存儲器存儲的指令時,使得該處理器執行上述各方面任一種實施方式中的方法。
22、第四方面,本專利技術實施例提供了一種計算機可讀存儲介質,計算機可讀存儲介質存儲計算機程序,當計算機程序在計算機上運行時,上述各方面任一種實施方式中的方法被執行。
23、上述技術方案中的優點或有益效果至少包括:
24、本專利技術采用對話的自然交互形式智能分析檢索意圖種類,根據檢索意圖種類進入多輪多路數據文件召回流程以完成相應的檢索任務,得到對話關鍵詞相關的目標數據,再通過工具組件根據目標數據生成相應的數據報表供用戶查看,提高數據檢索的準確性和效率,以滿足靈活多變的業務需求。
25、上述概述僅僅是為了說明書的目的,并不意圖以任何方式進行限制。除上述描述的示意性的方面、實施方式和特征之外,通過參考附圖和以下的詳細描述,本專利技術進一步的方面、實施方式和特征將會是容易明白的。
本文檔來自技高網...【技術保護點】
1.一種基于大模型的智能數據生成方法,其特征在于,包括:
2.根據權利要求1所述的基于大模型的智能數據生成方法,其特征在于,所述檢索意圖包括表文件檢索、圖文件檢索、實時數據檢索、特定數據指標查詢意圖、數據范圍限定檢索意圖和數據對比意圖。
3.根據權利要求1所述的基于大模型的智能數據生成方法,其特征在于,還包括:
4.根據權利要求1所述的基于大模型的智能數據生成方法,其特征在于,還包括:
5.根據權利要求1所述的基于大模型的智能數據生成方法,其特征在于,所述多路召回算法包括稀疏BM25召回算法、稠密向量召回算法以及大模型重寫召回算法。
6.根據權利要求1所述的基于大模型的智能數據生成方法,其特征在于,還包括:
7.根據權利要求1所述的基于大模型的智能數據生成方法,其特征在于,所述工具組件包括文生圖組件,所述文生圖組件用于運行指定圖形繪制算法繪制出與所述目標數據相關的圖形文件,所述圖形文件包括折線圖、柱狀圖、餅圖。
8.一種基于大模型的智能數據生成系統,其特征在于,執行如權利要求1~7任一所述的基于大
9.一種電子設備,其特征在于,包括:處理器和存儲器,所述存儲器中存儲指令,所述指令由處理器加載并執行,以實現如權利要求1~7任一所述的基于大模型的智能數據生成方法。
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質內存儲有計算機程序,所述計算機程序被處理器執行時實現如權利要求1~7任一所述的基于大模型的智能數據生成方法。
...【技術特征摘要】
1.一種基于大模型的智能數據生成方法,其特征在于,包括:
2.根據權利要求1所述的基于大模型的智能數據生成方法,其特征在于,所述檢索意圖包括表文件檢索、圖文件檢索、實時數據檢索、特定數據指標查詢意圖、數據范圍限定檢索意圖和數據對比意圖。
3.根據權利要求1所述的基于大模型的智能數據生成方法,其特征在于,還包括:
4.根據權利要求1所述的基于大模型的智能數據生成方法,其特征在于,還包括:
5.根據權利要求1所述的基于大模型的智能數據生成方法,其特征在于,所述多路召回算法包括稀疏bm25召回算法、稠密向量召回算法以及大模型重寫召回算法。
6.根據權利要求1所述的基于大模型的智能數據生成方法,其特征在于,還包括:
7....
【專利技術屬性】
技術研發人員:劉旭波,謝霖,謝曉建,羅擁軍,劉淼,
申請(專利權)人:廣東億迅科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。