System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及人工智能,特別是涉及一種信息合成方法以及裝置。
技術介紹
1、盡管大型語言模型在各種語言任務中展示了顯著的能力,但它們在理解和解決復雜問題(例如,數學和編程)方面仍存在問題。解決該問題的一種有效方法是,大型語言模型在進行理解和解決復雜問題時,使用大規模的高質量合成數據。然而,開發一個低成本且有效的數據合成方法仍然是一個挑戰。
2、現有的數據合成方法有三個主要的缺點:
3、(1)有限的擴展性:現有的方法難以基于較少的種子數據合成更大規模的數據。
4、(2)高成本:目前的數據合成方法依賴于商業模型的幫助,導致合成成本顯著增加。
5、(3)與種子數據相似:由于在合成過程中對種子數據的過度依賴,新生成的數據與種子數據非常相似,導致生成的數據多樣性不足。
6、針對上述的現有技術中的數據信息合成方法存在數據擴展性差、數據合成成本高,以及生成的數據多樣性不足的技術問題,目前尚未提出有效的解決方案。
技術實現思路
1、本申請的實施例提供了一種信息合成方法以及裝置,以至少解決現有技術中存在的數據信息合成方法存在數據擴展性差、數據合成成本高,以及生成的數據多樣性不足的技術問題。
2、根據本申請實施例的一個方面,提供了一種信息合成方法,包括:通過預設的分解模型對種子問題進行分解,生成與種子問題相關的元信息;根據元信息之間的元信息關系構建第一元信息關系圖,其中元信息關系用于指示同一種子問題中的各個元信息之間的關聯關系和不同種
3、根據本申請實施例的另一個方面,還提供了一種信息合成裝置,包括:信息生成模塊,用于通過預設的分解模型對種子問題進行分解,生成與種子問題相關的元信息;關系圖生成模塊,用于根據元信息之間的元信息關系構建第一元信息關系圖,其中元信息關系用于指示同一種子問題中的各個元信息之間的關聯關系和不同種子問題中的各個元信息之間的關聯關系;組合生成模塊,用于根據第一元信息關系圖中的元信息節點之間的元信息關系,對元信息節點進行組合,生成元信息組合,其中不同的元信息組合具有不同的元信息關系;以及信息合成模塊,用于通過問答生成模型根據元信息組合以及相應的提示詞,生成合成問題以及相應的合成答案。
4、根據本申請實施例的另一個方面,還提供了一種信息合成裝置,包括:處理器;以及存儲器,與處理器連接,用于為處理器提供處理以下處理步驟的指令:通過預設的分解模型對種子問題進行分解,生成與種子問題相關的元信息;根據元信息之間的元信息關系構建第一元信息關系圖,其中元信息關系用于指示同一種子問題中的各個元信息之間的關聯關系和不同種子問題中的各個元信息之間的關聯關系;根據第一元信息關系圖中的元信息節點之間的元信息關系,對元信息節點進行組合,生成元信息組合,其中不同的元信息組合具有不同的元信息關系;以及通過問答生成模型根據元信息組合以及相應的提示詞,生成合成問題以及相應的合成答案。
5、在本申請實施例中,計算設備對種子問題進行分解,從而可以多方面多維度地獲得與種子問題對應的元信息作為擴展的種子數據,從而本技術方案實現了對種子數據的規模的擴展,得到了更大規模的種子數據。并且本技術方案通過構建元信息之間的關系,生成元信息關系圖,之后將元信息關系圖中的各個元信息節點進行靈活組合,生成與元信息關系對應的多種類型的元信息組合,并且利用元信息組合生成相應的問題以及答案,進而生成更多種類的種子數據,擴大種子數據的規模,減少了對原始種子數據的依賴性,增加了合成數據的多樣性。并且本技術方案進行數據合成時所使用到的數據模型大多為開源模型,避免了依賴于商業模型的幫助,減少了合成成本。進而解決了數據信息合成方法存在數據擴展性差、數據合成成本高,以及生成的數據多樣性不足的技術問題。
本文檔來自技高網...【技術保護點】
1.一種信息合成方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,根據所述元信息之間的元信息關系構建第一元信息關系圖的操作,包括:
3.根據權利要求2所述的方法,其特征在于,根據所述第二元信息關系圖以及所述元信息關系構建所述第一元信息關系圖的操作,包括:
4.根據權利要求3所述的方法,其特征在于,根據所述第三元信息關系圖以及所述元信息關系構建所述第一元信息關系圖的操作,包括:
5.根據權利要求4所述的方法,其特征在于,根據所述第四元信息關系圖以及所述元信息關系構建所述第一元信息關系圖的操作,包括:
6.根據權利要求5所述的方法,其特征在于,根據所述第一元信息關系圖中的元信息節點之間的元信息關系,對所述元信息節點進行組合,生成元信息組合的操作,包括:
7.根據權利要求1所述的方法,其特征在于,還包括:
8.根據權利要求7所述的方法,其特征在于,通過問答生成模型根據所述元信息組合以及相應的提示詞,生成合成問題以及相應的合成答案的操作,包括:
9.一種信息合成裝置,其特征在
10.一種信息合成裝置,其特征在于,包括:
...【技術特征摘要】
1.一種信息合成方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,根據所述元信息之間的元信息關系構建第一元信息關系圖的操作,包括:
3.根據權利要求2所述的方法,其特征在于,根據所述第二元信息關系圖以及所述元信息關系構建所述第一元信息關系圖的操作,包括:
4.根據權利要求3所述的方法,其特征在于,根據所述第三元信息關系圖以及所述元信息關系構建所述第一元信息關系圖的操作,包括:
5.根據權利要求4所述的方法,其特征在于,根據所述第四元信息關系圖以及所述元信息關系...
【專利技術屬性】
技術研發人員:李巖,張勇東,王健康,王曉瑞,王裕鑫,行夢婷,謝洪濤,
申請(專利權)人:北京元石創新科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。