System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本申請涉及人工智能,能夠應(yīng)用于金融科技領(lǐng)域,尤其涉及一種基于大模型的文本處理方法和系統(tǒng)、電子設(shè)備、存儲(chǔ)介質(zhì)。
技術(shù)介紹
1、大模型可以用于執(zhí)行文本分類、內(nèi)容推薦以及指標(biāo)發(fā)展趨勢分析等任務(wù)。例如在金融科技領(lǐng)域,大模型可以應(yīng)用于金融信息的分類、提供金融咨詢服務(wù)以及預(yù)測金融指標(biāo)等任務(wù)。然而,這些大模型在訓(xùn)練和應(yīng)用過程中不可避免地會(huì)接觸到大量敏感信息,包括用戶的銀行賬戶信息、個(gè)人身份信息、交易數(shù)據(jù)或支付數(shù)據(jù)等,這使得大模型成為了潛在攻擊的目標(biāo)。攻擊者可能會(huì)通過輸入包含隱藏指令的問題或反饋等方式,利用大模型執(zhí)行信息非法獲取任務(wù)或泄露敏感信息。盡管目前的大模型通常能夠應(yīng)對明文攻擊,但是,當(dāng)攻擊者利用加密輸入文本進(jìn)行指令輸入時(shí),模型的安全防護(hù)機(jī)制仍有被繞過的風(fēng)險(xiǎn)。因此,如何提升大模型在處理敏感金融信息時(shí)的可靠性和安全性,進(jìn)而增強(qiáng)大模型的安全性,成為了亟待解決的問題。
技術(shù)實(shí)現(xiàn)思路
1、本申請實(shí)施例的主要目的在于提出一種基于大模型的文本處理方法和系統(tǒng)、電子設(shè)備、存儲(chǔ)介質(zhì),旨在增提升大模型在處理敏感金融信息時(shí)的可靠性和安全性,進(jìn)而增強(qiáng)大模型的安全性。
2、為實(shí)現(xiàn)上述目的,本申請實(shí)施例的第一方面提出了一種基于大模型的文本處理方法,所述方法包括:
3、獲取目標(biāo)對象的賬號信息;
4、根據(jù)所述賬號信息獲取大模型端輸出的原始文本;
5、通過預(yù)先訓(xùn)練的密文檢測模型對所述原始文本進(jìn)行密文檢測,得到密文檢測信息;其中,所述密文檢測信息包括密文指示信息,所述密文指示信息
6、根據(jù)所述密文指示信息向所述大模型端發(fā)送防御提示信息;
7、在所述大模型端,根據(jù)所述防御提示信息修改所述原始文本,得到目標(biāo)文本。
8、在一些實(shí)施例,所述通過預(yù)先訓(xùn)練的密文檢測模型對所述原始文本進(jìn)行密文檢測,得到密文檢測信息,包括:
9、對所述原始文本進(jìn)行特征提取,得到文本特征;
10、獲取所述文本特征的分布,得到文本分布信息;
11、基于所述賬號信息和所述文本分布信息生成所述密文指示信息。
12、在一些實(shí)施例,在根據(jù)所述密文指示信息向所述大模型端發(fā)送防御提示信息之后,所述方法還包括:
13、根據(jù)所述防御提示信息、所述賬號信息和所述原始文本構(gòu)建問題文件;其中,每一所述問題文件包括一個(gè)所述原始文本,每一所述問題文件具有時(shí)間戳;
14、根據(jù)所述時(shí)間戳和所述賬號信息計(jì)算所述問題文件的生成頻次,得到問題文件頻次;
15、基于所述問題文件頻次生成異常提示信息;
16、根據(jù)所述異常提示信息和所述問題文件頻次對所述問題文件進(jìn)行異常檢測,得到文件檢測信息;其中,所述文件檢測信息包括異常檢測信息,所述異常檢測信息表征所述問題文件中的原始文本為明文;
17、根據(jù)所述異常檢測信息和所述問題文件對所述密文檢測模型進(jìn)行微調(diào)。
18、在一些實(shí)施例,在通過預(yù)先訓(xùn)練的密文檢測模型對所述原始文本進(jìn)行密文檢測,得到密文檢測信息之前,所述方法還包括:
19、構(gòu)建基于神經(jīng)網(wǎng)絡(luò)模型的攻擊子模型和鑒別子模型;
20、從預(yù)設(shè)的數(shù)據(jù)集中獲取目標(biāo)明文文本;
21、通過所述攻擊子模型對所述目標(biāo)明文文本進(jìn)行加密,得到目標(biāo)加密文本;
22、根據(jù)所述目標(biāo)明文文本和所述目標(biāo)加密文本對所述鑒別子模型進(jìn)行預(yù)訓(xùn)練,得到所述密文檢測模型。
23、在一些實(shí)施例,所述通過所述攻擊子模型對所述目標(biāo)明文文本進(jìn)行加密,得到目標(biāo)加密文本,包括:
24、對所述目標(biāo)明文文本進(jìn)行加密,得到中間加密文本;
25、根據(jù)所述中間加密文本和至少兩個(gè)預(yù)設(shè)的密文映射表進(jìn)行加密權(quán)重計(jì)算,得到每一所述密文映射表的加密權(quán)重;
26、從全部所述加密權(quán)重中選取最大權(quán)重;
27、選取具有所述最大權(quán)重的所述密文映射表中選取目標(biāo)映射表;
28、根據(jù)所述目標(biāo)映射表對所述中間加密文本進(jìn)行加密,得到所述目標(biāo)加密文本。
29、在一些實(shí)施例,所述在所述大模型端,根據(jù)所述防御提示信息修改所述原始文本,得到目標(biāo)文本,包括:
30、根據(jù)所述防御提示信息獲取所述文本分布信息;
31、確定所述文本分布信息所在的區(qū)間,得到目標(biāo)分布區(qū)間;
32、獲取所述目標(biāo)分布區(qū)間的文本修改模板,得到目標(biāo)修改模板;
33、根據(jù)所述目標(biāo)修改模板對所述原始文本進(jìn)行修改,得到所述目標(biāo)文本。
34、在一些實(shí)施例,所述在所述大模型端,根據(jù)所述防御提示信息修改所述原始文本,得到目標(biāo)文本之后,所述方法還包括:
35、向密文檢測端發(fā)送異常提示查詢請求,在所述密文檢測端,根據(jù)所述異常提示查詢請求生成異常提示查詢信息;
36、在所述異常提示查詢信息包含所述異常提示信息的情況下,根據(jù)所述異常提示信息生成異常提示文本;
37、根據(jù)所述異常提示文本對所述目標(biāo)文本進(jìn)行更新。
38、為實(shí)現(xiàn)上述目的,本申請實(shí)施例的第二方面提出了一種基于大模型的文本處理系統(tǒng),所述系統(tǒng)包括:
39、賬號獲取模塊,用于獲取目標(biāo)對象的賬號信息;
40、文本獲取模塊,用于根據(jù)所述賬號信息獲取大模型端輸出的原始文本;
41、密文檢測模塊,用于通過預(yù)先訓(xùn)練的密文檢測模型對所述原始文本進(jìn)行密文檢測,得到密文檢測信息;其中,所述密文檢測信息包括密文指示信息,所述密文指示信息表征所述原始文本為密文;
42、信息反饋模塊,用于根據(jù)所述密文指示信息向所述大模型端發(fā)送防御提示信息;
43、文本修改模塊,用于在所述大模型端,根據(jù)所述防御提示信息修改所述原始文本,得到目標(biāo)文本。
44、為實(shí)現(xiàn)上述目的,本申請實(shí)施例的第三方面提出了一種電子設(shè)備,所述電子設(shè)備包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述第一方面所述的方法。
45、為實(shí)現(xiàn)上述目的,本申請實(shí)施例的第四方面提出了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述第一方面所述的方法。
46、本申請?zhí)岢龅囊环N基于大模型的文本處理方法和系統(tǒng)、電子設(shè)備、存儲(chǔ)介質(zhì),其首先獲取目標(biāo)對象的賬號信息,并根據(jù)賬號信息獲取大模型端輸出的原始文本,然后通過預(yù)先訓(xùn)練的密文檢測模型對原始文本進(jìn)行密文檢測,得到密文檢測信息;其中,密文檢測信息包括密文指示信息,密文指示信息表征原始文本為密文。最后,根據(jù)密文指示信息向大模型端發(fā)送防御提示信息,并在大模型端,根據(jù)防御提示信息修改原始文本,得到目標(biāo)文本。因此,本申請實(shí)施例所示意的基于大模型的文本處理方法,通過對大模型端的輸出文本進(jìn)行密文檢測,并根據(jù)密文檢測信息對輸出文本進(jìn)行修改,有效防止了敏感金融信息的泄露,提升了大模型在處理敏感金融信息時(shí)的可靠性和安全性,進(jìn)而防范和應(yīng)對針對大模型的密文攻擊本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.基于大模型的文本處理方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過預(yù)先訓(xùn)練的密文檢測模型對所述原始文本進(jìn)行密文檢測,得到密文檢測信息,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,在根據(jù)所述密文指示信息向所述大模型端發(fā)送防御提示信息之后,所述方法還包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,在通過預(yù)先訓(xùn)練的密文檢測模型對所述原始文本進(jìn)行密文檢測,得到密文檢測信息之前,所述方法還包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述通過所述攻擊子模型對所述目標(biāo)明文文本進(jìn)行加密,得到目標(biāo)加密文本,包括:
6.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述在所述大模型端,根據(jù)所述防御提示信息修改所述原始文本,得到目標(biāo)文本,包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述在所述大模型端,根據(jù)所述防御提示信息修改所述原始文本,得到目標(biāo)文本之后,所述方法還包括:
8.基于大模型的文本處理系統(tǒng),其特征在于,所述系統(tǒng)包括:
9.電子設(shè)備,其特征在于
10.計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至7中任一項(xiàng)所述的基于大模型的文本處理方法。
...【技術(shù)特征摘要】
1.基于大模型的文本處理方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過預(yù)先訓(xùn)練的密文檢測模型對所述原始文本進(jìn)行密文檢測,得到密文檢測信息,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,在根據(jù)所述密文指示信息向所述大模型端發(fā)送防御提示信息之后,所述方法還包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,在通過預(yù)先訓(xùn)練的密文檢測模型對所述原始文本進(jìn)行密文檢測,得到密文檢測信息之前,所述方法還包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述通過所述攻擊子模型對所述目標(biāo)明文文本進(jìn)行加密,得到目標(biāo)加密文本,包括:
6.根據(jù)權(quán)利要求2所述的方法,其特征在于,...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:亢祖衡,彭俊清,王健宗,
申請(專利權(quán))人:平安科技深圳有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會(huì)獲得科技券。