System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本申請(qǐng)涉及自然語(yǔ)言處理,尤其是一種竊取攻擊行為檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
技術(shù)介紹
1、大語(yǔ)言模型是在巨大數(shù)據(jù)集上訓(xùn)練以理解人類語(yǔ)言的深度學(xué)習(xí)模型,然而,當(dāng)惡意用戶通過(guò)反復(fù)與模型互動(dòng)、提出不同的問(wèn)題,可以逐漸推測(cè)出模型的結(jié)構(gòu)和功能,從而獲取模型的核心知識(shí)產(chǎn)權(quán)。這種竊取攻擊行為不僅威脅到企業(yè)的技術(shù)機(jī)密,也可能導(dǎo)致知識(shí)產(chǎn)權(quán)泄露,甚至是重大經(jīng)濟(jì)損失。
2、相關(guān)技術(shù)中,針對(duì)大語(yǔ)言模型的防御機(jī)制主要集中在傳統(tǒng)的訪問(wèn)控制和加密技術(shù)上。然而,惡意用戶可以通過(guò)模擬普通用戶的對(duì)話行為,不斷向模型提問(wèn),利用模型對(duì)話生成的特點(diǎn)獲取信息并推測(cè)出模型的內(nèi)部機(jī)制,例如通過(guò)日常模板對(duì)話偽裝以逃避傳統(tǒng)檢測(cè)機(jī)制的監(jiān)控,極大影響大語(yǔ)言模型安全性。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)的目的是提供一種竊取攻擊行為檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),可以根據(jù)對(duì)話內(nèi)容的主題和邏輯檢測(cè)竊取攻擊行為,增強(qiáng)大語(yǔ)言模型安全性。
2、本申請(qǐng)實(shí)施例提供一種竊取攻擊行為檢測(cè)方法,包括:
3、獲取用戶與大語(yǔ)言模型之間的歷史對(duì)話數(shù)據(jù);所述歷史對(duì)話數(shù)據(jù)包含多輪對(duì)話內(nèi)容數(shù)據(jù);
4、對(duì)所述對(duì)話內(nèi)容數(shù)據(jù)進(jìn)行主題相關(guān)性似然估計(jì),得到表征所述對(duì)話內(nèi)容數(shù)據(jù)之間的主題相關(guān)強(qiáng)度的主題似然估計(jì)結(jié)果;
5、對(duì)所述對(duì)話內(nèi)容數(shù)據(jù)進(jìn)行邏輯連續(xù)性似然估計(jì),得到表征所述對(duì)話內(nèi)容數(shù)據(jù)之間的邏輯連續(xù)強(qiáng)度的邏輯似然估計(jì)結(jié)果;
6、對(duì)所述主題似然估計(jì)結(jié)果和所述邏輯似然估計(jì)結(jié)果進(jìn)行聯(lián)合估計(jì),得到表征所述對(duì)話內(nèi)容數(shù)據(jù)之間的
7、對(duì)所述聯(lián)合估計(jì)結(jié)果進(jìn)行分析,以檢測(cè)竊取攻擊行為。
8、在一些實(shí)施例中,所述竊取攻擊行為檢測(cè)方法,還包括:
9、采用滑動(dòng)窗口方法,對(duì)所述歷史對(duì)話數(shù)據(jù)進(jìn)行更新,以在歷史對(duì)話數(shù)據(jù)中增加最新的對(duì)話數(shù)據(jù)以及剔除部分最早的對(duì)話數(shù)據(jù)。
10、在一些實(shí)施例中,所述對(duì)所述對(duì)話內(nèi)容數(shù)據(jù)進(jìn)行主題相關(guān)性似然估計(jì),得到表征所述對(duì)話內(nèi)容數(shù)據(jù)之間的主題相關(guān)強(qiáng)度的主題似然估計(jì)結(jié)果,包括:
11、拼接所述歷史對(duì)話數(shù)據(jù)和預(yù)設(shè)的第一提示詞,得到第一拼接數(shù)據(jù);
12、將所述第一拼接數(shù)據(jù)輸入所述大語(yǔ)言模型,以對(duì)所述對(duì)話內(nèi)容數(shù)據(jù)進(jìn)行主題相關(guān)性似然估計(jì),得到所述大語(yǔ)言模型的主題似然估計(jì)概率分布;
13、根據(jù)所述主題似然估計(jì)概率分布,計(jì)算各所述對(duì)話內(nèi)容數(shù)據(jù)之間的主題相關(guān)強(qiáng)度小于預(yù)設(shè)的主題相關(guān)強(qiáng)度閾值的概率,得到所述主題似然估計(jì)結(jié)果。
14、在一些實(shí)施例中,所述對(duì)所述對(duì)話內(nèi)容數(shù)據(jù)進(jìn)行邏輯連續(xù)性似然估計(jì),得到表征所述對(duì)話內(nèi)容數(shù)據(jù)之間的邏輯連續(xù)強(qiáng)度的邏輯似然估計(jì)結(jié)果,包括:
15、拼接所述歷史對(duì)話數(shù)據(jù)和預(yù)設(shè)的第二提示詞,得到第二拼接數(shù)據(jù);
16、將所述第二拼接數(shù)據(jù)輸入所述大語(yǔ)言模型,以對(duì)所述對(duì)話內(nèi)容數(shù)據(jù)進(jìn)行邏輯連續(xù)性似然估計(jì),得到所述大語(yǔ)言模型的邏輯連續(xù)性估計(jì)概率分布;
17、根據(jù)所述邏輯連續(xù)性估計(jì)概率分布,各所述對(duì)話內(nèi)容數(shù)據(jù)之間的邏輯連續(xù)強(qiáng)度小于預(yù)設(shè)的邏輯連續(xù)強(qiáng)度閾值的概率,得到所述邏輯似然估計(jì)結(jié)果。
18、在一些實(shí)施例中,所述對(duì)所述主題似然估計(jì)結(jié)果和所述邏輯似然估計(jì)結(jié)果進(jìn)行聯(lián)合估計(jì),得到表征所述歷史對(duì)話數(shù)據(jù)之間的主題相關(guān)強(qiáng)度和邏輯連續(xù)強(qiáng)度的聯(lián)合估計(jì)結(jié)果,包括:
19、根據(jù)所述主題似然估計(jì)結(jié)果和所述邏輯似然估計(jì)結(jié)果,計(jì)算所述對(duì)話內(nèi)容數(shù)據(jù)之間的主題相關(guān)強(qiáng)度小于預(yù)設(shè)的主題相關(guān)強(qiáng)度閾值且各所述對(duì)話內(nèi)容數(shù)據(jù)之間的邏輯連續(xù)強(qiáng)度小于預(yù)設(shè)的邏輯連續(xù)強(qiáng)度閾值的概率,得到所述聯(lián)合估計(jì)結(jié)果。
20、在一些實(shí)施例中,所述對(duì)所述聯(lián)合估計(jì)結(jié)果進(jìn)行分析,以檢測(cè)竊取攻擊行為,包括:
21、根據(jù)所述聯(lián)合估計(jì)結(jié)果,判斷聯(lián)合估計(jì)概率是否超過(guò)預(yù)設(shè)的概率閾值;所述聯(lián)合估計(jì)概率為所述對(duì)話內(nèi)容數(shù)據(jù)之間的主題相關(guān)強(qiáng)度小于預(yù)設(shè)的主題相關(guān)強(qiáng)度閾值且各所述對(duì)話內(nèi)容數(shù)據(jù)之間的邏輯連續(xù)強(qiáng)度小于預(yù)設(shè)的邏輯連續(xù)強(qiáng)度閾值的概率;
22、若超過(guò),生成檢測(cè)到竊取攻擊行為的提示信息;
23、若未超過(guò),生成未檢測(cè)到竊取攻擊行為的提示信息。
24、在一些實(shí)施例中,所述對(duì)所述聯(lián)合估計(jì)結(jié)果進(jìn)行分析,以檢測(cè)竊取攻擊行為,還包括:
25、在預(yù)設(shè)時(shí)長(zhǎng)內(nèi),獲取多個(gè)不同時(shí)刻生成的提示信息;
26、在所述檢測(cè)到竊取攻擊行為的提示信息的數(shù)量超過(guò)預(yù)設(shè)的數(shù)量閾值時(shí),判定為存在攻擊行為。
27、本申請(qǐng)實(shí)施例還提供一種竊取攻擊行為檢測(cè)裝置,包括:
28、第一模塊,用于獲取用戶與大語(yǔ)言模型之間的歷史對(duì)話數(shù)據(jù);所述歷史對(duì)話數(shù)據(jù)包含多輪對(duì)話內(nèi)容數(shù)據(jù);
29、第二模塊,用于對(duì)所述對(duì)話內(nèi)容數(shù)據(jù)進(jìn)行主題相關(guān)性似然估計(jì),得到表征所述對(duì)話內(nèi)容數(shù)據(jù)之間的主題相關(guān)強(qiáng)度的主題似然估計(jì)結(jié)果;
30、第三模塊,用于對(duì)所述對(duì)話內(nèi)容數(shù)據(jù)進(jìn)行邏輯連續(xù)性似然估計(jì),得到表征所述對(duì)話內(nèi)容數(shù)據(jù)之間的邏輯連續(xù)強(qiáng)度的邏輯似然估計(jì)結(jié)果;
31、第四模塊,用于對(duì)所述主題似然估計(jì)結(jié)果和所述邏輯似然估計(jì)結(jié)果進(jìn)行聯(lián)合估計(jì),得到表征所述對(duì)話內(nèi)容數(shù)據(jù)之間的主題相關(guān)強(qiáng)度和邏輯連續(xù)強(qiáng)度的聯(lián)合估計(jì)結(jié)果;
32、第五模塊,用于對(duì)所述聯(lián)合估計(jì)結(jié)果進(jìn)行分析,以檢測(cè)竊取攻擊行為。
33、本申請(qǐng)實(shí)施例還提供一種電子設(shè)備,所述電子設(shè)備包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述的竊取攻擊行為檢測(cè)方法。
34、本申請(qǐng)實(shí)施例還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的竊取攻擊行為檢測(cè)方法。
35、本申請(qǐng)的有益效果:通過(guò)對(duì)用戶與大語(yǔ)言模型之間的歷史對(duì)話數(shù)據(jù)進(jìn)行主題相關(guān)性似然估計(jì)和邏輯連續(xù)性似然估計(jì),以得到表征對(duì)話內(nèi)容數(shù)據(jù)之間的主題相關(guān)強(qiáng)度的主題似然估計(jì)結(jié)果和表征對(duì)話內(nèi)容數(shù)據(jù)之間的邏輯連續(xù)強(qiáng)度的邏輯似然估計(jì)結(jié)果,并通過(guò)對(duì)主題似然估計(jì)結(jié)果和邏輯似然估計(jì)結(jié)果進(jìn)行聯(lián)合估計(jì),得到表征對(duì)話內(nèi)容數(shù)據(jù)之間的主題相關(guān)強(qiáng)度和邏輯連續(xù)強(qiáng)度的聯(lián)合估計(jì)結(jié)果,進(jìn)而根據(jù)聯(lián)合估計(jì)結(jié)果檢測(cè)竊取攻擊行為。由于是基于歷史對(duì)話數(shù)據(jù)中每輪對(duì)話內(nèi)容數(shù)據(jù)之間的主題似然估計(jì)結(jié)果和邏輯似然估計(jì)結(jié)果作為檢測(cè)竊取攻擊行為的基礎(chǔ),可以準(zhǔn)備甄別用戶的行為是否存在竊取攻擊惡意,增強(qiáng)大語(yǔ)言模型安全性。
本文檔來(lái)自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種竊取攻擊行為檢測(cè)方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的竊取攻擊行為檢測(cè)方法,其特征在于,所述竊取攻擊行為檢測(cè)方法,還包括:
3.根據(jù)權(quán)利要求1所述的竊取攻擊行為檢測(cè)方法,其特征在于,所述對(duì)所述對(duì)話內(nèi)容數(shù)據(jù)進(jìn)行主題相關(guān)性似然估計(jì),得到表征所述對(duì)話內(nèi)容數(shù)據(jù)之間的主題相關(guān)強(qiáng)度的主題似然估計(jì)結(jié)果,包括:
4.根據(jù)權(quán)利要求1所述的竊取攻擊行為檢測(cè)方法,其特征在于,所述對(duì)所述對(duì)話內(nèi)容數(shù)據(jù)進(jìn)行邏輯連續(xù)性似然估計(jì),得到表征所述對(duì)話內(nèi)容數(shù)據(jù)之間的邏輯連續(xù)強(qiáng)度的邏輯似然估計(jì)結(jié)果,包括:
5.根據(jù)權(quán)利要求1所述的竊取攻擊行為檢測(cè)方法,其特征在于,所述對(duì)所述主題似然估計(jì)結(jié)果和所述邏輯似然估計(jì)結(jié)果進(jìn)行聯(lián)合估計(jì),得到表征所述歷史對(duì)話數(shù)據(jù)之間的主題相關(guān)強(qiáng)度和邏輯連續(xù)強(qiáng)度的聯(lián)合估計(jì)結(jié)果,包括:
6.根據(jù)權(quán)利要求1所述的竊取攻擊行為檢測(cè)方法,其特征在于,所述對(duì)所述聯(lián)合估計(jì)結(jié)果進(jìn)行分析,以檢測(cè)竊取攻擊行為,包括:
7.根據(jù)權(quán)利要求6所述的竊取攻擊行為檢測(cè)方法,其特征在于,所述對(duì)所述聯(lián)合估計(jì)結(jié)果進(jìn)行分析,以檢測(cè)竊取攻擊行為,還
8.一種竊取攻擊行為檢測(cè)裝置,其特征在于,包括:
9.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)權(quán)利要求1至7任一項(xiàng)所述的竊取攻擊行為檢測(cè)方法。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至7中任一項(xiàng)所述的竊取攻擊行為檢測(cè)方法。
...【技術(shù)特征摘要】
1.一種竊取攻擊行為檢測(cè)方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的竊取攻擊行為檢測(cè)方法,其特征在于,所述竊取攻擊行為檢測(cè)方法,還包括:
3.根據(jù)權(quán)利要求1所述的竊取攻擊行為檢測(cè)方法,其特征在于,所述對(duì)所述對(duì)話內(nèi)容數(shù)據(jù)進(jìn)行主題相關(guān)性似然估計(jì),得到表征所述對(duì)話內(nèi)容數(shù)據(jù)之間的主題相關(guān)強(qiáng)度的主題似然估計(jì)結(jié)果,包括:
4.根據(jù)權(quán)利要求1所述的竊取攻擊行為檢測(cè)方法,其特征在于,所述對(duì)所述對(duì)話內(nèi)容數(shù)據(jù)進(jìn)行邏輯連續(xù)性似然估計(jì),得到表征所述對(duì)話內(nèi)容數(shù)據(jù)之間的邏輯連續(xù)強(qiáng)度的邏輯似然估計(jì)結(jié)果,包括:
5.根據(jù)權(quán)利要求1所述的竊取攻擊行為檢測(cè)方法,其特征在于,所述對(duì)所述主題似然估計(jì)結(jié)果和所述邏輯似然估計(jì)結(jié)果進(jìn)行聯(lián)合估計(jì),得到表征所述歷史對(duì)話數(shù)據(jù)之間的主題相關(guān)強(qiáng)度和邏輯連續(xù)強(qiáng)...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:胡為民,袁吉,陳海佳,鄭喜,謝麗慧,
申請(qǐng)(專利權(quán))人:深圳市迪博企業(yè)風(fēng)險(xiǎn)管理技術(shù)有限公司,
類型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。