當(dāng)前位置: 首頁(yè) > 專利查詢>深圳市迪博企業(yè)風(fēng)險(xiǎn)管理技術(shù)有限公司專利>正文

竊取攻擊行為檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)制造方法及圖紙

技術(shù)編號(hào)：44141476 閱讀：13 留言：0更新日期：2025-01-29 10:18

本申請(qǐng)涉及自然語(yǔ)言處理技術(shù)領(lǐng)域，公開(kāi)一種竊取攻擊行為檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。該方法包括：獲取用戶與大語(yǔ)言模型之間的歷史對(duì)話數(shù)據(jù)；對(duì)對(duì)話內(nèi)容數(shù)據(jù)進(jìn)行主題相關(guān)性似然估計(jì)，得到表征對(duì)話內(nèi)容數(shù)據(jù)之間的主題相關(guān)強(qiáng)度的主題似然估計(jì)結(jié)果；對(duì)對(duì)話內(nèi)容數(shù)據(jù)進(jìn)行邏輯連續(xù)性似然估計(jì)，得到表征對(duì)話內(nèi)容數(shù)據(jù)之間的邏輯連續(xù)強(qiáng)度的邏輯似然估計(jì)結(jié)果；對(duì)主題似然估計(jì)結(jié)果和邏輯似然估計(jì)結(jié)果進(jìn)行聯(lián)合估計(jì)，得到表征對(duì)話內(nèi)容數(shù)據(jù)之間的主題相關(guān)強(qiáng)度和邏輯連續(xù)強(qiáng)度的聯(lián)合估計(jì)結(jié)果；對(duì)聯(lián)合估計(jì)結(jié)果進(jìn)行分析，以檢測(cè)竊取攻擊行為。本申請(qǐng)實(shí)施例可以根據(jù)對(duì)話內(nèi)容的主題和邏輯檢測(cè)竊取攻擊行為，增強(qiáng)大語(yǔ)言模型安全性。

全部詳細(xì)技術(shù)資料下載

【技術(shù)實(shí)現(xiàn)步驟摘要】

本申請(qǐng)涉及自然語(yǔ)言處理，尤其是一種竊取攻擊行為檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。

技術(shù)介紹

1、大語(yǔ)言模型是在巨大數(shù)據(jù)集上訓(xùn)練以理解人類語(yǔ)言的深度學(xué)習(xí)模型，然而，當(dāng)惡意用戶通過(guò)反復(fù)與模型互動(dòng)、提出不同的問(wèn)題，可以逐漸推測(cè)出模型的結(jié)構(gòu)和功能，從而獲取模型的核心知識(shí)產(chǎn)權(quán)。這種竊取攻擊行為不僅威脅到企業(yè)的技術(shù)機(jī)密，也可能導(dǎo)致知識(shí)產(chǎn)權(quán)泄露，甚至是重大經(jīng)濟(jì)損失。

2、相關(guān)技術(shù)中，針對(duì)大語(yǔ)言模型的防御機(jī)制主要集中在傳統(tǒng)的訪問(wèn)控制和加密技術(shù)上。然而，惡意用戶可以通過(guò)模擬普通用戶的對(duì)話行為，不斷向模型提問(wèn)，利用模型對(duì)話生成的特點(diǎn)獲取信息并推測(cè)出模型的內(nèi)部機(jī)制，例如通過(guò)日常模板對(duì)話偽裝以逃避傳統(tǒng)檢測(cè)機(jī)制的監(jiān)控，極大影響大語(yǔ)言模型安全性。

技術(shù)實(shí)現(xiàn)思路

1、本申請(qǐng)的目的是提供一種竊取攻擊行為檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)，可以根據(jù)對(duì)話內(nèi)容的主題和邏輯檢測(cè)竊取攻擊行為，增強(qiáng)大語(yǔ)言模型安全性。

2、本申請(qǐng)實(shí)施例提供一種竊取攻擊行為檢測(cè)方法，包括：

3、獲取用戶與大語(yǔ)言模型之間的歷史對(duì)話數(shù)據(jù)；所述歷史對(duì)話數(shù)據(jù)包含多輪對(duì)話內(nèi)容數(shù)據(jù)；

4、對(duì)所述對(duì)話內(nèi)容數(shù)據(jù)進(jìn)行主題相關(guān)性似然估計(jì)，得到表征所述對(duì)話內(nèi)容數(shù)據(jù)之間的主題相關(guān)強(qiáng)度的主題似然估計(jì)結(jié)果；

5、對(duì)所述對(duì)話內(nèi)容數(shù)據(jù)進(jìn)行邏輯連續(xù)性似然估計(jì)，得到表征所述對(duì)話內(nèi)容數(shù)據(jù)之間的邏輯連續(xù)強(qiáng)度的邏輯似然估計(jì)結(jié)果；

6、對(duì)所述主題似然估計(jì)結(jié)果和所述邏輯似然估計(jì)結(jié)果進(jìn)行聯(lián)合估計(jì)，得到表征所述對(duì)話內(nèi)容數(shù)據(jù)之間的

7、對(duì)所述聯(lián)合估計(jì)結(jié)果進(jìn)行分析，以檢測(cè)竊取攻擊行為。

8、在一些實(shí)施例中，所述竊取攻擊行為檢測(cè)方法，還包括：

9、采用滑動(dòng)窗口方法，對(duì)所述歷史對(duì)話數(shù)據(jù)進(jìn)行更新，以在歷史對(duì)話數(shù)據(jù)中增加最新的對(duì)話數(shù)據(jù)以及剔除部分最早的對(duì)話數(shù)據(jù)。

10、在一些實(shí)施例中，所述對(duì)所述對(duì)話內(nèi)容數(shù)據(jù)進(jìn)行主題相關(guān)性似然估計(jì)，得到表征所述對(duì)話內(nèi)容數(shù)據(jù)之間的主題相關(guān)強(qiáng)度的主題似然估計(jì)結(jié)果，包括：

11、拼接所述歷史對(duì)話數(shù)據(jù)和預(yù)設(shè)的第一提示詞，得到第一拼接數(shù)據(jù)；

12、將所述第一拼接數(shù)據(jù)輸入所述大語(yǔ)言模型，以對(duì)所述對(duì)話內(nèi)容數(shù)據(jù)進(jìn)行主題相關(guān)性似然估計(jì)，得到所述大語(yǔ)言模型的主題似然估計(jì)概率分布；

13、根據(jù)所述主題似然估計(jì)概率分布，計(jì)算各所述對(duì)話內(nèi)容數(shù)據(jù)之間的主題相關(guān)強(qiáng)度小于預(yù)設(shè)的主題相關(guān)強(qiáng)度閾值的概率，得到所述主題似然估計(jì)結(jié)果。

14、在一些實(shí)施例中，所述對(duì)所述對(duì)話內(nèi)容數(shù)據(jù)進(jìn)行邏輯連續(xù)性似然估計(jì)，得到表征所述對(duì)話內(nèi)容數(shù)據(jù)之間的邏輯連續(xù)強(qiáng)度的邏輯似然估計(jì)結(jié)果，包括：

15、拼接所述歷史對(duì)話數(shù)據(jù)和預(yù)設(shè)的第二提示詞，得到第二拼接數(shù)據(jù)；

16、將所述第二拼接數(shù)據(jù)輸入所述大語(yǔ)言模型，以對(duì)所述對(duì)話內(nèi)容數(shù)據(jù)進(jìn)行邏輯連續(xù)性似然估計(jì)，得到所述大語(yǔ)言模型的邏輯連續(xù)性估計(jì)概率分布；

17、根據(jù)所述邏輯連續(xù)性估計(jì)概率分布，各所述對(duì)話內(nèi)容數(shù)據(jù)之間的邏輯連續(xù)強(qiáng)度小于預(yù)設(shè)的邏輯連續(xù)強(qiáng)度閾值的概率，得到所述邏輯似然估計(jì)結(jié)果。

18、在一些實(shí)施例中，所述對(duì)所述主題似然估計(jì)結(jié)果和所述邏輯似然估計(jì)結(jié)果進(jìn)行聯(lián)合估計(jì)，得到表征所述歷史對(duì)話數(shù)據(jù)之間的主題相關(guān)強(qiáng)度和邏輯連續(xù)強(qiáng)度的聯(lián)合估計(jì)結(jié)果，包括：

19、根據(jù)所述主題似然估計(jì)結(jié)果和所述邏輯似然估計(jì)結(jié)果，計(jì)算所述對(duì)話內(nèi)容數(shù)據(jù)之間的主題相關(guān)強(qiáng)度小于預(yù)設(shè)的主題相關(guān)強(qiáng)度閾值且各所述對(duì)話內(nèi)容數(shù)據(jù)之間的邏輯連續(xù)強(qiáng)度小于預(yù)設(shè)的邏輯連續(xù)強(qiáng)度閾值的概率，得到所述聯(lián)合估計(jì)結(jié)果。

20、在一些實(shí)施例中，所述對(duì)所述聯(lián)合估計(jì)結(jié)果進(jìn)行分析，以檢測(cè)竊取攻擊行為，包括：

21、根據(jù)所述聯(lián)合估計(jì)結(jié)果，判斷聯(lián)合估計(jì)概率是否超過(guò)預(yù)設(shè)的概率閾值；所述聯(lián)合估計(jì)概率為所述對(duì)話內(nèi)容數(shù)據(jù)之間的主題相關(guān)強(qiáng)度小于預(yù)設(shè)的主題相關(guān)強(qiáng)度閾值且各所述對(duì)話內(nèi)容數(shù)據(jù)之間的邏輯連續(xù)強(qiáng)度小于預(yù)設(shè)的邏輯連續(xù)強(qiáng)度閾值的概率；

22、若超過(guò)，生成檢測(cè)到竊取攻擊行為的提示信息；

23、若未超過(guò)，生成未檢測(cè)到竊取攻擊行為的提示信息。

24、在一些實(shí)施例中，所述對(duì)所述聯(lián)合估計(jì)結(jié)果進(jìn)行分析，以檢測(cè)竊取攻擊行為，還包括：

25、在預(yù)設(shè)時(shí)長(zhǎng)內(nèi)，獲取多個(gè)不同時(shí)刻生成的提示信息；

26、在所述檢測(cè)到竊取攻擊行為的提示信息的數(shù)量超過(guò)預(yù)設(shè)的數(shù)量閾值時(shí)，判定為存在攻擊行為。

27、本申請(qǐng)實(shí)施例還提供一種竊取攻擊行為檢測(cè)裝置，包括：

28、第一模塊，用于獲取用戶與大語(yǔ)言模型之間的歷史對(duì)話數(shù)據(jù)；所述歷史對(duì)話數(shù)據(jù)包含多輪對(duì)話內(nèi)容數(shù)據(jù)；

29、第二模塊，用于對(duì)所述對(duì)話內(nèi)容數(shù)據(jù)進(jìn)行主題相關(guān)性似然估計(jì)，得到表征所述對(duì)話內(nèi)容數(shù)據(jù)之間的主題相關(guān)強(qiáng)度的主題似然估計(jì)結(jié)果；

30、第三模塊，用于對(duì)所述對(duì)話內(nèi)容數(shù)據(jù)進(jìn)行邏輯連續(xù)性似然估計(jì)，得到表征所述對(duì)話內(nèi)容數(shù)據(jù)之間的邏輯連續(xù)強(qiáng)度的邏輯似然估計(jì)結(jié)果；

31、第四模塊，用于對(duì)所述主題似然估計(jì)結(jié)果和所述邏輯似然估計(jì)結(jié)果進(jìn)行聯(lián)合估計(jì)，得到表征所述對(duì)話內(nèi)容數(shù)據(jù)之間的主題相關(guān)強(qiáng)度和邏輯連續(xù)強(qiáng)度的聯(lián)合估計(jì)結(jié)果；

32、第五模塊，用于對(duì)所述聯(lián)合估計(jì)結(jié)果進(jìn)行分析，以檢測(cè)竊取攻擊行為。

33、本申請(qǐng)實(shí)施例還提供一種電子設(shè)備，所述電子設(shè)備包括存儲(chǔ)器和處理器，所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序，所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述的竊取攻擊行為檢測(cè)方法。

34、本申請(qǐng)實(shí)施例還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序，其特征在于，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的竊取攻擊行為檢測(cè)方法。

35、本申請(qǐng)的有益效果：通過(guò)對(duì)用戶與大語(yǔ)言模型之間的歷史對(duì)話數(shù)據(jù)進(jìn)行主題相關(guān)性似然估計(jì)和邏輯連續(xù)性似然估計(jì)，以得到表征對(duì)話內(nèi)容數(shù)據(jù)之間的主題相關(guān)強(qiáng)度的主題似然估計(jì)結(jié)果和表征對(duì)話內(nèi)容數(shù)據(jù)之間的邏輯連續(xù)強(qiáng)度的邏輯似然估計(jì)結(jié)果，并通過(guò)對(duì)主題似然估計(jì)結(jié)果和邏輯似然估計(jì)結(jié)果進(jìn)行聯(lián)合估計(jì)，得到表征對(duì)話內(nèi)容數(shù)據(jù)之間的主題相關(guān)強(qiáng)度和邏輯連續(xù)強(qiáng)度的聯(lián)合估計(jì)結(jié)果，進(jìn)而根據(jù)聯(lián)合估計(jì)結(jié)果檢測(cè)竊取攻擊行為。由于是基于歷史對(duì)話數(shù)據(jù)中每輪對(duì)話內(nèi)容數(shù)據(jù)之間的主題似然估計(jì)結(jié)果和邏輯似然估計(jì)結(jié)果作為檢測(cè)竊取攻擊行為的基礎(chǔ)，可以準(zhǔn)備甄別用戶的行為是否存在竊取攻擊惡意，增強(qiáng)大語(yǔ)言模型安全性。

本文檔來(lái)自技高網(wǎng)...

【技術(shù)保護(hù)點(diǎn)】

1.一種竊取攻擊行為檢測(cè)方法，其特征在于，包括：

2.根據(jù)權(quán)利要求1所述的竊取攻擊行為檢測(cè)方法，其特征在于，所述竊取攻擊行為檢測(cè)方法，還包括：

3.根據(jù)權(quán)利要求1所述的竊取攻擊行為檢測(cè)方法，其特征在于，所述對(duì)所述對(duì)話內(nèi)容數(shù)據(jù)進(jìn)行主題相關(guān)性似然估計(jì)，得到表征所述對(duì)話內(nèi)容數(shù)據(jù)之間的主題相關(guān)強(qiáng)度的主題似然估計(jì)結(jié)果，包括：

4.根據(jù)權(quán)利要求1所述的竊取攻擊行為檢測(cè)方法，其特征在于，所述對(duì)所述對(duì)話內(nèi)容數(shù)據(jù)進(jìn)行邏輯連續(xù)性似然估計(jì)，得到表征所述對(duì)話內(nèi)容數(shù)據(jù)之間的邏輯連續(xù)強(qiáng)度的邏輯似然估計(jì)結(jié)果，包括：

5.根據(jù)權(quán)利要求1所述的竊取攻擊行為檢測(cè)方法，其特征在于，所述對(duì)所述主題似然估計(jì)結(jié)果和所述邏輯似然估計(jì)結(jié)果進(jìn)行聯(lián)合估計(jì)，得到表征所述歷史對(duì)話數(shù)據(jù)之間的主題相關(guān)強(qiáng)度和邏輯連續(xù)強(qiáng)度的聯(lián)合估計(jì)結(jié)果，包括：

6.根據(jù)權(quán)利要求1所述的竊取攻擊行為檢測(cè)方法，其特征在于，所述對(duì)所述聯(lián)合估計(jì)結(jié)果進(jìn)行分析，以檢測(cè)竊取攻擊行為，包括：

7.根據(jù)權(quán)利要求6所述的竊取攻擊行為檢測(cè)方法，其特征在于，所述對(duì)所述聯(lián)合估計(jì)結(jié)果進(jìn)行分析，以檢測(cè)竊取攻擊行為，還包括：

8.一種竊取攻擊行為檢測(cè)裝置，其特征在于，包括：

9.一種電子設(shè)備，其特征在于，所述電子設(shè)備包括存儲(chǔ)器和處理器，所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序，所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)權(quán)利要求1至7任一項(xiàng)所述的竊取攻擊行為檢測(cè)方法。

10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序，其特征在于，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至7中任一項(xiàng)所述的竊取攻擊行為檢測(cè)方法。

...

【技術(shù)特征摘要】

1.一種竊取攻擊行為檢測(cè)方法，其特征在于，包括：

2.根據(jù)權(quán)利要求1所述的竊取攻擊行為檢測(cè)方法，其特征在于，所述竊取攻擊行為檢測(cè)方法，還包括：

【專利技術(shù)屬性】
技術(shù)研發(fā)人員：胡為民，袁吉，陳海佳，鄭喜，謝麗慧，
申請(qǐng)(專利權(quán))人：深圳市迪博企業(yè)風(fēng)險(xiǎn)管理技術(shù)有限公司，
類型：發(fā)明
國(guó)別省市：

全部詳細(xì)技術(shù)資料下載我是這個(gè)專利的主人

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條評(píng)論

還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

發(fā)布您的意見(jiàn)

相關(guān)領(lǐng)域技術(shù)