System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及違規內容檢測,特別是涉及一種大模型違規內容檢測方法。
技術介紹
1、目前,隨著生成式大語言模型規模的不斷擴大和應用場景的多樣化,隨之而來的問題也日益凸顯。例如,大語言模型在生成內容時,可能會生成具有違規性質的文本;這類違規內容不僅對用戶體驗和平臺信譽構成威脅,更可能引發法律和監管風險,如何對大語言模型生成的內容進行有效的違規檢測,成為了當前
中的挑戰。
2、然而,現有的違規內容檢測方法仍然存在諸多不足;傳統的違規檢測手段大多依賴于關鍵詞過濾、規則匹配和簡單的分類器,這些方法雖然在處理某些特定類型的違規內容時能夠起到一定的作用,但面對復雜多樣的語言表達、隱晦的違規意圖以及模型生成的上下文依賴性時,效果明顯不足。因此,需要一種更為精準和高效的違規內容檢測技術,以應對復雜的文本生成任務。
技術實現思路
1、基于此,有必要提供一種大模型違規內容檢測方法,該方法包括:
2、s1:將用戶的內容生成請求輸入至transformer模型,transformer模型的各層分別輸出一個潛在特征序列,其中,當前層的輸入是前一層輸出的潛在特征序列;
3、s2:使用優化后的時空序列判別模型分別分析各層輸出的潛在特征序列的違規概率;
4、s3:將各層輸出的潛在特征序列的違規概率輸入至訓練好的次級學習器,輸出最終的違規概率。
5、有益效果:該方法利用深度學習技術,通過大模型潛在特征提取與違規概率估計,并基于集成學習的違規內容檢測,實現了
本文檔來自技高網...【技術保護點】
1.一種大模型違規內容檢測方法,其特征在于,包括:
2.根據權利要求1所述的大模型違規內容檢測方法,其特征在于,Transformer模型第n層的處理方式為:
3.根據權利要求1所述的大模型違規內容檢測方法,其特征在于,還包括:
4.根據權利要求3所述的大模型違規內容檢測方法,其特征在于,所述基于標注后的各第二潛在特征序列優化時空序列判別模型包括:
5.根據權利要求1所述的大模型違規內容檢測方法,其特征在于,使用優化后的時空序列判別模型分析第n層輸出的潛在特征序列的違規概率的過程包括:
6.根據權利要求5所述的大模型違規內容檢測方法,其特征在于,計算第n層輸出的潛在特征序列對應的空間維度的多頭注意力包括:
7.根據權利要求6所述的大模型違規內容檢測方法,其特征在于,計算第n層輸出的潛在特征序列對應的時間維度的多頭注意力,計算公式為:
8.根據權利要求7所述的大模型違規內容檢測方法,其特征在于,得到壓縮后的特征表示的過程包括:
9.根據權利要求4所述的大模型違規內容檢測方法,其特征在于,
10.根據權利要求1所述的大模型違規內容檢測方法,其特征在于,訓練好的次級學習器的預測過程包括:
...【技術特征摘要】
1.一種大模型違規內容檢測方法,其特征在于,包括:
2.根據權利要求1所述的大模型違規內容檢測方法,其特征在于,transformer模型第n層的處理方式為:
3.根據權利要求1所述的大模型違規內容檢測方法,其特征在于,還包括:
4.根據權利要求3所述的大模型違規內容檢測方法,其特征在于,所述基于標注后的各第二潛在特征序列優化時空序列判別模型包括:
5.根據權利要求1所述的大模型違規內容檢測方法,其特征在于,使用優化后的時空序列判別模型分析第n層輸出的潛在特征序列的違規概率的過程包括:
6.根據權利要...
【專利技術屬性】
技術研發人員:胡為民,袁吉,薛嵩,鄭喜,謝麗慧,
申請(專利權)人:深圳市迪博企業風險管理技術有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。