System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及內(nèi)容安全偵測(cè),具體涉及一種基于廣播電視技術(shù)實(shí)現(xiàn)全媒體內(nèi)容安全偵測(cè)系統(tǒng)。
技術(shù)介紹
1、全媒體內(nèi)容安全偵測(cè)主要涉及利用先進(jìn)的信息技術(shù)手段對(duì)廣播電視及新媒體內(nèi)容進(jìn)行全方位、多層次的安全監(jiān)測(cè)與管理;其主要包括圖片審核、視頻審核、文本審核、實(shí)時(shí)監(jiān)測(cè)、安全防護(hù)和數(shù)據(jù)分析等方面。
2、在現(xiàn)有技術(shù)中,對(duì)媒體文件內(nèi)的文本內(nèi)容進(jìn)行內(nèi)容安全偵測(cè)時(shí),主要依賴于預(yù)設(shè)違規(guī)關(guān)鍵詞的方法。這種方法通過檢索文本內(nèi)容是否存在這些違規(guī)關(guān)鍵詞,并對(duì)檢索到的違規(guī)關(guān)鍵詞進(jìn)行屏蔽等操作,以達(dá)到維護(hù)內(nèi)容安全的目的。然而,隨著觀眾或用戶的思維跳躍和創(chuàng)造力的提升,逐漸有觀眾或用戶能夠巧妙地避開這些預(yù)設(shè)的違規(guī)關(guān)鍵詞的檢索。他們會(huì)采用同音字、諧音、拼音縮寫、拆字、形近字等方式來替換原有的違規(guī)關(guān)鍵詞,從而規(guī)避系統(tǒng)的檢測(cè)。此外,網(wǎng)絡(luò)流行詞的變化速度非常快,新的網(wǎng)絡(luò)用語和表達(dá)方式不斷涌現(xiàn)。單純依賴預(yù)設(shè)的違規(guī)關(guān)鍵詞列表無法及時(shí)跟上這種變化,導(dǎo)致最新的違規(guī)關(guān)鍵詞往往難以被及時(shí)檢索到。
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)的目的在于提供一種基于廣播電視技術(shù)實(shí)現(xiàn)全媒體內(nèi)容安全偵測(cè)系統(tǒng),解決以上技術(shù)問題。
2、本專利技術(shù)的目的可以通過以下技術(shù)方案實(shí)現(xiàn):
3、一種基于廣播電視技術(shù)實(shí)現(xiàn)全媒體內(nèi)容安全偵測(cè)系統(tǒng),包括:
4、模型建立模塊:設(shè)定若干情感極性標(biāo)簽,獲取歷史媒體文件,并提取所述歷史媒體文件內(nèi)的文本內(nèi)容,記為歷史文本,標(biāo)注各歷史文本的情感極性標(biāo)簽,得到樣本數(shù)據(jù);建立卷積神經(jīng)網(wǎng)絡(luò)模型,根據(jù)所述樣本數(shù)
5、初始模塊:預(yù)設(shè)若干初始關(guān)鍵詞,獲取所述初始關(guān)鍵詞所處的歷史文本,記為原始文本;通過所述情感標(biāo)簽分析模型,得到所述原始文本的情感極性標(biāo)簽,記為原始情感標(biāo)簽;
6、關(guān)鍵詞分析模塊:設(shè)定分析周期;實(shí)時(shí)獲取分析周期內(nèi)的全部媒體文件,并提取所述媒體文件內(nèi)的文本內(nèi)容,記為媒體文本;選取出情感極性標(biāo)簽為所述原始情感標(biāo)簽的媒體文本,記為類語境文本;獲取所述類語境文本內(nèi)的全部詞匯,并獲取全部詞匯中初始關(guān)鍵詞的出現(xiàn)次數(shù)占比;將全部詞匯中除所述初始關(guān)鍵詞以外的詞匯記為其余詞匯,獲取各其余詞匯的出現(xiàn)次數(shù)占比,記為其余次數(shù)占比;
7、根據(jù)各分析周期內(nèi)的出現(xiàn)次數(shù)占比,擬合得到關(guān)鍵詞數(shù)量曲線,并根據(jù)各分析周期內(nèi)各其余詞匯的其余次數(shù)占比,得到各其余詞匯的其余數(shù)量曲線;若所述關(guān)鍵詞數(shù)量曲線g(t)的,其中t為分析周期的編號(hào),ti表示第i個(gè)分析周期,則依次判斷所述關(guān)鍵詞數(shù)量曲線與各其余數(shù)量曲線是否滿足互補(bǔ)約束:,其中n為分析周期的個(gè)數(shù),tn表示第n個(gè)分析周期,q(t)為其余數(shù)量曲線,g′(ti)表示g(t)在t=ti處的導(dǎo)數(shù)值,q′(ti)表示q(t)在t=ti處的導(dǎo)數(shù)值,cv為預(yù)設(shè)的誤差閾值,k為預(yù)設(shè)的斜率誤差閾值;若所述關(guān)鍵詞數(shù)量曲線與其余數(shù)量曲線q(t)滿足所述互補(bǔ)約束,則將所述其余數(shù)量曲線q(t)對(duì)應(yīng)的其余詞匯記為所述初始關(guān)鍵詞的替代關(guān)鍵詞;
8、偵測(cè)模塊:根據(jù)所述初始關(guān)鍵詞和替代關(guān)鍵詞,對(duì)后續(xù)的媒體文本進(jìn)行內(nèi)容安全偵測(cè)。
9、作為本專利技術(shù)進(jìn)一步的方案:所述情感極性標(biāo)簽的設(shè)定包括正面、負(fù)面和中性。
10、作為本專利技術(shù)進(jìn)一步的方案:所述卷積神經(jīng)網(wǎng)絡(luò)模型的建立基于自然語言處理技術(shù)。
11、作為本專利技術(shù)進(jìn)一步的方案:所述分析周期的設(shè)定過程包括:
12、設(shè)定時(shí)間間隔閾值,以設(shè)定所述初始關(guān)鍵詞的時(shí)刻為初始時(shí)刻,從所述初始時(shí)刻開始,每隔一個(gè)時(shí)間間隔閾值得到一個(gè)時(shí)間節(jié)點(diǎn),由每相鄰的兩個(gè)時(shí)間節(jié)點(diǎn)構(gòu)成一個(gè)分析周期,所述分析周期的構(gòu)成包括所述初始時(shí)刻。
13、作為本專利技術(shù)進(jìn)一步的方案:所述出現(xiàn)次數(shù)占比的獲得過程包括:
14、獲取所述類語境文本中全部詞匯的總數(shù)m,并獲取全部詞匯中所述初始關(guān)鍵詞的出現(xiàn)次數(shù)m,則得到所述出現(xiàn)次數(shù)占比p=m/m。
15、作為本專利技術(shù)進(jìn)一步的方案:所述關(guān)鍵詞數(shù)量曲線的擬合過程包括:
16、對(duì)各分析周期進(jìn)行編號(hào),獲取各編號(hào)的分析周期下的出現(xiàn)次數(shù)占比;以編號(hào)為橫坐標(biāo),以所述出現(xiàn)次數(shù)占比為縱坐標(biāo),建立坐標(biāo)系;根據(jù)各編號(hào)的分析周期及其對(duì)應(yīng)的出現(xiàn)次數(shù)占比,在所述坐標(biāo)系中獲得若干坐標(biāo)點(diǎn);以平滑的曲線連接各坐標(biāo)點(diǎn),將所述曲線記為關(guān)鍵詞數(shù)量曲線。
17、作為本專利技術(shù)進(jìn)一步的方案:獲取所述類語境文本內(nèi)的全部詞匯時(shí),過濾所述類語境文本內(nèi)的停用詞,所述停用詞包括“的”“我”。
18、作為本專利技術(shù)進(jìn)一步的方案:根據(jù)所述初始關(guān)鍵詞和替代關(guān)鍵詞,對(duì)后續(xù)的媒體文本進(jìn)行內(nèi)容安全偵測(cè)的過程包括:
19、對(duì)所述媒體文本內(nèi)的詞匯進(jìn)行檢索,若檢索到所述初始關(guān)鍵詞或替代關(guān)鍵詞,則提示媒體文本的內(nèi)容存在異常。
20、本專利技術(shù)的有益效果:
21、本專利技術(shù)通過設(shè)定情感極性標(biāo)簽并利用卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)歷史文本進(jìn)行訓(xùn)練,系統(tǒng)能夠?qū)W習(xí)并識(shí)別不同情感極性的文本。這種基于深度學(xué)習(xí)的方法比傳統(tǒng)的基于規(guī)則或統(tǒng)計(jì)的方法更加準(zhǔn)確和靈活,因?yàn)樗軌虿蹲降轿谋局械膹?fù)雜結(jié)構(gòu)和模式。通過設(shè)定分析周期可以實(shí)時(shí)獲取并分析每個(gè)周期內(nèi)的媒體文件。這種實(shí)時(shí)性使得系統(tǒng)能夠快速響應(yīng)新出現(xiàn)的內(nèi)容,及時(shí)進(jìn)行安全偵測(cè)。同時(shí),通過不斷更新和優(yōu)化關(guān)鍵詞庫(kù)(包括初始關(guān)鍵詞和替代關(guān)鍵詞),能夠適應(yīng)媒體內(nèi)容的動(dòng)態(tài)變化,保持高準(zhǔn)確性。并通過分析類語境文本中的全部詞匯及其出現(xiàn)次數(shù)占比,來發(fā)現(xiàn)可能的替代關(guān)鍵詞。這種方法確保了對(duì)媒體內(nèi)容的全面覆蓋和細(xì)致分析,減少了遺漏重要信息的風(fēng)險(xiǎn)。根據(jù)當(dāng)前的網(wǎng)絡(luò)用語情況設(shè)定若干初始關(guān)鍵詞,隨后采集各分析周期內(nèi)初始關(guān)鍵詞的出現(xiàn)次數(shù)占比,若初始關(guān)鍵詞的出現(xiàn)次數(shù)占比開始減少,則分析各分析周期內(nèi)是否存在其余詞匯的其余次數(shù)占比變多,若滿足互補(bǔ)約束,則表明該其余詞匯逐漸取代了初始關(guān)鍵詞,成為新晉的關(guān)鍵詞。使得對(duì)媒體文件的文本內(nèi)容進(jìn)行安全偵測(cè)時(shí),關(guān)鍵詞的設(shè)定跟隨網(wǎng)絡(luò)用詞的最新變化。
本文檔來自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種基于廣播電視技術(shù)實(shí)現(xiàn)全媒體內(nèi)容安全偵測(cè)系統(tǒng),其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的一種基于廣播電視技術(shù)實(shí)現(xiàn)全媒體內(nèi)容安全偵測(cè)系統(tǒng),其特征在于,所述情感極性標(biāo)簽的設(shè)定包括正面、負(fù)面和中性。
3.根據(jù)權(quán)利要求1所述的一種基于廣播電視技術(shù)實(shí)現(xiàn)全媒體內(nèi)容安全偵測(cè)系統(tǒng),其特征在于,所述卷積神經(jīng)網(wǎng)絡(luò)模型的建立基于自然語言處理技術(shù)。
4.根據(jù)權(quán)利要求1所述的一種基于廣播電視技術(shù)實(shí)現(xiàn)全媒體內(nèi)容安全偵測(cè)系統(tǒng),其特征在于,所述分析周期的設(shè)定過程包括:
5.根據(jù)權(quán)利要求1所述的一種基于廣播電視技術(shù)實(shí)現(xiàn)全媒體內(nèi)容安全偵測(cè)系統(tǒng),其特征在于,所述出現(xiàn)次數(shù)占比的獲得過程包括:
6.根據(jù)權(quán)利要求1所述的一種基于廣播電視技術(shù)實(shí)現(xiàn)全媒體內(nèi)容安全偵測(cè)系統(tǒng),其特征在于,所述關(guān)鍵詞數(shù)量曲線的擬合過程包括:
7.根據(jù)權(quán)利要求1所述的一種基于廣播電視技術(shù)實(shí)現(xiàn)全媒體內(nèi)容安全偵測(cè)系統(tǒng),其特征在于,獲取所述類語境文本內(nèi)的全部詞匯時(shí),過濾所述類語境文本內(nèi)的停用詞,所述停用詞包括“的”“我”。
8.根據(jù)權(quán)利要求1所述的一種基于廣播電視技術(shù)
...【技術(shù)特征摘要】
1.一種基于廣播電視技術(shù)實(shí)現(xiàn)全媒體內(nèi)容安全偵測(cè)系統(tǒng),其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的一種基于廣播電視技術(shù)實(shí)現(xiàn)全媒體內(nèi)容安全偵測(cè)系統(tǒng),其特征在于,所述情感極性標(biāo)簽的設(shè)定包括正面、負(fù)面和中性。
3.根據(jù)權(quán)利要求1所述的一種基于廣播電視技術(shù)實(shí)現(xiàn)全媒體內(nèi)容安全偵測(cè)系統(tǒng),其特征在于,所述卷積神經(jīng)網(wǎng)絡(luò)模型的建立基于自然語言處理技術(shù)。
4.根據(jù)權(quán)利要求1所述的一種基于廣播電視技術(shù)實(shí)現(xiàn)全媒體內(nèi)容安全偵測(cè)系統(tǒng),其特征在于,所述分析周期的設(shè)定過程包括:
5.根據(jù)權(quán)利要求1所述的一種基于廣播電視技術(shù)實(shí)現(xiàn)全媒體內(nèi)容...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:董永,臧文,
申請(qǐng)(專利權(quán))人:山東科視文化產(chǎn)業(yè)有限公司,
類型:發(fā)明
國(guó)別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。