本申請涉及計算機和數(shù)字醫(yī)療技術(shù)領域,公開了一種信息審核方法及裝置、存儲介質(zhì)、計算機設備,該方法包括:響應于待發(fā)布信息的發(fā)布審核指令,對待發(fā)布信息進行關(guān)鍵詞識別,在識別出的信息關(guān)鍵詞中獲取命中預設審核詞的待審核信息詞,并將剩余的信息關(guān)鍵詞作為信息特征詞,其中,預設審核詞包括違禁信息樣本對應的審核詞;基于審核詞信息庫獲取待審核信息詞對應的至少一個關(guān)聯(lián)詞以及關(guān)聯(lián)詞對應的預設違規(guī)概率;確定信息特征詞中命中關(guān)聯(lián)詞的目標特征詞,并獲取目標特征詞對應的目標違規(guī)概率;基于目標違規(guī)概率,確定待發(fā)布信息的發(fā)布審核結(jié)果,增加了信息特征詞審核待發(fā)布信息是否存在違規(guī)的方法,提高了對待發(fā)布信息發(fā)布審核的精準度。核的精準度。核的精準度。
【技術(shù)實現(xiàn)步驟摘要】
信息審核方法及裝置、存儲介質(zhì)、計算機設備
[0001]本申請涉及計算機以及數(shù)字醫(yī)療
,尤其是涉及到一種信息審核方法及裝置、存儲介質(zhì)、計算機設備。
技術(shù)介紹
[0002]隨著國家新廣告法的實施以及醫(yī)藥商品監(jiān)管政策的逐漸收緊,醫(yī)藥商品描述信息觸發(fā)廣告法違禁詞的行為也越來越多。商家在發(fā)布醫(yī)藥商品時,需要對待發(fā)布醫(yī)藥商品的描述信息進行合規(guī)性校驗,合規(guī)性校驗的規(guī)則一般是利用詞庫對醫(yī)藥商品的描述信息進行匹配,例如詞庫包括“第一”“最”等詞語,若醫(yī)藥商品的描述信息命中詞庫中的詞語,則該醫(yī)藥商品合規(guī)性效驗失敗。但是有很多詞語在大部分場景下不能使用,卻在特定場景下可以使用。例如,“專利”這個詞語,如果醫(yī)藥商品的描述信息中含有具體的專利號,那么可以使用,如果沒有專利號,那么不可以使用。再比如,對于醫(yī)療保健用品不可以出現(xiàn)諸如“排毒”、“保肝”以及“祛痘”等詞語,而對于醫(yī)用藥品則可以進行使用。所以,通過詞庫直接匹配醫(yī)藥商品的描述信息的方法不能很好的審核待發(fā)布醫(yī)藥商品的描述信息。
技術(shù)實現(xiàn)思路
[0003]有鑒于此,本申請?zhí)峁┝艘环N信息審核方法及裝置、存儲介質(zhì)、計算機設備,通過增加信息特征詞與待審核信息詞結(jié)合來審核待發(fā)布信息是否存在違規(guī)的方法,提高了對待發(fā)布信息發(fā)布審核的精準度。
[0004]根據(jù)本申請的一個方面,提供了一種信息審核方法,所述方法包括:
[0005]響應于待發(fā)布信息的發(fā)布審核指令,對所述待發(fā)布信息進行關(guān)鍵詞識別,在識別出的信息關(guān)鍵詞中獲取命中預設審核詞的待審核信息詞,并將剩余的信息關(guān)鍵詞作為信息特征詞,其中,所述預設審核詞包括違禁信息樣本對應的審核詞;
[0006]基于審核詞信息庫獲取所述待審核信息詞對應的至少一個關(guān)聯(lián)詞以及所述關(guān)聯(lián)詞對應的預設違規(guī)概率;
[0007]確定所述信息特征詞中命中所述關(guān)聯(lián)詞的目標特征詞,并獲取所述目標特征詞對應的目標違規(guī)概率;
[0008]基于所述目標違規(guī)概率,確定所述待發(fā)布信息的發(fā)布審核結(jié)果。
[0009]可選地,所述審核詞信息庫包括過審關(guān)聯(lián)詞及審拒關(guān)聯(lián)詞,所述基于所述目標違規(guī)概率,確定所述待發(fā)布信息的發(fā)布審核結(jié)果,包括:
[0010]將最大的目標違規(guī)概率確定為違規(guī)判決概率;
[0011]若所述違規(guī)判決概率大于預設閾值,且所述違規(guī)判決概率對應的關(guān)聯(lián)詞為過審關(guān)聯(lián)詞,則確定所述待發(fā)布信息通過發(fā)布審核;
[0012]若所述違規(guī)判決概率大于預設閾值,且所述違規(guī)判決概率對應的關(guān)聯(lián)詞為審拒關(guān)聯(lián)詞,則確定所述待發(fā)布信息不通過發(fā)布審核。
[0013]可選地,所述將最大的目標違規(guī)概率確定為違規(guī)判決概率之后,所述方法還包括:
[0014]若所述違規(guī)判決概率小于或等于預設閾值,則將所述待發(fā)布信息轉(zhuǎn)入人工審核,并依據(jù)人工審核結(jié)果確定所述待發(fā)布信息是否通過發(fā)布審核。
[0015]可選地,所述響應于待發(fā)布信息的發(fā)布審核指令,對所述待發(fā)布信息進行關(guān)鍵詞識別之后,所述方法還包括:
[0016]若識別出的信息關(guān)鍵詞命中預設違禁詞,則確定所述待發(fā)布信息不通過發(fā)布審核;
[0017]若識別出的信息關(guān)鍵詞未命中預設違禁詞,則執(zhí)行所述在識別出的信息關(guān)鍵詞中獲取命中預設審核詞的待審核信息詞。
[0018]可選地,所述審核詞信息庫的建立方法包括:
[0019]針對任一預設審核詞,獲取所述預設審核詞對應的過審樣本及審拒樣本;
[0020]基于所述過審樣本對應的過審描述信息,確定過審關(guān)聯(lián)詞及過審關(guān)聯(lián)詞違規(guī)概率,基于所述審拒樣本對應的審拒描述信息,確定審拒關(guān)聯(lián)詞及審拒關(guān)聯(lián)詞違規(guī)概率;
[0021]基于所述過審關(guān)聯(lián)詞、所述過審關(guān)聯(lián)詞違規(guī)概率、所述審拒關(guān)聯(lián)詞及所述審拒關(guān)聯(lián)詞違規(guī)概率,確定所述預設審核詞對應的發(fā)布審核信息,并建立包含所述預設審核詞以及所述發(fā)布審核信息的審核詞信息庫。
[0022]可選地,所述基于所述過審樣本對應的過審描述信息,確定過審關(guān)聯(lián)詞及過審關(guān)聯(lián)詞違規(guī)概率,基于所述審拒樣本對應的審拒描述信息,確定審拒關(guān)聯(lián)詞及審拒關(guān)聯(lián)詞違規(guī)概率,包括:
[0023]對所述過審樣本對應的過審描述信息進行分詞,獲得過審關(guān)聯(lián)詞,基于包含所述過審關(guān)聯(lián)詞的過審樣本數(shù)量占過審樣本總數(shù)量的百分比,確定過審關(guān)聯(lián)詞違規(guī)概率;
[0024]對所述審拒樣本對應的審拒描述信息進行分詞,獲得審拒關(guān)聯(lián)詞,基于包含所述審拒關(guān)聯(lián)詞的審拒樣本數(shù)量占審拒樣本總數(shù)量的百分比,確定審拒關(guān)聯(lián)詞違規(guī)概率。
[0025]可選地,所述基于所述過審關(guān)聯(lián)詞、所述過審關(guān)聯(lián)詞違規(guī)概率、所述審拒關(guān)聯(lián)詞及所述審拒關(guān)聯(lián)詞違規(guī)概率,確定所述預設審核詞對應的發(fā)布審核信息之前,所述方法還包括:
[0026]選取所述過審關(guān)聯(lián)詞中與所述審拒關(guān)聯(lián)詞中相同的關(guān)聯(lián)詞,確定為目標關(guān)聯(lián)詞,計算所述目標關(guān)聯(lián)詞對應的過審關(guān)聯(lián)詞違規(guī)概率與審拒關(guān)聯(lián)詞違規(guī)概率的概率差值后,將非零的概率差值確定為目標概率差值;
[0027]當所述目標概率差值為正數(shù)時,將所述目標關(guān)聯(lián)詞作為最終的過審關(guān)聯(lián)詞以及將所述目標概率差值作為最終的過審關(guān)聯(lián)詞的過審關(guān)聯(lián)詞違規(guī)概率;
[0028]當所述目標概率差值為負數(shù)時,將所述目標關(guān)聯(lián)詞作為最終的審拒關(guān)聯(lián)詞以及將所述目標概率差值的絕對值作為最終的審拒關(guān)聯(lián)詞的審拒關(guān)聯(lián)詞違規(guī)概率。
[0029]根據(jù)本申請的另一方面,提供了一種信息審核裝置,所述裝置包括:
[0030]審核詞獲取模塊,用于響應于待發(fā)布信息的發(fā)布審核指令,對所述待發(fā)布信息進行關(guān)鍵詞識別,在識別出的信息關(guān)鍵詞中獲取命中預設審核詞的待審核信息詞,并將剩余的信息關(guān)鍵詞作為信息特征詞,其中,所述預設審核詞包括違禁信息樣本對應的審核詞;
[0031]關(guān)聯(lián)詞獲取模塊,用于基于審核詞信息庫獲取所述待審核信息詞對應的至少一個關(guān)聯(lián)詞以及每個所述關(guān)聯(lián)詞對應的預設違規(guī)概率;
[0032]違規(guī)概率獲取模塊,用于確定所述信息特征詞中命中所述關(guān)聯(lián)詞的目標特征詞,
并獲取所述目標特征詞對應的目標違規(guī)概率;
[0033]審核結(jié)果確定模塊,用于基于所述目標違規(guī)概率,確定所述待發(fā)布信息的發(fā)布審核結(jié)果。
[0034]可選地,所述審核結(jié)果確定模塊,還用于:
[0035]將最大的目標違規(guī)概率確定為違規(guī)判決概率;
[0036]若所述違規(guī)判決概率大于預設閾值,且所述違規(guī)判決概率對應的關(guān)聯(lián)詞為過審關(guān)聯(lián)詞,則確定所述待發(fā)布信息通過發(fā)布審核;
[0037]若所述違規(guī)判決概率大于預設閾值,且所述違規(guī)判決概率對應的關(guān)聯(lián)詞為審拒關(guān)聯(lián)詞,則確定所述待發(fā)布信息不通過發(fā)布審核。
[0038]可選地,所述審核結(jié)果確定模塊,還用于:
[0039]若所述違規(guī)判決概率小于或等于預設閾值,則將所述待發(fā)布信息轉(zhuǎn)入人工審核,并依據(jù)人工審核結(jié)果確定所述待發(fā)布信息是否通過發(fā)布審核。
[0040]可選地,所述審核結(jié)果確定模塊,還用于:
[0041]若識別出的信息關(guān)鍵詞命中預設違禁詞,則確定所述待發(fā)布信息不通過發(fā)布審核。
[0042]可選地,所述本文檔來自技高網(wǎng)...
【技術(shù)保護點】
【技術(shù)特征摘要】
1.一種信息審核方法,其特征在于,所述方法包括:響應于待發(fā)布信息的發(fā)布審核指令,對所述待發(fā)布信息進行關(guān)鍵詞識別,在識別出的信息關(guān)鍵詞中獲取命中預設審核詞的待審核信息詞,并將剩余的信息關(guān)鍵詞作為信息特征詞,其中,所述預設審核詞包括違禁信息樣本對應的審核詞;基于審核詞信息庫獲取所述待審核信息詞對應的至少一個關(guān)聯(lián)詞以及所述關(guān)聯(lián)詞對應的預設違規(guī)概率;確定所述信息特征詞中命中所述關(guān)聯(lián)詞的目標特征詞,并獲取所述目標特征詞對應的目標違規(guī)概率;基于所述目標違規(guī)概率,確定所述待發(fā)布信息的發(fā)布審核結(jié)果。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述審核詞信息庫包括過審關(guān)聯(lián)詞及審拒關(guān)聯(lián)詞;所述基于所述目標違規(guī)概率,確定所述待發(fā)布信息的發(fā)布審核結(jié)果,包括:將最大的目標違規(guī)概率確定為違規(guī)判決概率;若所述違規(guī)判決概率大于預設閾值,且所述違規(guī)判決概率對應的關(guān)聯(lián)詞為過審關(guān)聯(lián)詞,則確定所述待發(fā)布信息通過發(fā)布審核;若所述違規(guī)判決概率大于預設閾值,且所述違規(guī)判決概率對應的關(guān)聯(lián)詞為審拒關(guān)聯(lián)詞,則確定所述待發(fā)布信息不通過發(fā)布審核。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述將最大的目標違規(guī)概率確定為違規(guī)判決概率之后,所述方法還包括:若所述違規(guī)判決概率小于或等于預設閾值,則將所述待發(fā)布信息轉(zhuǎn)入人工審核,并依據(jù)人工審核結(jié)果確定所述待發(fā)布信息是否通過發(fā)布審核。4.根據(jù)權(quán)利要求1至3中任一所述的方法,其特征在于,所述響應于待發(fā)布信息的發(fā)布審核指令,對所述待發(fā)布信息進行關(guān)鍵詞識別之后,所述方法還包括:若識別出的信息關(guān)鍵詞命中預設違禁詞,則確定所述待發(fā)布信息不通過發(fā)布審核;若識別出的信息關(guān)鍵詞未命中預設違禁詞,則執(zhí)行所述在識別出的信息關(guān)鍵詞中獲取命中預設審核詞的待審核信息詞。5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述審核詞信息庫的建立方法包括:針對任一預設審核詞,獲取所述預設審核詞對應的過審樣本及審拒樣本;基于所述過審樣本對應的過審描述信息,確定過審關(guān)聯(lián)詞及過審關(guān)聯(lián)詞違規(guī)概率,基于所述審拒樣本對應的審拒描述信息,確定審拒關(guān)聯(lián)詞及審拒關(guān)聯(lián)詞違規(guī)概率;基于所述過審關(guān)聯(lián)詞、所述過審關(guān)聯(lián)詞違規(guī)概率、所述審拒關(guān)聯(lián)詞及所述審拒關(guān)聯(lián)詞違規(guī)概率,確定所述預設審核詞對應的發(fā)布審核信息,并建立包含所述預設審核詞以及所述發(fā)布審核信息的審核詞信息庫。6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述基于所...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:劉鑫,
申請(專利權(quán))人:平安科技深圳有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。