本發(fā)明專利技術(shù)的實(shí)施方式提供了一種圖像處理方法、介質(zhì)、裝置和計(jì)算設(shè)備。該圖像處理方法包括:識別輸入的目標(biāo)圖像中需要翻譯的文字內(nèi)容及所述文字內(nèi)容所在的目標(biāo)區(qū)域;對所述文字內(nèi)容進(jìn)行翻譯,得到翻譯結(jié)果;將所述翻譯結(jié)果顯示在所述目標(biāo)區(qū)域內(nèi);將所述目標(biāo)圖像之后輸入的其它圖像與所述目標(biāo)圖像進(jìn)行對比;若所述其它圖像與所述目標(biāo)圖像之間的差異小于或等于預(yù)定值,則將所述翻譯結(jié)果顯示在所述其它圖像中與所述目標(biāo)區(qū)域?qū)?yīng)的區(qū)域內(nèi)。本發(fā)明專利技術(shù)實(shí)施例的技術(shù)方案避免了重復(fù)進(jìn)行識別及翻譯而導(dǎo)致增加處理器的負(fù)荷及降低實(shí)時翻譯的效率,有利于提升用戶的使用體驗(yàn)。
【技術(shù)實(shí)現(xiàn)步驟摘要】
圖像處理方法、介質(zhì)、裝置和計(jì)算設(shè)備
本專利技術(shù)的實(shí)施方式涉及通信及計(jì)算機(jī)
,更具體地,本專利技術(shù)的實(shí)施方式涉及圖像處理方法、介質(zhì)、裝置和計(jì)算設(shè)備。
技術(shù)介紹
本部分旨在為權(quán)利要求書中陳述的本專利技術(shù)的實(shí)施方式提供背景或上下文。此處的描述不因?yàn)榘ㄔ诒静糠种芯统姓J(rèn)是現(xiàn)有技術(shù)。目前,已有的增強(qiáng)現(xiàn)實(shí)翻譯方案是對輸入的視頻流中的每一幀圖像都進(jìn)行如下處理:采用OCR(OpticalCharacterRecognition,光學(xué)字符識別)技術(shù)按詞識別圖片中的文字,之后通過查詞得到翻譯結(jié)果,再把翻譯結(jié)果展示在圖像中的相應(yīng)位置。
技術(shù)實(shí)現(xiàn)思路
但是,由于現(xiàn)有的增強(qiáng)現(xiàn)實(shí)翻譯方案是按詞來識別并進(jìn)行翻譯的,未考慮段落內(nèi)及段落之間的語義信息,因此整段文字的翻譯結(jié)果沒有可讀性,翻譯質(zhì)量差。同時由于現(xiàn)有的增強(qiáng)現(xiàn)實(shí)翻譯方案需要對視頻流中的每一幀圖像進(jìn)行文字識別及翻譯處理,因此給處理器帶來了較大的處理負(fù)荷,導(dǎo)致實(shí)時翻譯效率低,有礙于用戶體驗(yàn)的提升。為此,非常需要一種改進(jìn)的圖像處理方案,一方面可以提高圖像中文字內(nèi)容的翻譯質(zhì)量,另一方面避免了重復(fù)進(jìn)行文字識別及翻譯而導(dǎo)致增加處理器的負(fù)荷及降低實(shí)時翻譯的效率,有利于提升用戶的使用體驗(yàn)。在本上下文中,本專利技術(shù)的實(shí)施方式期望提供一種圖像處理方法、介質(zhì)、裝置和計(jì)算設(shè)備。在本專利技術(shù)實(shí)施方式的第一方面中,提供了一種圖像處理方法,包括:識別輸入的目標(biāo)圖像中需要翻譯的文字內(nèi)容及所述文字內(nèi)容所在的目標(biāo)區(qū)域;對所述文字內(nèi)容進(jìn)行翻譯,得到翻譯結(jié)果;將所述翻譯結(jié)果顯示在所述目標(biāo)區(qū)域內(nèi);將所述目標(biāo)圖像之后輸入的其它圖像與所述目標(biāo)圖像進(jìn)行對比;若所述其它圖像與所述目標(biāo)圖像之間的差異小于或等于預(yù)定值,則將所述翻譯結(jié)果顯示在所述其它圖像中與所述目標(biāo)區(qū)域?qū)?yīng)的區(qū)域內(nèi)。在本專利技術(shù)的一些實(shí)施方式中,基于前述方案,將所述翻譯結(jié)果顯示在所述目標(biāo)區(qū)域內(nèi),包括:通過所述翻譯結(jié)果替換所述文字內(nèi)容顯示在所述目標(biāo)區(qū)域內(nèi)。在本專利技術(shù)的一些實(shí)施方式中,基于前述方案,通過所述翻譯結(jié)果替換所述文字內(nèi)容顯示在所述目標(biāo)區(qū)域內(nèi),包括:識別所述目標(biāo)區(qū)域的背景顏色;根據(jù)所述目標(biāo)區(qū)域的背景顏色生成所述目標(biāo)區(qū)域?qū)?yīng)的背景圖;將所述背景圖和所述翻譯結(jié)果顯示在所述目標(biāo)區(qū)域內(nèi)。在本專利技術(shù)的一些實(shí)施方式中,基于前述方案,識別所述目標(biāo)區(qū)域的背景顏色,包括:對所述目標(biāo)圖像進(jìn)行二值化處理,得到二值化結(jié)果;確定所述目標(biāo)區(qū)域的邊緣上的各個像素點(diǎn)對應(yīng)的二值化結(jié)果,以及所述各個像素點(diǎn)的顏色值;根據(jù)所述目標(biāo)區(qū)域的邊緣上的各個像素點(diǎn)對應(yīng)的二值化結(jié)果,確定屬于所述目標(biāo)區(qū)域的背景部分的目標(biāo)像素點(diǎn);根據(jù)所述目標(biāo)像素點(diǎn)的顏色值,確定所述目標(biāo)區(qū)域的背景顏色。在本專利技術(shù)的一些實(shí)施方式中,基于前述方案,對所述目標(biāo)圖像進(jìn)行二值化處理,得到二值化結(jié)果,包括:將所述目標(biāo)圖像轉(zhuǎn)換為灰度圖;基于所述灰度圖,通過自適應(yīng)二值化方法獲取所述二值化結(jié)果。在本專利技術(shù)的一些實(shí)施方式中,基于前述方案,根據(jù)所述目標(biāo)區(qū)域的邊緣上的各個像素點(diǎn)對應(yīng)的二值化結(jié)果,確定屬于所述目標(biāo)區(qū)域的背景部分的目標(biāo)像素點(diǎn),包括:根據(jù)所述目標(biāo)區(qū)域的邊緣上的各個像素點(diǎn)對應(yīng)的二值化結(jié)果,對所述各個像素點(diǎn)進(jìn)行分類,得到兩類像素點(diǎn);將所述兩類像素點(diǎn)中數(shù)量最多的一類像素點(diǎn)作為所述目標(biāo)像素點(diǎn)。在本專利技術(shù)的一些實(shí)施方式中,基于前述方案,根據(jù)所述目標(biāo)區(qū)域的背景顏色生成所述目標(biāo)區(qū)域?qū)?yīng)的背景圖,包括:對于所述目標(biāo)區(qū)域中除所述目標(biāo)像素點(diǎn)之外的其他像素點(diǎn),根據(jù)所述其他像素點(diǎn)的鄰域像素的顏色值,計(jì)算所述其他像素點(diǎn)的顏色值;根據(jù)所述目標(biāo)像素點(diǎn)的顏色值和所述其他像素點(diǎn)的顏色值,生成所述背景圖。在本專利技術(shù)的一些實(shí)施方式中,基于前述方案,根據(jù)所述其他像素點(diǎn)的鄰域像素的顏色值,計(jì)算所述其他像素點(diǎn)的顏色值,包括:對于所述其他像素點(diǎn)中的任一像素點(diǎn),計(jì)算所述任一像素點(diǎn)的四鄰域或八鄰域內(nèi)的像素點(diǎn)的顏色值均值;將計(jì)算得到的顏色值均值作為所述任一像素點(diǎn)的顏色值。在本專利技術(shù)的一些實(shí)施方式中,基于前述方案,根據(jù)所述其他像素點(diǎn)的鄰域像素的顏色值,計(jì)算所述其他像素點(diǎn)的顏色值,包括:對于所述目標(biāo)區(qū)域,按照預(yù)定的遍歷方向,依次計(jì)算所述其他像素點(diǎn)中的每個像素點(diǎn)的顏色值。在本專利技術(shù)的一些實(shí)施方式中,基于前述方案,所述預(yù)定的遍歷方向包括:從所述目標(biāo)區(qū)域的左上角到右上角的方向。在本專利技術(shù)的一些實(shí)施方式中,基于前述方案,在將所述背景圖和所述翻譯結(jié)果顯示在所述目標(biāo)區(qū)域內(nèi)之前,還包括:對所述背景圖進(jìn)行中值濾波和邊緣模糊處理。在本專利技術(shù)的一些實(shí)施方式中,基于前述方案,將所述翻譯結(jié)果顯示在所述其它圖像中與所述目標(biāo)區(qū)域?qū)?yīng)的區(qū)域內(nèi),包括:將所述翻譯結(jié)果顯示在所述其它圖像中與所述目標(biāo)區(qū)域?qū)?yīng)的指定區(qū)域內(nèi)并替換掉所述指定區(qū)域內(nèi)的內(nèi)容。在本專利技術(shù)的一些實(shí)施方式中,基于前述方案,將所述翻譯結(jié)果顯示在所述其它圖像中與所述目標(biāo)區(qū)域?qū)?yīng)的指定區(qū)域內(nèi)并替換掉所述指定區(qū)域內(nèi)的內(nèi)容,包括:識別所述指定區(qū)域的背景顏色;根據(jù)所述指定區(qū)域的背景顏色生成所述指定區(qū)域?qū)?yīng)的背景圖;將所述指定區(qū)域?qū)?yīng)的背景圖和所述翻譯結(jié)果顯示在所述指定區(qū)域內(nèi)。在本專利技術(shù)的一些實(shí)施方式中,基于前述方案,所述的方法還包括:識別所述目標(biāo)區(qū)域內(nèi)的文字內(nèi)容的文字顏色;基于所述文字顏色,對顯示在所述目標(biāo)區(qū)域內(nèi)的所述翻譯結(jié)果進(jìn)行渲染。在本專利技術(shù)的一些實(shí)施方式中,基于前述方案,識別所述文字內(nèi)容的文字顏色,包括:根據(jù)對所述目標(biāo)圖像進(jìn)行二值化處理得到的二值化結(jié)果,確定所述目標(biāo)區(qū)域中的文字內(nèi)容對應(yīng)的各個像素點(diǎn)的顏色值;根據(jù)所述目標(biāo)區(qū)域中的文字內(nèi)容對應(yīng)的各個像素點(diǎn)的顏色值,確定所述文字內(nèi)容的文字顏色。在本專利技術(shù)的一些實(shí)施方式中,基于前述方案,根據(jù)所述目標(biāo)區(qū)域中的文字內(nèi)容對應(yīng)的各個像素點(diǎn)的顏色值,確定所述文字內(nèi)容的文字顏色,包括:計(jì)算所述目標(biāo)區(qū)域中的文字內(nèi)容對應(yīng)的各個像素點(diǎn)的顏色值均值;根據(jù)所述顏色值均值,確定所述文字內(nèi)容的文字顏色。在本專利技術(shù)的一些實(shí)施方式中,基于前述方案,根據(jù)所述顏色值均值,確定所述文字內(nèi)容的文字顏色,包括:若所述顏色值均值與所述目標(biāo)區(qū)域的顏色值之間的差值處于預(yù)定范圍內(nèi),則將所述目標(biāo)區(qū)域的顏色的相反色作為所述文字內(nèi)容的文字顏色;若所述顏色值均值與所述目標(biāo)區(qū)域的顏色值之間的差值未處于所述預(yù)定范圍內(nèi),則將所述顏色值均值作為所述文字內(nèi)容的文字顏色值。在本專利技術(shù)的一些實(shí)施方式中,基于前述方案,所述的方法還包括:若所述其它圖像與所述目標(biāo)圖像之間的差異大于所述預(yù)定值,則將所述其它圖像作為新的目標(biāo)圖像,并重新識別所述新的目標(biāo)圖像中包含的文字內(nèi)容。在本專利技術(shù)的一些實(shí)施方式中,基于前述方案,所述的方法還包括:識別所述其它圖像中與所述目標(biāo)區(qū)域?qū)?yīng)的指定區(qū)域內(nèi)包含的內(nèi)容的顏色;基于所述指定區(qū)域內(nèi)包含的內(nèi)容的顏色,對顯示在所述指定區(qū)域內(nèi)的所述翻譯結(jié)果進(jìn)行渲染。在本專利技術(shù)的一些實(shí)施方式中,基于前述方案,在將所述目標(biāo)圖像之后輸入的其它圖像與所述目標(biāo)圖像進(jìn)行對比之前,還包括:將所述其它圖像和所述目標(biāo)圖像轉(zhuǎn)換為灰度圖,以基于所述其它圖像的灰度圖和所述目標(biāo)圖像的灰度圖,將所述其它圖像與所述目標(biāo)圖像進(jìn)行對比。根據(jù)本專利技術(shù)實(shí)施方式的第二方面,提供了一種介質(zhì),其上存儲有程序,該程序被處理器執(zhí)行時實(shí)現(xiàn)如上述實(shí)施例中所述的方法。根據(jù)本專利技術(shù)實(shí)施方式的第三方面,提供了一種圖像處理裝置,包括:內(nèi)容識別單元,用于識別輸入的目標(biāo)圖像中需要翻譯的文字內(nèi)容及所述文字內(nèi)容所在的本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種圖像處理方法,包括:識別輸入的目標(biāo)圖像中需要翻譯的文字內(nèi)容及所述文字內(nèi)容所在的目標(biāo)區(qū)域;對所述文字內(nèi)容進(jìn)行翻譯,得到翻譯結(jié)果;將所述翻譯結(jié)果顯示在所述目標(biāo)區(qū)域內(nèi);將所述目標(biāo)圖像之后輸入的其它圖像與所述目標(biāo)圖像進(jìn)行對比;若所述其它圖像與所述目標(biāo)圖像之間的差異小于或等于預(yù)定值,則將所述翻譯結(jié)果顯示在所述其它圖像中與所述目標(biāo)區(qū)域?qū)?yīng)的區(qū)域內(nèi)。
【技術(shù)特征摘要】
1.一種圖像處理方法,包括:識別輸入的目標(biāo)圖像中需要翻譯的文字內(nèi)容及所述文字內(nèi)容所在的目標(biāo)區(qū)域;對所述文字內(nèi)容進(jìn)行翻譯,得到翻譯結(jié)果;將所述翻譯結(jié)果顯示在所述目標(biāo)區(qū)域內(nèi);將所述目標(biāo)圖像之后輸入的其它圖像與所述目標(biāo)圖像進(jìn)行對比;若所述其它圖像與所述目標(biāo)圖像之間的差異小于或等于預(yù)定值,則將所述翻譯結(jié)果顯示在所述其它圖像中與所述目標(biāo)區(qū)域?qū)?yīng)的區(qū)域內(nèi)。2.根據(jù)權(quán)利要求1所述的方法,其中,將所述翻譯結(jié)果顯示在所述目標(biāo)區(qū)域內(nèi),包括:通過所述翻譯結(jié)果替換所述文字內(nèi)容顯示在所述目標(biāo)區(qū)域內(nèi)。3.根據(jù)權(quán)利要求2所述的方法,其中,通過所述翻譯結(jié)果替換所述文字內(nèi)容顯示在所述目標(biāo)區(qū)域內(nèi),包括:識別所述目標(biāo)區(qū)域的背景顏色;根據(jù)所述目標(biāo)區(qū)域的背景顏色生成所述目標(biāo)區(qū)域?qū)?yīng)的背景圖;將所述背景圖和所述翻譯結(jié)果顯示在所述目標(biāo)區(qū)域內(nèi)。4.根據(jù)權(quán)利要求3所述的方法,其中,識別所述目標(biāo)區(qū)域的背景顏色,包括:對所述目標(biāo)圖像進(jìn)行二值化處理,得到二值化結(jié)果;確定所述目標(biāo)區(qū)域的邊緣上的各個像素點(diǎn)對應(yīng)的二值化結(jié)果,以及所述各個像素點(diǎn)的顏色值;根據(jù)所述目標(biāo)區(qū)域的邊緣上的各個像素點(diǎn)對應(yīng)的二值化結(jié)果,確定屬于所述目標(biāo)區(qū)域的背景部分的目標(biāo)像素點(diǎn);根據(jù)所述目標(biāo)像素點(diǎn)的顏色值,確定所述目標(biāo)區(qū)域的背景顏色。5.根據(jù)權(quán)利要求4所述的方法,其中,對所述目標(biāo)圖像進(jìn)行二值化處理,得到二值化結(jié)果,包括:將所述目標(biāo)圖像轉(zhuǎn)換為灰度圖;基于所述灰度圖,通過自適應(yīng)二值化方法獲取所述二值化結(jié)果。6.根據(jù)權(quán)...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:謝儀倫,宮思偉,林會杰,
申請(專利權(quán))人:網(wǎng)易有道信息技術(shù)北京有限公司,
類型:發(fā)明
國別省市:北京,11
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。