當(dāng)前位置: 首頁(yè) > 專利查詢>成都新希望金融信息有限公司專利>正文

一種個(gè)稅APP操作視頻中自動(dòng)化提取和整理有效信息的方法技術(shù)

技術(shù)編號(hào)：28215756 閱讀：46 留言：0更新日期：2021-04-24 14:58

本發(fā)明專利技術(shù)公開(kāi)了一種個(gè)稅APP操作視頻中自動(dòng)化提取和整理有效信息的方法，涉及視頻處理領(lǐng)域，包括以下步驟：S1、獲取個(gè)稅APP操作視頻，并對(duì)其進(jìn)行抽幀操作，得到抽幀后的視頻；S2、將抽幀后的視頻角度調(diào)整至設(shè)定角度；S3、對(duì)當(dāng)前視頻中的圖像幀進(jìn)行目標(biāo)檢測(cè)任務(wù)，獲取各個(gè)明細(xì)區(qū)域范圍；S4、對(duì)各個(gè)明細(xì)區(qū)域范圍進(jìn)行OCR文字識(shí)別，保存全部識(shí)別數(shù)據(jù)；S5、基于識(shí)別數(shù)據(jù)進(jìn)行字段對(duì)比回填，得到字段回填后的數(shù)據(jù)，完成個(gè)稅APP操作視頻中有效信息的自動(dòng)化提取和整理。本發(fā)明專利技術(shù)可以自動(dòng)且快速地從個(gè)稅APP操作視頻中自動(dòng)提取和整理有效信息，便于使用者核對(duì)相關(guān)數(shù)據(jù)，避免出現(xiàn)財(cái)務(wù)等問(wèn)題。避免出現(xiàn)財(cái)務(wù)等問(wèn)題。避免出現(xiàn)財(cái)務(wù)等問(wèn)題。

全部詳細(xì)技術(shù)資料下載

【技術(shù)實(shí)現(xiàn)步驟摘要】
一種個(gè)稅APP操作視頻中自動(dòng)化提取和整理有效信息的方法

[0001]本專利技術(shù)涉及視頻處理領(lǐng)域，具體涉及一種個(gè)稅APP操作視頻中自動(dòng)化提取和整理有效信息的方法。

技術(shù)介紹

[0002]深度學(xué)習(xí)是基于學(xué)習(xí)數(shù)據(jù)表示的更廣泛的機(jī)器學(xué)習(xí)方法的一部分。深度學(xué)習(xí)架構(gòu)，如深度神經(jīng)網(wǎng)絡(luò)，深度置信網(wǎng)絡(luò)和遞歸神經(jīng)網(wǎng)絡(luò)等，已應(yīng)用于計(jì)算機(jī)視覺(jué)，語(yǔ)音識(shí)別，自然語(yǔ)言處理，音頻識(shí)別，社交網(wǎng)絡(luò)過(guò)濾，機(jī)器翻譯，生物信息學(xué)，藥物設(shè)計(jì)，醫(yī)學(xué)圖像分析等領(lǐng)域。由深度學(xué)習(xí)框架所產(chǎn)生的模型結(jié)果可與人類專家相媲美，甚至在某些情況下優(yōu)于人類專家。
[0003]與機(jī)器學(xué)習(xí)一樣深度學(xué)習(xí)可以分為兩種：監(jiān)督學(xué)習(xí)與無(wú)監(jiān)督學(xué)習(xí)。近年來(lái)，深度學(xué)習(xí)技術(shù)隨著計(jì)算機(jī)算力的提高得到飛速的發(fā)展。在信息識(shí)別、推薦引擎等領(lǐng)域都取得了出色的應(yīng)用效果。同時(shí)，大量實(shí)驗(yàn)結(jié)果證明深度學(xué)習(xí)模型有著良好的魯棒性和泛化性。
[0004]光學(xué)字符識(shí)別（OCR）是指對(duì)文本資料的圖像文件進(jìn)行分析識(shí)別處理，獲取文字及版面信息的過(guò)程。傳統(tǒng)OCR基于圖像處理如二值化、投影分析等和統(tǒng)計(jì)機(jī)器學(xué)習(xí)實(shí)現(xiàn)。在背景單一、數(shù)據(jù)場(chǎng)景簡(jiǎn)單的情況下，傳統(tǒng)OCR能達(dá)到較好效果。基于深度學(xué)習(xí)的OCR利用模型算法能力替換傳統(tǒng)OCR的手動(dòng)方法，自動(dòng)檢測(cè)文本的類別和位置信息，并根據(jù)位置文本信息自動(dòng)識(shí)別文本內(nèi)容。在場(chǎng)景復(fù)雜、干擾多的情況下，深度學(xué)習(xí)OCR效果提升明顯。
[0005]根據(jù)識(shí)別場(chǎng)景，OCR可分為識(shí)別特定場(chǎng)景的專用OCR和識(shí)別多種場(chǎng)景的通用OCR。OCR技術(shù)的應(yīng)用領(lǐng)域廣泛，如車牌識(shí)別，證件識(shí)別，手寫(xiě)識(shí)別等。
[...

【技術(shù)保護(hù)點(diǎn)】

【技術(shù)特征摘要】
1.一種個(gè)稅APP操作視頻中自動(dòng)化提取和整理有效信息的方法，其特征在于，包括以下步驟：S1、獲取個(gè)稅APP操作視頻，并對(duì)其進(jìn)行抽幀操作，得到抽幀后的視頻；S2、將抽幀后的視頻角度調(diào)整至設(shè)定角度；S3、對(duì)當(dāng)前視頻中的圖像幀進(jìn)行目標(biāo)檢測(cè)任務(wù)，獲取各個(gè)明細(xì)區(qū)域范圍；S4、對(duì)各個(gè)明細(xì)區(qū)域范圍進(jìn)行OCR文字識(shí)別，保存全部識(shí)別數(shù)據(jù)；S5、基于識(shí)別數(shù)據(jù)進(jìn)行字段對(duì)比回填，得到字段回填后的數(shù)據(jù)，完成個(gè)稅APP操作視頻中有效信息的自動(dòng)化提取和整理。2.根據(jù)權(quán)利要求1所述的個(gè)稅APP操作視頻中自動(dòng)化提取和整理有效信息的方法，其特征在于，步驟S1中對(duì)個(gè)稅APP操作視頻進(jìn)行抽幀操作的具體方法為：按照每10幀抽取一幀的方式對(duì)個(gè)稅APP操作視頻進(jìn)行抽幀操作。3.根據(jù)權(quán)利要求1所述的個(gè)稅APP操作視頻中自動(dòng)化提取和整理有效信息的方法，其特征在于，步驟S2的具體方法為：包括以下子步驟：S2
?
1、將抽幀后的視頻輸入cbr卷積模塊，得到第一輸出數(shù)據(jù)；S2
?
2、將第一輸出數(shù)據(jù)輸入第一deep卷積模塊，得到第二輸出數(shù)據(jù)；S2
?
3、將第二輸出數(shù)據(jù)輸入第一crc卷積模塊，得到第三輸出數(shù)據(jù)；S2
?
4、將第三輸出數(shù)據(jù)輸入第二deep卷積模塊，得到第四輸出數(shù)據(jù)；S2
?
5、將第四輸出數(shù)據(jù)輸入第二crc卷積模塊，得到第五輸出數(shù)據(jù)；S2
?
6、將第五輸出數(shù)據(jù)輸入第三deep卷積模塊，得到第六輸出數(shù)據(jù)；S2
?
7、將第六輸出數(shù)據(jù)輸入第三crc卷積模塊，得到第七輸出數(shù)據(jù)；S2
?
8、將第七輸出數(shù)據(jù)輸入第四deep卷積模塊，得到第八輸出數(shù)據(jù)；S2
?
9、將第八輸出數(shù)據(jù)輸入第四crc卷積模塊，得到第九輸出數(shù)據(jù)；S2
?
10、將第九輸出數(shù)據(jù)輸入第五deep卷積模塊，得到第十輸出數(shù)據(jù)；S2
?
11、將第十輸出數(shù)據(jù)輸入第五crc卷積模塊，得到第十一輸出數(shù)據(jù)；S2
?
12、將第十一輸出數(shù)據(jù)輸入第六deep卷積模塊，得到第十二輸出數(shù)據(jù)；S2
?
13、將第十二輸出數(shù)據(jù)輸入第六crc卷積模塊，得到第十三輸出數(shù)據(jù)；S2
?
14、將第四輸出數(shù)據(jù)、第八輸出數(shù)據(jù)、第十一輸出數(shù)據(jù)和第十三輸出數(shù)據(jù)分別在其高度方向取平均值，對(duì)應(yīng)得到...

【專利技術(shù)屬性】
技術(shù)研發(fā)人員：趙小詣，周智杰，呂文勇，周旭強(qiáng)，
申請(qǐng)(專利權(quán))人：成都新希望金融信息有限公司，
類型：發(fā)明
國(guó)別省市：

全部詳細(xì)技術(shù)資料下載我是這個(gè)專利的主人

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條評(píng)論

還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

發(fā)布您的意見(jiàn)

相關(guān)領(lǐng)域技術(shù)