System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及計算機視覺,特別涉及一種基于深度學習的文檔圖像矯正方法。
技術介紹
1、隨著智能設備的普及,用戶通過智能手機、電腦等傳輸文檔圖像的情景日益增加。而在捕獲文檔圖像時經常出現物理變形、拍照角度和環境干擾等情況,導致文檔圖像扭曲變形。
2、為提高對文檔圖像的檢測識別準確度,需對其進行矯正處理,傳統技術中對于文檔圖像的矯正研究較少,通常采用數據集doc3d中的英文pdf文檔圖像訓練圖像矯正模型,而由于該數據集中文檔圖像的扭曲變形偏向于是單頁的扭曲和折痕,與實際文檔圖像扭曲存在一定差距,因此通過該數據集訓練后的模型圖像矯正效果較差,難以適應實際復雜的真實場景。
3、因此,提出一種基于深度學習的文檔圖像矯正方法。
技術實現思路
1、為解決上述技術問題,本專利技術提供一種基于深度學習的文檔圖像矯正方法,用以解決傳統技術中數據集訓練后的模型,文檔圖像矯正效果較差,難以適應復雜場景的問題。
2、本專利技術實施例中提供了一種基于深度學習的文檔圖像矯正方法,包括:
3、獲取待矯正文檔圖像;
4、基于訓練集中原始紋理網格圖像,進行紋理渲染和偏移映射處理,生成空間待渲染圖像;并通過原始紋理網格圖像對應的平整圖像對所述空間待渲染圖像進行數據增強,基于變換空間進行隨機擾動,獲取相應的樣本訓練對;
5、通過構建初始四點檢測模型和初始文檔矯正模型,獲取初始檢測矯正模型;
6、基于訓練集中的樣本訓練對,對所述初始檢測矯正
7、基于檢測矯正模型中的四點檢測模型,檢測所述待矯正文檔圖像的角點坐標,進行仿射變換,獲取檢測矯正圖像;基于檢測矯正模型中的文檔矯正模型,對所述檢測矯正圖像進行特征提取融合,生成矯正輸出圖像。
8、優選的,本專利技術提供一種基于深度學習的文檔圖像矯正方法,所述步驟:基于訓練集中原始紋理網格圖像,進行紋理渲染和偏移映射處理,生成空間待渲染圖像;并通過原始紋理網格圖像對應的平整圖像對所述空間待渲染圖像進行數據增強,基于變換空間進行隨機擾動,獲取相應的樣本訓練對;包括:
9、獲取所述訓練集中的原始紋理網格圖像;
10、根據所述原始紋理網格圖像進行裁剪采樣,獲取預處理紋理網格圖像;
11、基于預設場景的掃描數據,設置相機拍攝角度和距離,使用圖形圖像軟件對所述預處理紋理網格圖像進行渲染,獲取渲染紋理圖像;
12、根據所述渲染紋理圖像進行二維平面映射和后向映射,獲取映射處理圖像;
13、根據所述映射處理圖像進行四點映射和四點偏移映射,獲取樣本映射圖像和樣本偏移映射圖像;
14、根據所述原始紋理網格圖像進行余弦模擬彎曲變換,獲取余弦網格圖像;
15、通過薄板樣條插值算法對所述余弦網格圖像進行處理,獲取插值網格圖像;
16、根據所述渲染紋理圖像和所述插值網格圖像,生成空間待渲染圖像;
17、獲取所述訓練集中的原始紋理網格圖像對應的平整圖像;
18、根據所述平整圖像對所述空間待渲染圖像進行數據增強,并基于變換空間進行隨機擾動,獲取正常空間渲染圖像、空間偏移渲染圖像和空間縮放渲染圖像;
19、根據正常空間渲染圖像、空間偏移渲染圖像和空間縮放渲染圖像,分別進行四點映射和四點偏移映射,獲取正常空間映射圖像和正常空間四點偏移映射圖像、空間偏移映射圖像和空間偏移四點偏移映射圖像、空間縮放映射圖像和空間縮放四點偏移映射圖像;
20、可選的,所述步驟還包括:將所述正常空間映射圖像與所述樣本映射圖像構建為第一樣本訓練對,將所述空間偏移映射圖像與所述樣本映射圖像構建為第二樣本訓練對,將空間縮放映射圖像與所述樣本映射圖像構建為第三樣本訓練對,將正常空間四點偏移映射圖像與樣本偏移映射圖像構建為第四樣本訓練對,將空間偏移四點偏移映射圖像與樣本偏移映射圖像構建為第五樣本訓練對,將空間縮放四點偏移映射圖像與樣本偏移映射圖像構建為第六樣本訓練對。
21、優選的,本專利技術提供一種基于深度學習的文檔圖像矯正方法,所述步驟:通過薄板樣條插值算法對所述余弦網格圖像進行處理,獲取插值網格圖像,包括:
22、獲取所述余弦網格圖像中的像素點集合和預生成的插值點集合;
23、根據所述像素點集合和所述插值點集合,構建插值函數;
24、
25、其中,f(a,b)為插值函數,α0、α1、α2為分別為待求解趨勢系數,(a,b)為所述像素點集合中的像素點,μj為徑向基函數中控制點pj對應的權重,u()為徑向基函數,‖pi-(a,b)‖為控制點與像素點的歐式距離,設插值函數共有c個控制點;
26、基于所述插值函數對所述余弦網格圖像中的像素點集合進行插值變換處理,獲取插值網格圖像。
27、優選的,本專利技術提供一種基于深度學習的文檔圖像矯正方法,所述步驟:根據所述平整圖像對所述空間待渲染圖像進行數據增強,并基于變換空間進行隨機擾動,獲取正常空間渲染圖像、空間偏移渲染圖像和空間縮放渲染圖像;包括:
28、獲取所述平整圖像中的顏色特征和紋理特征;
29、基于變換空間對所述空間待渲染圖像進行無擾動、偏移擾動以及縮放擾動處理,獲取正常空間圖像、空間偏移圖像和空間縮放圖像;
30、構建所述平整圖像中像素點與正常空間圖像、空間偏移圖像、空間縮放圖像中像素點的映射關系;將平整圖像中像素點的顏色特征和紋理特征,投射至正常空間圖像、空間偏移圖像、空間縮放圖像,像素點之間進行紋理特征融合,并進行空間顏色紋理渲染,獲取正常空間渲染圖像、空間偏移渲染圖像和空間縮放渲染圖像。
31、優選的,本專利技術提供一種基于深度學習的文檔圖像矯正方法,所述步驟:基于訓練集中的樣本訓練對,對所述初始檢測矯正模型進行訓練,優化控制參數,獲取檢測矯正模型;包括:
32、獲取初始檢測矯正模型中的初始四點檢測模型;
33、獲取所述樣本訓練對對所述初始四點檢測模型進行訓練,通過分析初始四點檢測模型輸出的樣本角點坐標與樣本標準角點坐標的偏移程度,優化所述初始四點檢測模型;
34、
35、其中,la為坐標偏移損失函數,(xi,yi)為樣本角點坐標中第i個坐標信息,為樣本標準角點坐標中第i個坐標信息,tr為坐標偏移閾值。
36、優選的,本專利技術提供一種基于深度學習的文檔圖像矯正方法,所述步驟:基于訓練集中的樣本訓練對,對所述初始檢測矯正模型進行訓練,優化控制參數,獲取檢測矯正模型;包括:
37、獲取所述初始檢測矯正模型中的初始文檔矯正模型;
38、根據樣本訓練對對所述初始文檔矯正模型進行訓練,通過計算初始文檔矯正模型輸出的樣本后向映射坐標圖像與樣本標準坐標圖像的聯合損失函數,優化所述初始文檔矯正模型的控制參數;可選的,包括:
39、獲取所述樣本后向映射坐標本文檔來自技高網...
【技術保護點】
1.一種基于深度學習的文檔圖像矯正方法,其特征在于,包括:
2.根據權利要求1中的一種基于深度學習的文檔圖像矯正方法,其特征在于,所述步驟:基于訓練集中原始紋理網格圖像,進行紋理渲染和偏移映射處理,生成空間待渲染圖像;并通過原始紋理網格圖像對應的平整圖像對所述空間待渲染圖像進行數據增強,基于變換空間進行隨機擾動,獲取相應的樣本訓練對;包括:
3.根據權利要求2所述的一種基于深度學習的文檔圖像矯正方法,其特征在于,所述步驟:通過薄板樣條插值算法對所述余弦網格圖像進行處理,獲取插值網格圖像,包括:
4.根據權利要求2所述的一種基于深度學習的文檔圖像矯正方法,其特征在于,所述步驟:根據所述平整圖像對所述空間待渲染圖像進行數據增強,并基于變換空間進行隨機擾動,獲取正常空間渲染圖像、空間偏移渲染圖像和空間縮放渲染圖像;包括:
5.根據權利要求1所述的一種基于深度學習的文檔圖像矯正方法,其特征在于,所述步驟:基于訓練集中的樣本訓練對,對所述初始檢測矯正模型進行訓練,優化控制參數,獲取檢測矯正模型;包括:
6.根據權利要求1所述的一種
7.根據權利要求1所述的一種基于深度學習的文檔圖像矯正方法,其特征在于,所述步驟:基于檢測矯正模型中的四點檢測模型,檢測所述待矯正文檔圖像的角點坐標,進行仿射變換,獲取檢測矯正圖像;基于檢測矯正模型中的文檔矯正模型,對所述檢測矯正圖像進行特征提取融合,生成矯正輸出圖像;包括:
8.根據權利要求6所述的一種基于深度學習的文檔圖像矯正方法,其特征在于,所述步驟:對所述待矯正文檔圖像進行降噪處理,生成預處理矯正圖像,并進行灰度變換,獲取灰度待矯正文檔圖像;包括:
9.根據權利要求1所述的一種基于深度學習的文檔圖像矯正方法,其特征在于,所述步驟:基于檢測矯正模型中的四點檢測模型,檢測所述待矯正文檔圖像的角點坐標,進行仿射變換,獲取檢測矯正圖像;基于檢測矯正模型中的文檔矯正模型,對所述檢測矯正圖像進行特征提取融合,生成矯正輸出圖像;包括:
...【技術特征摘要】
1.一種基于深度學習的文檔圖像矯正方法,其特征在于,包括:
2.根據權利要求1中的一種基于深度學習的文檔圖像矯正方法,其特征在于,所述步驟:基于訓練集中原始紋理網格圖像,進行紋理渲染和偏移映射處理,生成空間待渲染圖像;并通過原始紋理網格圖像對應的平整圖像對所述空間待渲染圖像進行數據增強,基于變換空間進行隨機擾動,獲取相應的樣本訓練對;包括:
3.根據權利要求2所述的一種基于深度學習的文檔圖像矯正方法,其特征在于,所述步驟:通過薄板樣條插值算法對所述余弦網格圖像進行處理,獲取插值網格圖像,包括:
4.根據權利要求2所述的一種基于深度學習的文檔圖像矯正方法,其特征在于,所述步驟:根據所述平整圖像對所述空間待渲染圖像進行數據增強,并基于變換空間進行隨機擾動,獲取正常空間渲染圖像、空間偏移渲染圖像和空間縮放渲染圖像;包括:
5.根據權利要求1所述的一種基于深度學習的文檔圖像矯正方法,其特征在于,所述步驟:基于訓練集中的樣本訓練對,對所述初始檢測矯正模型進行訓練,優化控制參數,獲取檢測矯正模型;包括:
...【專利技術屬性】
技術研發人員:王宇軒,黃宇飛,郭彥宗,吳哲楠,黃秋慧,秦波,袁景偉,董士琪,楊森,蔡紅,蔣行濤,王巖,劉巍,王巖,
申請(專利權)人:北京百舸飛馳科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。