The invention discloses a document scanning method for mobile phone camera pictures automatically based on mosaic, comprising the following steps: 1), according to a certain direction to obtain several picture mosaic photos, photo shooting time according to the number of storage taken overlap between adjacent two pictures; 2), on the shot photo pretreatment, pretreatment are mainly divided into two aspects, one is the direction of a photo correction is picture format conversion; 3), the photos using the SIFT algorithm to find the key points and the corresponding descriptor; 4), the key points of the adjacent two photos in the feature matching; 5) and to mosaic two photos, according to a certain direction query is completed all splicing, photographs, stitching photos as the final version of the whole document electronic scanning output No, skip to step 4). This method reduces the adverse effects of hardware and environment on scanned files.
【技術實現步驟摘要】
一種基于手機攝像頭拍攝多幅照片自動拼接的文檔掃描方法
本專利技術屬于圖像處理與模式識別
,尤其涉及一種基于手機攝像頭拍攝多幅照片自動拼接的文檔掃描方法。
技術介紹
隨著數字化辦公技術在人們工作和日常生活中的普及,如何將紙質文檔迅速且高質量的轉換成數字文檔就變量日益重要起來。現有方法主要是依賴電子掃描設備,例如將一份A4大小的文件放在掃描儀中,掃描得到的輸出為一張jpg格式的圖片或者為一份PDF格式的文檔。雖然這一主流的方法得到了廣泛的使用,但仍然面臨幾個問題:1)專業的掃描設備價格不菲,對于家庭日常使用來講,增加了家庭生活開支的成本,且由于日常使用的頻率較低,導致購買專業掃描設備的性價比不高,另外,專業設備體積較大,需要占據一定的空間,影響家庭生活的品質。2)專業的掃描設備只能掃描大小一定的文檔。例如,現有的辦公掃描設備大多只適合掃描A4大小的文檔,當需要掃描更大的文檔時,普通的辦公設備無能力為。3)專業的掃描設備在掃描文檔時,文字的清晰度不夠。例如,將一份信用卡的申請表格掃描成電子版,表格中密集的小字體文字很難被掃描的十分清晰。
技術實現思路
本專利技術的目的是提供一種基于手機攝像頭拍攝多幅照片自動拼接的文檔掃描方法,通過使用手機攝像頭從不同角度拍攝一份文檔的多幅照片,將有重疊部分的照片拼接到一起,生成一張完整、清晰的圖片輸出,減少硬件和環境對圖片的不利影響。一種基于手機攝像頭拍攝多幅照片自動拼接的文檔掃描方法,包括以下步驟:1)、使用手機攝像頭按照水平方向從左到右、垂直方向從上到下的順序依此拍攝需要掃描的文檔的若干幅照片,所拍攝的照片在水平方向和垂直 ...
【技術保護點】
一種基于手機攝像頭拍攝多幅照片自動拼接的文檔掃描方法,其特征在于,包括以下步驟:1)、使用手機攝像頭按照水平方向從左到右、垂直方向從上到下的順序依此拍攝需要掃描的文檔的若干幅照片,所拍攝的照片在水平方向和垂直方向上均要求相鄰的兩張照片之間有重疊,所拍攝照片根據拍攝時間編號存儲;2)、對所拍攝照片進行預處理,預處理主要分為兩個方面,一個是照片方向矯正,一個是照片格式轉換:如果照片方向為左/右/下,則旋轉90度,將iOS手機拍攝的照片格式由UIImage格式轉換為JPEG格式;3)、對所拍攝照片利用SIFT算法找到關鍵點及其對應的描述子;4)、對相鄰兩張照片中的關鍵點進行特征匹配;5)、對相鄰兩張照片進行拼接,查詢按照一定方向性是否完成全部拍攝照片的拼接,是,將拼接照片作為最終生成的整個文檔的電子版掃描件輸出,否,跳轉到步驟4)。
【技術特征摘要】
1.一種基于手機攝像頭拍攝多幅照片自動拼接的文檔掃描方法,其特征在于,包括以下步驟:1)、使用手機攝像頭按照水平方向從左到右、垂直方向從上到下的順序依此拍攝需要掃描的文檔的若干幅照片,所拍攝的照片在水平方向和垂直方向上均要求相鄰的兩張照片之間有重疊,所拍攝照片根據拍攝時間編號存儲;2)、對所拍攝照片進行預處理,預處理主要分為兩個方面,一個是照片方向矯正,一個是照片格式轉換:如果照片方向為左/右/下,則旋轉90度,將iOS手機拍攝的照片格式由UIImage格式轉換為JPEG格式;3)、對所拍攝照片利用SIFT算法找到關鍵點及其對應的描述子;4)、對相鄰兩張照片中的關鍵點進行特征匹配;5)、對相鄰兩張照片進行拼接,查詢按照一定方向性是否完成全部拍攝照片的拼接,是,將拼接照片作為最終生成的整個文檔的電子版掃描件輸出,否,跳轉到步驟4)。2.如權利要求1所述的一種基于手機攝像頭拍攝多幅照片自動拼接的文檔掃描方法,其特征在于,所述步驟3)中,對所拍攝照片利用SIFT算法找到關鍵點及其對應的描述子包括以下步驟:1)、對于每一張照片,使用高斯差分算子對圖像的每一個像素點進行變換,看其是否比圖像域和尺度域的相鄰點大/小來尋找它的極值點,通過比較該像素點和其周圍所有的相鄰像素點,如果該像素點是一個極值點,則將該像素作為一個關鍵點;2)、以作為關鍵點的該像素點為中心,采樣16x16大小的圖像塊,計算該圖像塊內256個像素點在水平方向和垂直方向的梯度,將16x16大小的圖像塊分為無重疊的16個4x4的子塊,使用每一個子塊中所有像素的梯度計算一個8維的直方圖,將所有16個子塊的直方圖拼接成一個128維的特征向量...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。