System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 精品久久久久久无码人妻中文字幕 ,蜜芽亚洲av无码一区二区三区,亚洲人成人无码.www石榴
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>
    當前位置: 首頁 > 專利查詢>南通大學專利>正文

    一種透明文字信息提取的小包裝復雜背景圖片處理方法及系統技術方案

    技術編號:44400083 閱讀:3 留言:0更新日期:2025-02-25 10:13
    本發明專利技術涉及圖像處理技術領域,尤其涉及一種透明文字信息提取的小包裝復雜背景圖片處理方法及系統,包括:步驟1:從輸入目錄中讀取至少一個圖像文件,圖像文件包含透明文字信息和復雜背景;步驟2:對讀取的圖像文件進行預處理以獲得處理后的圖像;步驟3:通過顏色分割和輪廓檢測識別圖像中的透明文字信息區域;步驟4:應用形態學操作處理透明文字信息區域;步驟5:提高處理后圖像的清晰度,并使用OCR技術提取圖像中的文本內容。本發明專利技術通過多步驟的圖像處理,增強透明文字信息區域的清晰度,通過基于顏色分割的透明文字信息區域檢測進一步提升識別率,顯著提高了OCR識別在透明文字信息復雜背景條件下的準確率和完整性。

    【技術實現步驟摘要】

    本專利技術涉及圖像處理,尤其涉及一種透明文字信息提取的小包裝復雜背景圖片處理方法及系統


    技術介紹

    1、隨著自動化技術的快速發展,基于圖像的文字識別技術在各個行業中得到了廣泛應用,尤其是在產品包裝、物流管理和信息提取等領域。然而,傳統ocr技術在處理復雜背景、色彩干擾以及字體多樣性時,往往面臨識別精度不高和處理效率低的問題。特別是在小包裝產品中,由于包裝表面的反光、陰影以及背景復雜度,傳統ocr方法往往難以有效提取透明文字信息區域,導致識別效果不佳。

    2、近年來,圖像處理技術在提升ocr識別性能方面取得了顯著進展。gamma校正和clahe技術被廣泛用于圖像預處理,有助于增強圖像的對比度,改善文字與背景之間的可區分性。然而,盡管這些方法在一定程度上提高了圖像質量,但在復雜背景下進行透明文字信息檢測時,仍存在局限性。

    3、為了解決這些問題,本申請提出了一種透明文字信息提取的小包裝復雜背景圖片處理方法及系統。


    技術實現思路

    1、本專利技術的目的是為了解決現有技術中存在的缺點,而提出的一種透明文字信息提取的小包裝復雜背景圖片處理方法及系統,結合了多種圖像處理算法與深度學習模型,能夠自主判斷并修正ocr識別結果中的錯誤,特別是在處理復雜或不規則背景時表現尤為突出,實現對復雜背景下透明文字信息區域的高效、準確識別。

    2、為了實現上述目的,本專利技術采用了如下技術方案:

    3、一種透明文字信息提取的小包裝復雜背景圖片處理方法,包括如下步驟:

    4、步驟1:從輸入目錄中讀取至少一個圖像文件,所述圖像文件包含透明文字信息和復雜背景;

    5、步驟2:對讀取的圖像文件進行預處理以獲得處理后的圖像,所述預處理步驟包括:應用gamma校正以調整圖像亮度、使用clahe技術增強對比度和使用中值濾波減少噪聲;

    6、步驟3:通過顏色分割和輪廓檢測識別圖像中的透明文字信息區域;

    7、步驟4:應用形態學操作處理所述透明文字信息區域,以提高文字的完整性和可讀性;

    8、步驟5:提高處理后圖像的清晰度,并使用ocr技術提取圖像中的文本內容。

    9、優選地,在步驟1中,圖像文件包括商品包裝、廣告牌、海報等圖片,通常背景與文字的顏色對比度較低,導致文字不易被傳統ocr算法識別;通常背景與文字的顏色對比度較低,導致文字不易被傳統ocr算法識別。

    10、優選地,在步驟2中,對讀取的圖像文件進行gamma校正處理。gamma校正用于調整圖像的亮度值,以增強透明文字信息的可見性。通過對gamma值的調整,使暗部區域的細節增強,而透明文字信息由于亮度增加而變得更加顯眼,從而提高后續處理步驟的效果。

    11、其中,在gamma校正之后,進一步對圖像應用clahe(對比度限制的自適應直方圖均衡化)技術。該步驟通過限制局部對比度增強的范圍,改善復雜背景中的亮度和對比度,防止圖像在增強后出現過曝或過暗區域。clahe技術能夠有效突出透明文字信息區域,同時保留背景細節,確保在不影響圖像整體質量的情況下提高文字的對比度。

    12、接下來,對圖像進行降噪處理,使用中值濾波算法減少背景噪聲對文字識別的影響。中值濾波是一種非線性濾波方法,通過替換像素值來去除圖像中的隨機噪聲。此步驟能夠減少復雜背景中的噪聲干擾,保持圖像的邊緣細節,使得后續的文字區域檢測更加準確。

    13、優選地,在步驟3中,對降噪后的圖像進行顏色分割,通過設定的hsv顏色范圍進行透明文字信息區域的顏色過濾,以適應不同的亮度和陰影條件。這里將圖像轉換為hsv顏色空間,以便更精確地提取白色文字區域。在hsv顏色空間中,通過設定透明文字信息的顏色范圍(如飽和度和亮度閾值),將圖像中的透明文字信息區域與背景分離出來,形成初步的文字區域掩碼。

    14、優選地,在步驟3中,應用輪廓檢測算法檢測并繪制輪廓,過濾小的輪廓,僅保留可能為文字的區域。在顏色分割生成的掩碼基礎上,應用輪廓檢測算法檢測文字區域的輪廓。通過輪廓檢測,可以進一步過濾掉噪聲和非文字區域,確保僅保留那些可能為透明文字信息的區域。輪廓檢測有助于精確定義文字區域的邊界,使得后續的形態學處理能夠更有效。

    15、優選地,在步驟4中,形態學操作包括:對透明文字信息區域進行閉合操作,以填補文字區域中的空隙,從而增強文字的完整性。對檢測到的文字區域進行形態學操作,包括閉合操作。閉合操作用于填補文字區域中的小空隙,并連接斷開的邊緣線條。由于復雜背景可能導致文字區域不連續,閉合操作可以增強文字區域的完整性,確保文字形狀更加清晰,從而提高ocr識別的準確性。

    16、其中,在形態學操作完成后,應用銳化處理對圖像進行適當的銳化。通過銳化增強圖像的邊緣細節,使透明文字信息的邊緣更為突出,同時使文字區域的對比度進一步增強。這一處理可以防止由于模糊或噪聲引起的識別困難。

    17、優選地,圖像處理包括多次迭代,以提取更多的文本信息,直至文本提取量不再增加。

    18、優選地,在步驟5中,ocr技術使用paddleocr模型進行文本識別,并支持中文字符的識別,確保文本提取的準確性。這里使用ocr技術對處理后的圖像進行文字識別,采用paddleocr模型,該模型支持中文字符的識別,并能夠在復雜背景條件下準確提取透明文字信息的內容。其中,paddleocr模型通過多層卷積神經網絡提取圖像特征,并結合預訓練的字符識別模型,確保能夠在多種背景干擾下識別出高質量的文本信息。

    19、本專利技術還提供了一種透明文字信息提取的小包裝復雜背景圖片處理系統,所述系統包括:

    20、圖像輸入模塊,用于讀取包含透明文字信息和復雜背景的圖像文件;

    21、圖像處理模塊,用于執行gamma校正、clahe、降噪、白色文字區域檢測和形態學處理等操作;

    22、ocr模塊,用于對處理后的圖像進行文本識別,輸出最終文本結果。

    23、通過采用上述技術方案:通過多步驟的圖像處理,包括gamma校正、對比度限制的自適應直方圖均衡化(clahe)、降噪、銳化以及形態學操作,增強透明文字信息區域的清晰度,并通過基于顏色分割的透明文字信息區域檢測進一步提升識別率。在此基礎上,結合paddleocr對增強后的圖像進行文字提取,顯著提高了ocr識別在透明文字信息復雜背景條件下的準確率和完整性。

    24、與現有技術相比,本專利技術具有以下有益效果:

    25、1、本專利技術通過gamma校正和clahe對比度增強,顯著提高了透明文字信息在復雜背景中的可見性。

    26、2、本專利技術通過中值濾波去除背景噪聲,使用閉合操作增強文字的完整性,減少了斷字和文字不連續的現象。

    27、3、本專利技術采用先進的paddleocr模型進行文字識別,結合圖像預處理技術,大大提高了復雜背景下的ocr識別準確率。

    28、4、本專利技術結合了多種圖像處理算法與深度學習模型,能夠自主判斷并修正ocr識本文檔來自技高網...

    【技術保護點】

    1.一種透明文字信息提取的小包裝復雜背景圖片處理方法,其特征在于,包括如下步驟:

    2.根據權利要求1所述的一種透明文字信息提取的小包裝復雜背景圖片處理方法,其特征在于,在步驟1中,圖像文件包括商品包裝、廣告牌、海報圖片。

    3.根據權利要求1所述的一種透明文字信息提取的小包裝復雜背景圖片處理方法,其特征在于,在步驟2中,對圖像進行降噪處理,使用中值濾波算法減少背景噪聲對文字識別的影響。

    4.根據權利要求1所述的一種透明文字信息提取的小包裝復雜背景圖片處理方法,其特征在于,在步驟3中,對降噪后的圖像進行顏色分割,通過設定的HSV顏色范圍進行透明文字信息的顏色過濾,以適應不同的亮度和陰影條件。

    5.根據權利要求4所述的一種透明文字信息提取的小包裝復雜背景圖片處理方法,其特征在于,在步驟3中,應用輪廓檢測算法檢測并繪制輪廓,過濾小的輪廓,僅保留可能為文字的區域。

    6.根據權利要求1所述的一種透明文字信息提取的小包裝復雜背景圖片處理方法,其特征在于,在步驟4中,形態學操作包括:對透明文字信息區域進行閉合操作,以填補文字區域中的空隙,從而增強文字的完整性。

    7.根據權利要求1-6任意一項所述的一種透明文字信息提取的小包裝復雜背景圖片處理方法,其特征在于,圖像處理包括多次迭代,以提取更多的文本信息,直至文本提取量不再增加。

    8.根據權利要求1所述的一種透明文字信息提取的小包裝復雜背景圖片處理方法,其特征在于,在步驟5中,OCR技術使用PaddleOCR模型進行文本識別,并支持中文字符的識別,確保文本提取的準確性。

    9.一種透明文字信息提取的小包裝復雜背景圖片處理系統,其特征在于,所述系統包括:

    10.根據權利要求9所述的一種透明文字信息提取的小包裝復雜背景圖片處理系統,其特征在于,所述圖像處理模塊的操作由計算機程序指令實現,所述程序能夠存儲在計算機可讀介質上,以便于系統的部署和運行。

    ...

    【技術特征摘要】

    1.一種透明文字信息提取的小包裝復雜背景圖片處理方法,其特征在于,包括如下步驟:

    2.根據權利要求1所述的一種透明文字信息提取的小包裝復雜背景圖片處理方法,其特征在于,在步驟1中,圖像文件包括商品包裝、廣告牌、海報圖片。

    3.根據權利要求1所述的一種透明文字信息提取的小包裝復雜背景圖片處理方法,其特征在于,在步驟2中,對圖像進行降噪處理,使用中值濾波算法減少背景噪聲對文字識別的影響。

    4.根據權利要求1所述的一種透明文字信息提取的小包裝復雜背景圖片處理方法,其特征在于,在步驟3中,對降噪后的圖像進行顏色分割,通過設定的hsv顏色范圍進行透明文字信息的顏色過濾,以適應不同的亮度和陰影條件。

    5.根據權利要求4所述的一種透明文字信息提取的小包裝復雜背景圖片處理方法,其特征在于,在步驟3中,應用輪廓檢測算法檢測并繪制輪廓,過濾小的輪廓,僅保留可能為文字的區域。

    6.根據權利要求1所述的一...

    【專利技術屬性】
    技術研發人員:朱建紅陳軒宇葛永華唐金沛羅凱
    申請(專利權)人:南通大學
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 国产日产欧洲无码视频无遮挡| 成在人线AV无码免费| 国产成人亚洲精品无码AV大片| 中文字幕无码日韩专区| 亚洲国产AV无码一区二区三区| 无码任你躁久久久久久久| 午夜福利无码不卡在线观看 | 丰满熟妇乱又伦在线无码视频| 99精品人妻无码专区在线视频区 | 波多野结衣VA无码中文字幕电影| 免费看无码特级毛片| 国产精品亚洲一区二区无码 | 精品人妻无码一区二区三区蜜桃一| 亚洲AV人无码综合在线观看| 成人无码嫩草影院| 亚洲av无码片区一区二区三区| 日韩亚洲AV无码一区二区不卡| 无码中文字幕日韩专区视频| 五月天无码在线观看| 无码中文人妻在线一区| 日韩视频无码日韩视频又2021 | 久久天堂av综合色无码专区 | 成人无码区免费A片视频WWW| 人妻系列AV无码专区| 日韩精品无码久久一区二区三| 在线观看无码不卡AV| 97免费人妻无码视频| 无码午夜成人1000部免费视频| 夜夜添无码一区二区三区| 亚洲一级特黄无码片| 亚洲精品午夜无码专区| 久久久久亚洲AV无码麻豆| 亚洲精品无码你懂的| 亚洲最大天堂无码精品区| 高清无码v视频日本www| 亚洲中文字幕无码爆乳AV| 欧洲无码一区二区三区在线观看| 亚洲AV无码一区二区三区国产| 国产日韩精品无码区免费专区国产 | 无码人妻精品一区二区蜜桃| 无码国产精品一区二区免费3p|