System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 少妇极品熟妇人妻无码,国产精品无码日韩欧,国产高清无码视频
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    模型訓練方法、文本檢測方法、裝置、介質(zhì)和程序產(chǎn)品制造方法及圖紙

    技術編號:44264849 閱讀:6 留言:0更新日期:2025-02-14 22:08
    本申請?zhí)峁┝艘环N模型訓練方法、文本檢測方法、裝置、電子設備、計算機可讀介質(zhì)和計算機程序產(chǎn)品。本申請的方法包括:獲取目標任務對應的訓練圖像集;使用基于貝塞爾曲線的降噪訓練方法來訓練目標模型,其中,所述方法通過凍結目標模型中目標參數(shù)之外的參數(shù)來針對目標參數(shù)相應的部分進行訓練;將已凍結的參數(shù)解凍后,基于訓練圖像集對目標模型進行微調(diào)。本申請通過采用基于貝塞爾曲線的降噪方法來訓練模型,進而使用訓練好的模型來檢測輸入圖像中可能具有不規(guī)則形狀的文本,提升了文本檢測的準確性。

    【技術實現(xiàn)步驟摘要】

    本申請涉及計算機,尤其涉及一種模型訓練方法、文本檢測方法、裝置、電子設備、計算機可讀介質(zhì)和計算機程序產(chǎn)品。


    技術介紹

    1、場景文本相關的任務是計算機視覺領域的一個重要研究方向,它涉及到從自然場景中檢測、識別并鏈接文本的多個子任務。這些任務對于圖像搜索、即時翻譯、機器人導航、工業(yè)自動化等領域具有重要意義。

    2、傳統(tǒng)的場景文本檢測模型,如dbnet,致力于通過多步驟方式、基于文本組件的特殊表示的方法來提高文本檢測的性能。而識別模型,如parseq,則嘗試通過使用深度學習技術,特別是基于cnn和rnn的模型,來提高文字的識別性能。

    3、然而,基于現(xiàn)有技術的方案在處理復雜場景下的文本檢測,特別是不規(guī)則形狀文本的檢測時仍面臨挑戰(zhàn)。


    技術實現(xiàn)思路

    1、本申請的多個方面提供一種模型訓練方法、文本檢測方法、裝置、電子設備、計算機可讀介質(zhì)和計算機程序產(chǎn)品。

    2、本申請的一方面,提供一種訓練方法,其中,所述方法包括:

    3、獲取目標任務對應的訓練圖像集;

    4、使用基于貝塞爾曲線的降噪訓練方法來訓練目標模型,其中,所述方法通過凍結目標模型中目標參數(shù)之外的參數(shù)來針對目標參數(shù)相應的部分進行訓練;

    5、將已凍結的參數(shù)解凍后,基于訓練圖像集對目標模型進行微調(diào)。

    6、本申請的一方面,提供一種文本檢測方法,其中,所述方法包括:

    7、獲取待處理的目標場景圖像;

    8、使用訓練好的目標模型進行文本檢測,得到目標模型輸出的一個或多個的文本區(qū)域的位置信息;

    9、其中,所述目標模型是采用根據(jù)本申請實施例的模型訓練方法進行訓練而獲得的。

    10、本申請的一方面,提供一種模型訓練裝置,其中,所述裝置包括:。

    11、用于獲取目標任務對應的訓練圖像集的裝置;

    12、用于使用基于貝塞爾曲線的降噪訓練方法來訓練目標模型的裝置,其中,所述裝置通過凍結目標模型中目標參數(shù)之外的參數(shù)來針對目標參數(shù)相應的部分進行訓練;

    13、用于將已凍結的參數(shù)解凍后,基于訓練圖像集對目標模型進行微調(diào)的裝置。

    14、本申請的一方面,提供一種用于文本檢測的裝置,其中,所述裝置包括:

    15、用于獲取待處理的目標場景圖像的裝置;

    16、用于使用訓練好的目標模型進行文本檢測,得到目標模型輸出的一個或多個的文本區(qū)域的位置信息的裝置;

    17、其中,所述目標模型是采用根據(jù)本申請實施例的模型訓練方法進行訓練而獲得的。

    18、本申請的另一方面,提供一種計算機可讀存儲介質(zhì),其上存儲有計算機程序指令,所述計算機程序指令可被處理器執(zhí)行以實現(xiàn)本申請實施例的方法。

    19、本申請的另一方面,提供一種計算機程序產(chǎn)品,包括計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)本申請實施例的方法。

    20、本申請實施例提供的方案中,通過采用基于貝塞爾曲線的降噪方法來訓練模型,進而使用訓練好的模型來檢測輸入圖像中可能具有不規(guī)則形狀的文本,提升了文本檢測的準確性;在訓練階段凍結詞表和待執(zhí)行的目標任務相關參數(shù)之外的參數(shù),從而僅訓練詞表映射層和任務相關的檢測頭,并在微調(diào)階段解凍所有可學習的參數(shù)來基于目標任務對應的數(shù)據(jù)集對模型進行微調(diào),該訓練方式減少了在目標數(shù)據(jù)集上訓練微調(diào)的成本,可實現(xiàn)在幾個小時內(nèi)完成文本圖片中數(shù)百個目標的檢測,同時能夠輕松擴展詞表,進一步提升了模型訓練效率。

    本文檔來自技高網(wǎng)...

    【技術保護點】

    1.一種模型訓練方法,包括:

    2.根據(jù)權利要求1所述的方法,其中,所述使用基于貝塞爾曲線的降噪訓練方法來訓練目標模型包括:

    3.根據(jù)權利要求1或2所述的方法,其中,所述目標模型為基于Transformer架構的模型,該模型的結構包括骨干網(wǎng)絡、編碼器和解碼器,所述方法通過以下步驟來訓練所述模型:

    4.根據(jù)權利要求3所述的方法,其中,所述基于Transformer架構的模型還包括檢測頭,所述方法還包括:

    5.根據(jù)權利要求1所述的方法,其中,所述方法還包括:

    6.一種文本檢測方法,其中,所述方法包括:

    7.根據(jù)權利要求2所述的方法,其中,所述方法還包括:

    8.一種模型訓練裝置,其中,所述裝置包括:

    9.一種用于文本檢測的裝置,其中,所述裝置包括:

    10.一種電子設備,所述電子設備包括:

    11.一種計算機可讀介質(zhì),其上存儲有計算機程序指令,所述計算機程序指令可被處理器執(zhí)行以實現(xiàn)如權利要求1至5中任一項所述的方法,或者執(zhí)行權利要求6或7所述的方法。

    12.一種計算機程序產(chǎn)品,包括計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)權利要求1至5中任一項所述的方法,或者執(zhí)行權利要求6或7所述的方法。

    ...

    【技術特征摘要】

    1.一種模型訓練方法,包括:

    2.根據(jù)權利要求1所述的方法,其中,所述使用基于貝塞爾曲線的降噪訓練方法來訓練目標模型包括:

    3.根據(jù)權利要求1或2所述的方法,其中,所述目標模型為基于transformer架構的模型,該模型的結構包括骨干網(wǎng)絡、編碼器和解碼器,所述方法通過以下步驟來訓練所述模型:

    4.根據(jù)權利要求3所述的方法,其中,所述基于transformer架構的模型還包括檢測頭,所述方法還包括:

    5.根據(jù)權利要求1所述的方法,其中,所述方法還包括:

    6.一種文本檢測方法,其中,所述方法包括:

    【專利技術屬性】
    技術研發(fā)人員:謝彧,張婕蕾
    申請(專利權)人:上海嗶哩嗶哩科技有限公司,
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲精品无码你懂的| 久久久久无码精品国产| 日韩精品无码免费视频| 无码毛片一区二区三区中文字幕| 中文字幕av无码不卡免费| 制服在线无码专区| 国产丰满乱子伦无码专区| 孕妇特级毛片WW无码内射| 亚洲日韩乱码中文无码蜜桃臀网站 | 日韩乱码人妻无码中文字幕视频 | 午夜无码A级毛片免费视频| 在线观看无码AV网站永久免费| 一道久在线无码加勒比| 无码一区二区波多野结衣播放搜索| 久久伊人亚洲AV无码网站 | 精品亚洲AV无码一区二区三区| 白嫩无码人妻丰满熟妇啪啪区百度| 精品无码一区二区三区爱欲| 人妻系列AV无码专区| 国产精品亚洲一区二区无码| 亚洲精品无码专区久久| 日韩精品无码一区二区三区不卡 | 国产精品无码久久av不卡| 中文无码字慕在线观看| 无码人妻精品一区二区三区夜夜嗨| 国产成人无码精品久久久久免费| 亚洲av成人无码网站…| 亚洲乱人伦中文字幕无码| 亚洲久热无码av中文字幕| 无码乱肉视频免费大全合集| 久久久无码精品国产一区| 亚洲av无码成h人动漫无遮挡| 自拍中文精品无码| 亚洲国产精品无码成人片久久| 久久无码人妻精品一区二区三区| 久99久无码精品视频免费播放| 国产网红主播无码精品| 久久久久亚洲AV无码专区网站 | 精品无码久久久久久久久久| 五月丁香六月综合缴清无码| 中国少妇无码专区|