System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現(xiàn)步驟摘要】
本申請涉及計算機,尤其涉及一種模型訓練方法、文本檢測方法、裝置、電子設備、計算機可讀介質(zhì)和計算機程序產(chǎn)品。
技術介紹
1、場景文本相關的任務是計算機視覺領域的一個重要研究方向,它涉及到從自然場景中檢測、識別并鏈接文本的多個子任務。這些任務對于圖像搜索、即時翻譯、機器人導航、工業(yè)自動化等領域具有重要意義。
2、傳統(tǒng)的場景文本檢測模型,如dbnet,致力于通過多步驟方式、基于文本組件的特殊表示的方法來提高文本檢測的性能。而識別模型,如parseq,則嘗試通過使用深度學習技術,特別是基于cnn和rnn的模型,來提高文字的識別性能。
3、然而,基于現(xiàn)有技術的方案在處理復雜場景下的文本檢測,特別是不規(guī)則形狀文本的檢測時仍面臨挑戰(zhàn)。
技術實現(xiàn)思路
1、本申請的多個方面提供一種模型訓練方法、文本檢測方法、裝置、電子設備、計算機可讀介質(zhì)和計算機程序產(chǎn)品。
2、本申請的一方面,提供一種訓練方法,其中,所述方法包括:
3、獲取目標任務對應的訓練圖像集;
4、使用基于貝塞爾曲線的降噪訓練方法來訓練目標模型,其中,所述方法通過凍結目標模型中目標參數(shù)之外的參數(shù)來針對目標參數(shù)相應的部分進行訓練;
5、將已凍結的參數(shù)解凍后,基于訓練圖像集對目標模型進行微調(diào)。
6、本申請的一方面,提供一種文本檢測方法,其中,所述方法包括:
7、獲取待處理的目標場景圖像;
8、使用訓練好的目標模型進行文本檢測,得到目標模型輸
9、其中,所述目標模型是采用根據(jù)本申請實施例的模型訓練方法進行訓練而獲得的。
10、本申請的一方面,提供一種模型訓練裝置,其中,所述裝置包括:。
11、用于獲取目標任務對應的訓練圖像集的裝置;
12、用于使用基于貝塞爾曲線的降噪訓練方法來訓練目標模型的裝置,其中,所述裝置通過凍結目標模型中目標參數(shù)之外的參數(shù)來針對目標參數(shù)相應的部分進行訓練;
13、用于將已凍結的參數(shù)解凍后,基于訓練圖像集對目標模型進行微調(diào)的裝置。
14、本申請的一方面,提供一種用于文本檢測的裝置,其中,所述裝置包括:
15、用于獲取待處理的目標場景圖像的裝置;
16、用于使用訓練好的目標模型進行文本檢測,得到目標模型輸出的一個或多個的文本區(qū)域的位置信息的裝置;
17、其中,所述目標模型是采用根據(jù)本申請實施例的模型訓練方法進行訓練而獲得的。
18、本申請的另一方面,提供一種計算機可讀存儲介質(zhì),其上存儲有計算機程序指令,所述計算機程序指令可被處理器執(zhí)行以實現(xiàn)本申請實施例的方法。
19、本申請的另一方面,提供一種計算機程序產(chǎn)品,包括計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)本申請實施例的方法。
20、本申請實施例提供的方案中,通過采用基于貝塞爾曲線的降噪方法來訓練模型,進而使用訓練好的模型來檢測輸入圖像中可能具有不規(guī)則形狀的文本,提升了文本檢測的準確性;在訓練階段凍結詞表和待執(zhí)行的目標任務相關參數(shù)之外的參數(shù),從而僅訓練詞表映射層和任務相關的檢測頭,并在微調(diào)階段解凍所有可學習的參數(shù)來基于目標任務對應的數(shù)據(jù)集對模型進行微調(diào),該訓練方式減少了在目標數(shù)據(jù)集上訓練微調(diào)的成本,可實現(xiàn)在幾個小時內(nèi)完成文本圖片中數(shù)百個目標的檢測,同時能夠輕松擴展詞表,進一步提升了模型訓練效率。
本文檔來自技高網(wǎng)...【技術保護點】
1.一種模型訓練方法,包括:
2.根據(jù)權利要求1所述的方法,其中,所述使用基于貝塞爾曲線的降噪訓練方法來訓練目標模型包括:
3.根據(jù)權利要求1或2所述的方法,其中,所述目標模型為基于Transformer架構的模型,該模型的結構包括骨干網(wǎng)絡、編碼器和解碼器,所述方法通過以下步驟來訓練所述模型:
4.根據(jù)權利要求3所述的方法,其中,所述基于Transformer架構的模型還包括檢測頭,所述方法還包括:
5.根據(jù)權利要求1所述的方法,其中,所述方法還包括:
6.一種文本檢測方法,其中,所述方法包括:
7.根據(jù)權利要求2所述的方法,其中,所述方法還包括:
8.一種模型訓練裝置,其中,所述裝置包括:
9.一種用于文本檢測的裝置,其中,所述裝置包括:
10.一種電子設備,所述電子設備包括:
11.一種計算機可讀介質(zhì),其上存儲有計算機程序指令,所述計算機程序指令可被處理器執(zhí)行以實現(xiàn)如權利要求1至5中任一項所述的方法,或者執(zhí)行權利要求6或7所述的方法。
12.一種
...【技術特征摘要】
1.一種模型訓練方法,包括:
2.根據(jù)權利要求1所述的方法,其中,所述使用基于貝塞爾曲線的降噪訓練方法來訓練目標模型包括:
3.根據(jù)權利要求1或2所述的方法,其中,所述目標模型為基于transformer架構的模型,該模型的結構包括骨干網(wǎng)絡、編碼器和解碼器,所述方法通過以下步驟來訓練所述模型:
4.根據(jù)權利要求3所述的方法,其中,所述基于transformer架構的模型還包括檢測頭,所述方法還包括:
5.根據(jù)權利要求1所述的方法,其中,所述方法還包括:
6.一種文本檢測方法,其中,所述方法包括:
【專利技術屬性】
技術研發(fā)人員:謝彧,張婕蕾,
申請(專利權)人:上海嗶哩嗶哩科技有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。