System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本申請涉及模型,尤其涉及一種視覺編碼器訓(xùn)練、描述方法、裝置、設(shè)備及介質(zhì)。
技術(shù)介紹
1、在安全項(xiàng)目中,需要根據(jù)用戶采集的隱患圖像即存在安全隱患的圖像,給出對應(yīng)的隱患描述文本。相關(guān)技術(shù)中還沒有根據(jù)隱患圖像得到隱患描述文本的方案。
2、因此,如何訓(xùn)練視覺編碼器,從而基于訓(xùn)練完成的視覺編碼器得到隱患圖像對應(yīng)的、更準(zhǔn)確的隱患描述文本是亟待解決的技術(shù)問題。
技術(shù)實(shí)現(xiàn)思路
1、本申請?zhí)峁┝艘环N的視覺編碼器訓(xùn)練、描述方法、裝置、設(shè)備及介質(zhì),用于得到隱患圖像對應(yīng)的、更準(zhǔn)確的隱患描述文本。
2、第一方面,本申請?zhí)峁┝艘环N視覺編碼器訓(xùn)練方法,所述方法包括:
3、獲取樣本數(shù)據(jù)對;其中,所述樣本數(shù)據(jù)對包括隱患圖像及其對應(yīng)的隱患描述文本;
4、將所述隱患圖像輸入到待訓(xùn)練的視覺編碼器中,所述視覺編碼器將所述隱患圖像轉(zhuǎn)換為第一文本序列;
5、將所述隱患描述文本及其對應(yīng)的第一文本序列輸入到語言大模型中,所述語言大模型輸出所述第一文本序列對應(yīng)的預(yù)測描述文本;
6、根據(jù)所述預(yù)測描述文本和所述隱患描述文本之間的相似度,對所述視覺編碼器及語言大模型中的參數(shù)進(jìn)行調(diào)整。
7、在一種可能的實(shí)施方式中,所述方法還包括:
8、將所述隱患描述文本輸入到訓(xùn)練完成的文本編碼器中,獲取所述文本編碼器輸出的所述隱患描述文本對應(yīng)的第二文本序列;
9、根據(jù)所述第一文本序列和所述第二文本序列之間的相似度,對所述視覺編碼器中的參數(shù)進(jìn)行調(diào)整。<
...【技術(shù)保護(hù)點(diǎn)】
1.一種視覺編碼器訓(xùn)練方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述第一文本序列和所述第二文本序列之間的相似度,對所述視覺編碼器中的參數(shù)進(jìn)行調(diào)整包括:
4.一種視覺描述方法,其特征在于,所述方法包括:
5.一種視覺編碼器訓(xùn)練裝置,其特征在于,所述裝置包括:
6.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述訓(xùn)練模塊,還用于將所述隱患描述文本輸入到訓(xùn)練完成的文本編碼器中,獲取所述文本編碼器輸出的所述隱患描述文本對應(yīng)的第二文本序列;
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述調(diào)整模塊,具體用于根據(jù)所述第一文本序列和所述第二文本序列以及最大化似然函數(shù),確定所述第一文本序列和所述第二文本序列之間的損失值;根據(jù)所述損失值,對所述視覺編碼器中的參數(shù)進(jìn)行調(diào)整。
8.一種視覺描述裝置,其特征在于,所述裝置包括:
9.一種電子設(shè)備,其特征在于,所述電子設(shè)備至少包括處理器和存儲器,所述處理器用于執(zhí)行存儲器
10.一種計(jì)算機(jī)可讀存儲介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲介質(zhì)內(nèi)存儲有可由電子設(shè)備執(zhí)行的計(jì)算機(jī)程序,當(dāng)所述程序在所述電子設(shè)備上運(yùn)行時(shí),使得所述電子設(shè)備執(zhí)行如權(quán)利要求1-4中任一所述方法的步驟。
...【技術(shù)特征摘要】
1.一種視覺編碼器訓(xùn)練方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述第一文本序列和所述第二文本序列之間的相似度,對所述視覺編碼器中的參數(shù)進(jìn)行調(diào)整包括:
4.一種視覺描述方法,其特征在于,所述方法包括:
5.一種視覺編碼器訓(xùn)練裝置,其特征在于,所述裝置包括:
6.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述訓(xùn)練模塊,還用于將所述隱患描述文本輸入到訓(xùn)練完成的文本編碼器中,獲取所述文本編碼器輸出的所述隱患描述文本對應(yīng)的第二文本序列;
7.根據(jù)權(quán)利要求6所述的裝置...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:趙蕾,
申請(專利權(quán))人:新奧新智科技有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。