System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 亚洲精品一级无码鲁丝片,亚洲熟妇无码八V在线播放,国产在线无码不卡影视影院
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    基于深度學(xué)習(xí)的多模態(tài)數(shù)據(jù)特征處理方法、系統(tǒng)及介質(zhì)技術(shù)方案

    技術(shù)編號:44258243 閱讀:6 留言:0更新日期:2025-02-14 22:04
    本申請公開了一種基于深度學(xué)習(xí)的多模態(tài)數(shù)據(jù)特征處理方法、系統(tǒng)及介質(zhì),主要涉及多模態(tài)數(shù)據(jù)技術(shù)領(lǐng)域,用以解決由于傳統(tǒng)技術(shù)無法識別多種類型的數(shù)據(jù)圖像,進(jìn)而無法在用戶查找數(shù)據(jù)時(shí)提供多類型數(shù)據(jù)圖像的問題。包括:獲取各個(gè)類型的數(shù)據(jù)圖像,將數(shù)據(jù)圖像轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),確定對應(yīng)的特征提取算法,獲得特征數(shù)據(jù);根據(jù)對齊因子,獲取同屬于相同對齊因子的特征數(shù)據(jù),拼接成一個(gè)特征向量,獲得降維后的數(shù)據(jù)矩陣;通過降維后的數(shù)據(jù)矩陣和對應(yīng)的標(biāo)簽數(shù)據(jù),訓(xùn)練預(yù)設(shè)深度學(xué)習(xí)模型;根據(jù)用戶檢索信息對應(yīng)的降維后的數(shù)據(jù)矩陣;將降維后的數(shù)據(jù)矩陣作為訓(xùn)練好的預(yù)設(shè)深度學(xué)習(xí)模型的輸入,獲得標(biāo)簽數(shù)據(jù);進(jìn)而獲取標(biāo)簽數(shù)據(jù)對應(yīng)的各個(gè)類型的數(shù)據(jù)圖像。

    【技術(shù)實(shí)現(xiàn)步驟摘要】

    本申請涉及圖像特征處理,尤其涉及一種基于深度學(xué)習(xí)的多模態(tài)數(shù)據(jù)特征處理方法、系統(tǒng)及介質(zhì)


    技術(shù)介紹

    1、當(dāng)用戶在系統(tǒng)上查找資源時(shí),由于系統(tǒng)收集的材料多為非結(jié)構(gòu)化數(shù)據(jù),一般的查詢功能只能根據(jù)關(guān)鍵詞去匹配文件名稱,無法根據(jù)文件內(nèi)容查找,特別是圖像格式的。以至于用戶查找資料時(shí)總是找不全或者找不對,導(dǎo)致系統(tǒng)里的大量數(shù)據(jù)沒有充分利用。

    2、當(dāng)使用傳統(tǒng)的多模態(tài)數(shù)據(jù)處理技術(shù)來收集圖像格式文件內(nèi)的數(shù)據(jù)時(shí),傳統(tǒng)的多模態(tài)數(shù)據(jù)處理技術(shù)僅局限于對某一類圖像的處理,如處理地圖圖像或者動物圖像。但是實(shí)際情況中,收集上來數(shù)據(jù)雖然都是圖像,往往存在多種類型的圖像,有的是拍的一張表格內(nèi)容,有的是拍的一封文件函,有的是掃描件,還有的是地圖之類的。雖然都是圖像格式但屬于異質(zhì)數(shù)據(jù),當(dāng)使用一種多模態(tài)數(shù)據(jù)處理技術(shù)來處理這種異質(zhì)數(shù)據(jù)時(shí),無法充分捕捉和表示圖像中的信息,從而可能導(dǎo)致信息丟失或者誤識別,造成特征表達(dá)不足的問題,導(dǎo)致最終處理結(jié)果的質(zhì)量下降。

    3、因此,亟需一種基于深度學(xué)習(xí)的多模態(tài)數(shù)據(jù)特征處理方法、系統(tǒng)及介質(zhì),以解決由于傳統(tǒng)多模態(tài)數(shù)據(jù)處理技術(shù)無法識別多種類型的數(shù)據(jù)圖像,進(jìn)而無法在用戶查找數(shù)據(jù)時(shí)提供多類型數(shù)據(jù)圖像的問題。


    技術(shù)實(shí)現(xiàn)思路

    1、針對現(xiàn)有技術(shù)的上述不足,本申請?zhí)峁┮环N基于深度學(xué)習(xí)的多模態(tài)數(shù)據(jù)特征處理方法、系統(tǒng)及介質(zhì),以解決由于傳統(tǒng)多模態(tài)數(shù)據(jù)處理技術(shù)無法識別多種類型的數(shù)據(jù)圖像,進(jìn)而無法在用戶查找數(shù)據(jù)時(shí)提供多類型數(shù)據(jù)圖像的問題。

    2、第一方面,本申請?zhí)峁┝艘环N基于深度學(xué)習(xí)的多模態(tài)數(shù)據(jù)特征處理方法,方法包括:

    3、獲取各個(gè)類型的數(shù)據(jù)圖像,基于數(shù)據(jù)圖像的具體類型確定對應(yīng)的圖像預(yù)處理算法,將數(shù)據(jù)圖像轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù);其中,數(shù)據(jù)圖像的類型至少包括文本類數(shù)據(jù)圖像、表格類數(shù)據(jù)圖像和地圖類數(shù)據(jù)圖像;向結(jié)構(gòu)化數(shù)據(jù)添加標(biāo)簽數(shù)據(jù);根據(jù)結(jié)構(gòu)化數(shù)據(jù)對應(yīng)的圖像類型,確定對應(yīng)的特征提取算法,獲得各個(gè)圖像類型對應(yīng)的特征數(shù)據(jù)集合;其中,特征數(shù)據(jù)集合包含標(biāo)簽數(shù)據(jù);獲取對齊因子,進(jìn)而根據(jù)對齊因子,獲取同屬于相同對齊因子的若干特征數(shù)據(jù)集合;其中,對齊因子至少包括以下任意一項(xiàng)或多項(xiàng):時(shí)間、唯一標(biāo)識符、預(yù)設(shè)內(nèi)容關(guān)鍵詞、事件名稱、對象名稱、地理坐標(biāo)、區(qū)域范圍;將同屬于相同對齊因子的若干特征數(shù)據(jù)集合,拼接成一個(gè)特征向量,獲得特征向量的歸一化數(shù)據(jù)矩陣、協(xié)方差矩陣;通過協(xié)方差矩陣,計(jì)算獲得主成分空間,將歸一化數(shù)據(jù)矩陣投影到主成分空間中,獲得降維后的數(shù)據(jù)矩陣;通過降維后的數(shù)據(jù)矩陣和對應(yīng)的標(biāo)簽數(shù)據(jù),訓(xùn)練預(yù)設(shè)深度學(xué)習(xí)模型,獲得訓(xùn)練好的預(yù)設(shè)深度學(xué)習(xí)模型;當(dāng)進(jìn)行用戶檢索信息時(shí),根據(jù)用戶檢索信息,確定對應(yīng)的對齊因子,進(jìn)而確定對應(yīng)的降維后的數(shù)據(jù)矩陣;將降維后的數(shù)據(jù)矩陣作為訓(xùn)練好的預(yù)設(shè)深度學(xué)習(xí)模型的輸入,獲得標(biāo)簽數(shù)據(jù);進(jìn)而獲取標(biāo)簽數(shù)據(jù)對應(yīng)的各個(gè)類型的數(shù)據(jù)圖像。

    4、本申請實(shí)施例提供的多模態(tài)數(shù)據(jù)特征處理方法,本申請?zhí)峁┝颂幚聿煌愋蛿?shù)據(jù)圖像的圖像預(yù)處理算法,能夠?qū)⒉煌愋偷臄?shù)據(jù)圖像轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),能夠處理有文本類數(shù)據(jù)圖像、表格類數(shù)據(jù)圖像、地圖類數(shù)據(jù)圖像等數(shù)據(jù)圖像;另外,針對不同類型的數(shù)據(jù)圖像設(shè)置對應(yīng)的特征提取算法,在提取各個(gè)模態(tài)的特征之后,可以根據(jù)實(shí)際需求選擇不同的對齊因子進(jìn)行對齊,將它們對齊在一起,確保不同模態(tài)的數(shù)據(jù)能夠?qū)?yīng)到同一個(gè)實(shí)體或事件上,從而保證后面融合后的特征是有意義的。對齊的目的是確保不同模態(tài)的信息可以相互補(bǔ)充和支持,從而提供更完整和一致的數(shù)據(jù)表示。通過訓(xùn)練好的預(yù)設(shè)深度學(xué)習(xí)模型,將后續(xù)用戶的實(shí)際需求對應(yīng)的降維后的數(shù)據(jù)矩陣作為輸入,獲得用戶的實(shí)際需求對應(yīng)的標(biāo)簽數(shù)據(jù),進(jìn)而獲取標(biāo)簽數(shù)據(jù)對應(yīng)的各個(gè)類型的數(shù)據(jù)圖像,解決了在用戶查找數(shù)據(jù)時(shí)無法提供多類型數(shù)據(jù)圖像的問題。

    5、在本申請的一種實(shí)現(xiàn)方式中,獲取各個(gè)類型的數(shù)據(jù)圖像,基于數(shù)據(jù)圖像的具體類型確定對應(yīng)的圖像預(yù)處理算法,將數(shù)據(jù)圖像轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),具體包括:

    6、當(dāng)數(shù)據(jù)圖像為文本類數(shù)據(jù)圖像時(shí),通過ocr技術(shù)將文本類數(shù)據(jù)圖像轉(zhuǎn)換成可編輯的文本格式的結(jié)構(gòu)化數(shù)據(jù);當(dāng)數(shù)據(jù)圖像為表格類數(shù)據(jù)圖像時(shí),通過圖像預(yù)處理,對表格類數(shù)據(jù)圖像進(jìn)行灰度化和二值化處理,將彩色表格類數(shù)據(jù)圖像轉(zhuǎn)換為黑白表格類數(shù)據(jù)圖像;使用中值濾波技術(shù)去除表格類數(shù)據(jù)圖像中的噪點(diǎn),并校正表格類數(shù)據(jù)圖像的傾斜情況;使用邊緣檢測算法找到表格類數(shù)據(jù)圖像中的線條,使用hough直線檢測算法檢測線條中的直線,使用輪廓檢測功能,找出直線中所有閉合的輪廓;剪裁出每一個(gè)閉合的輪廓,使用ocr技術(shù)識別每個(gè)閉合的輪廓中的文字,進(jìn)而獲得表格類數(shù)據(jù)圖像對應(yīng)的結(jié)構(gòu)化數(shù)據(jù);當(dāng)數(shù)據(jù)圖像為地圖類數(shù)據(jù)圖像時(shí),使用地理信息系統(tǒng)技術(shù)并結(jié)合ocr技術(shù),提取地圖類數(shù)據(jù)圖像中的地理信息,作為當(dāng)前數(shù)據(jù)圖像的結(jié)構(gòu)化數(shù)據(jù);其中,地理信息至少包括經(jīng)度、緯度、街道名稱、街道號。

    7、在本申請的一種實(shí)現(xiàn)方式中,向結(jié)構(gòu)化數(shù)據(jù)添加標(biāo)簽數(shù)據(jù),具體包括:通過預(yù)設(shè)數(shù)據(jù)上傳終端,獲取各個(gè)結(jié)構(gòu)化數(shù)據(jù)對應(yīng)的標(biāo)簽數(shù)據(jù);以及通過預(yù)設(shè)語義識別算法,識別結(jié)構(gòu)化數(shù)據(jù)對應(yīng)的預(yù)設(shè)標(biāo)注關(guān)鍵字,確定預(yù)設(shè)標(biāo)注關(guān)鍵字對應(yīng)的標(biāo)簽數(shù)據(jù)為當(dāng)前結(jié)構(gòu)化數(shù)據(jù)對應(yīng)的標(biāo)簽數(shù)據(jù)。

    8、在本申請的一種實(shí)現(xiàn)方式中,根據(jù)結(jié)構(gòu)化數(shù)據(jù)對應(yīng)的圖像類型,確定對應(yīng)的特征提取算法,獲得各個(gè)圖像類型對應(yīng)的特征數(shù)據(jù)集合,具體包括:

    9、當(dāng)結(jié)構(gòu)化數(shù)據(jù)對應(yīng)文本類數(shù)據(jù)圖像時(shí),調(diào)用文本特征提取算法,提取結(jié)構(gòu)化數(shù)據(jù)中的向量特征數(shù)據(jù),生成當(dāng)前文本類數(shù)據(jù)圖像對應(yīng)的特征數(shù)據(jù)集合;當(dāng)結(jié)構(gòu)化數(shù)據(jù)對應(yīng)表格類數(shù)據(jù)圖像時(shí),識別各列數(shù)據(jù)類型;其中,數(shù)據(jù)類型至少包括:數(shù)值型、類別型;使用歸一化處理將數(shù)值型結(jié)構(gòu)化數(shù)據(jù)處理為特征數(shù)據(jù);使用獨(dú)熱編碼將類別型結(jié)構(gòu)化數(shù)據(jù)處理為二進(jìn)制特征數(shù)據(jù),獲得當(dāng)前表格類數(shù)據(jù)圖像對應(yīng)的特征數(shù)據(jù)集合;當(dāng)結(jié)構(gòu)化數(shù)據(jù)對應(yīng)地圖類數(shù)據(jù)圖像時(shí),從結(jié)構(gòu)化數(shù)據(jù)中提取地理坐標(biāo)特征、區(qū)域?qū)傩蕴卣鳎煌ㄟ^包含當(dāng)前地理坐標(biāo)特征的預(yù)設(shè)地理坐標(biāo)特征集合、k-means聚類算法,確定當(dāng)前地理坐標(biāo)對應(yīng)的預(yù)設(shè)聚類標(biāo)簽;通過包含當(dāng)前地理坐標(biāo)特征的預(yù)設(shè)地理坐標(biāo)特征集合和haversine方法,獲得距離當(dāng)前地理坐標(biāo)特征最近的預(yù)設(shè)數(shù)量個(gè)地理坐標(biāo)特征作為空間關(guān)系特征;將地理坐標(biāo)特征、區(qū)域?qū)傩蕴卣鳌㈩A(yù)設(shè)聚類標(biāo)簽和空間關(guān)系特征添加至當(dāng)前地圖類數(shù)據(jù)圖像對應(yīng)的特征數(shù)據(jù)集合。

    10、在本申請的一種實(shí)現(xiàn)方式中,在獲取對齊因子,進(jìn)而根據(jù)對齊因子,獲取同屬于相同對齊因子的若干特征數(shù)據(jù)集合之后,方法包括:

    11、確認(rèn)同屬于相同對齊因子的若干特征數(shù)據(jù)集合中的數(shù)據(jù)格式是否一致;當(dāng)存在數(shù)據(jù)格式不一致時(shí),將不一致的數(shù)據(jù)格式修改為預(yù)設(shè)統(tǒng)一格式。

    12、在本申請的一種實(shí)現(xiàn)方式中,將同屬于相同對齊因子的若干特征數(shù)據(jù)集合,拼接成一個(gè)特征向量,獲得特征向量的歸一化數(shù)據(jù)矩陣、協(xié)方差矩陣;通過協(xié)方差矩陣,計(jì)算獲得主成分空間,將歸一化數(shù)據(jù)矩陣投影到主成分空間中,獲得降維后的數(shù)據(jù)矩陣,具體包括:

    13、將同屬于相同對齊因子的若干特征數(shù)據(jù)集合中的關(guān)鍵詞拼接在一起,生成一個(gè)總特征集合,將總特征集合轉(zhuǎn)換為特征向量;其中,特征向量為n個(gè)特征數(shù)據(jù)集合的m個(gè)特征數(shù)量的數(shù)據(jù)矩陣;使用本文檔來自技高網(wǎng)...

    【技術(shù)保護(hù)點(diǎn)】

    1.一種基于深度學(xué)習(xí)的多模態(tài)數(shù)據(jù)特征處理方法,其特征在于,所述方法包括:

    2.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的多模態(tài)數(shù)據(jù)特征處理方法,其特征在于,獲取各個(gè)類型的數(shù)據(jù)圖像,基于數(shù)據(jù)圖像的具體類型確定對應(yīng)的圖像預(yù)處理算法,將數(shù)據(jù)圖像轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),具體包括:

    3.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的多模態(tài)數(shù)據(jù)特征處理方法,其特征在于,向結(jié)構(gòu)化數(shù)據(jù)添加標(biāo)簽數(shù)據(jù),具體包括:

    4.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的多模態(tài)數(shù)據(jù)特征處理方法,其特征在于,根據(jù)結(jié)構(gòu)化數(shù)據(jù)對應(yīng)的圖像類型,確定對應(yīng)的特征提取算法,獲得各個(gè)圖像類型對應(yīng)的特征數(shù)據(jù)集合,具體包括:

    5.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的多模態(tài)數(shù)據(jù)特征處理方法,其特征在于,在獲取對齊因子,進(jìn)而根據(jù)對齊因子,獲取同屬于相同對齊因子的若干特征數(shù)據(jù)集合之后,所述方法包括:

    6.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的多模態(tài)數(shù)據(jù)特征處理方法,其特征在于,將同屬于相同對齊因子的若干特征數(shù)據(jù)集合,拼接成一個(gè)特征向量,獲得特征向量的歸一化數(shù)據(jù)矩陣、協(xié)方差矩陣;通過協(xié)方差矩陣,計(jì)算獲得主成分空間,將歸一化數(shù)據(jù)矩陣投影到主成分空間中,獲得降維后的數(shù)據(jù)矩陣,具體包括:

    7.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的多模態(tài)數(shù)據(jù)特征處理方法,其特征在于,當(dāng)進(jìn)行用戶檢索信息時(shí),根據(jù)用戶檢索信息,確定對應(yīng)的對齊因子,進(jìn)而確定對應(yīng)的降維后的數(shù)據(jù)矩陣,具體包括:

    8.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的多模態(tài)數(shù)據(jù)特征處理方法,其特征在于,在獲取標(biāo)簽數(shù)據(jù)對應(yīng)的各個(gè)類型的數(shù)據(jù)圖像之后,所述方法還包括:

    9.一種基于深度學(xué)習(xí)的多模態(tài)數(shù)據(jù)特征處理系統(tǒng),其特征在于,所述系統(tǒng)包括:

    10.一種非易失性計(jì)算機(jī)存儲介質(zhì),其特征在于,其上存儲有計(jì)算機(jī)指令,所述計(jì)算機(jī)指令在被執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-8任一項(xiàng)所述的一種基于深度學(xué)習(xí)的多模態(tài)數(shù)據(jù)特征處理方法。

    ...

    【技術(shù)特征摘要】

    1.一種基于深度學(xué)習(xí)的多模態(tài)數(shù)據(jù)特征處理方法,其特征在于,所述方法包括:

    2.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的多模態(tài)數(shù)據(jù)特征處理方法,其特征在于,獲取各個(gè)類型的數(shù)據(jù)圖像,基于數(shù)據(jù)圖像的具體類型確定對應(yīng)的圖像預(yù)處理算法,將數(shù)據(jù)圖像轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),具體包括:

    3.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的多模態(tài)數(shù)據(jù)特征處理方法,其特征在于,向結(jié)構(gòu)化數(shù)據(jù)添加標(biāo)簽數(shù)據(jù),具體包括:

    4.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的多模態(tài)數(shù)據(jù)特征處理方法,其特征在于,根據(jù)結(jié)構(gòu)化數(shù)據(jù)對應(yīng)的圖像類型,確定對應(yīng)的特征提取算法,獲得各個(gè)圖像類型對應(yīng)的特征數(shù)據(jù)集合,具體包括:

    5.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的多模態(tài)數(shù)據(jù)特征處理方法,其特征在于,在獲取對齊因子,進(jìn)而根據(jù)對齊因子,獲取同屬于相同對齊因子的若干特征數(shù)據(jù)集合之后,所述方法包括:

    6.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的多模態(tài)數(shù)據(jù)特征處...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:章敏賈曉豐范軍李凝云周沫宋冠熹
    申請(專利權(quán))人:北京市大數(shù)據(jù)中心
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 无码人妻黑人中文字幕| 国产成人无码一二三区视频| 中文无码不卡的岛国片| 影音先锋中文无码一区| 亚洲高清无码综合性爱视频| 日韩乱码人妻无码系列中文字幕 | 亚洲一区二区无码偷拍| 国产精品免费看久久久无码| 亚洲av无码专区国产乱码在线观看| 亚洲av无码专区亚洲av不卡| 人妻少妇AV无码一区二区| 无码少妇丰满熟妇一区二区| 无码毛片视频一区二区本码| 亚洲精品一级无码鲁丝片| 亚洲成a人无码亚洲成www牛牛 | 日韩视频无码日韩视频又2021| 亚洲av福利无码无一区二区 | 中文字幕AV无码一区二区三区| 热の无码热の有码热の综合| 亚洲精品中文字幕无码AV| 亚洲AV无码一区二区乱子伦| 成在线人免费无码高潮喷水| 国产精品午夜无码av体验区| 精品无码国产AV一区二区三区| 亚洲熟妇av午夜无码不卡| 无码人妻丰满熟妇区96| 久久久久久人妻无码| 亚洲AV无码专区电影在线观看| 中文字幕无码精品亚洲资源网| 无码av不卡一区二区三区| 亚洲AV无码国产一区二区三区| 在线看片无码永久免费视频 | 无码免费又爽又高潮喷水的视频| 久久久g0g0午夜无码精品| 久久久久亚洲AV无码去区首| 亚洲a无码综合a国产av中文 | 国产精品无码一区二区在线观一 | 亚洲中文字幕无码日韩| 永久免费av无码网站yy| 亚洲精品无码久久一线| 无码丰满少妇2在线观看|