System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 国产成人无码精品久久久小说,亚洲日韩精品无码专区加勒比 ,亚洲国产精品无码专区
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    多模態眼動數據映射方法、裝置、邊緣計算設備及介質制造方法及圖紙

    技術編號:44490637 閱讀:7 留言:0更新日期:2025-03-04 17:55
    本申請公開了一種多模態眼動數據映射方法、裝置、邊緣計算設備及介質,屬于圖像處理技術領域。方法包括:獲取通過紅外攝像頭采集的紅外眼動圖像和通過可見光攝像頭采集的RGB目標圖像;紅外眼動圖像包括紅外圖像和眼動數據;確定紅外眼動圖像中包括有眼動數據的第一紅外圖像分塊;響應于第一紅外圖像分塊中的匹配點滿足預設條件,根據第一紅外圖像分塊計算紅外眼動圖像與RGB目標圖像的坐標映射關系;匹配點表示紅外眼動圖像與RGB目標圖像中具有相似特征的點;根據坐標映射關系將眼動數據映射至RGB目標圖像。本申請實施例能夠降低不同模態圖像間的映射誤差,提高眼動數據映射的準確性。

    【技術實現步驟摘要】

    本申請屬于圖像處理,尤其涉及一種多模態眼動數據映射方法、裝置、邊緣計算設備及介質


    技術介紹

    1、在多模態圖像處理領域,紅外圖像和可見光圖像的融合技術因其在獲取物體熱特性和顏色紋理細節方面的獨特優勢而備受關注。在眼動追蹤技術中,如何將眼動點從紅外圖像映射到可見光圖像,使得基于不同模態的數據能夠進行有效交互和應用,已成為研究的熱點。

    2、相關技術中,多模態圖像融合技術主要集中在特征級別或像素級別的圖像融合,但尚缺乏一個有效的方法來將眼動數據從一個模態的圖像準確映射到另一個模態上,從而實現基于不同模態數據的有效互動。


    技術實現思路

    1、本申請旨在至少解決現有技術中存在的技術問題之一。為此,本申請提出一種多模態眼動數據映射方法、裝置、邊緣計算設備及介質,以降低不同模態圖像間的映射誤差,提高眼動數據映射的準確性。

    2、第一方面,本申請提供了一種多模態眼動數據映射方法,包括:

    3、獲取通過紅外攝像頭采集的紅外眼動圖像和通過可見光攝像頭采集的rgb目標圖像;所述紅外眼動圖像包括紅外圖像和眼動數據;

    4、確定所述紅外眼動圖像中包括有眼動數據的第一紅外圖像分塊;

    5、響應于所述第一紅外圖像分塊中的匹配點滿足預設條件,根據所述第一紅外圖像分塊計算所述紅外眼動圖像與所述rgb目標圖像的坐標映射關系;所述匹配點表示所述紅外眼動圖像與所述rgb目標圖像中具有相似特征的點;

    6、根據所述坐標映射關系將所述眼動數據映射至所述rgb目標圖像

    7、根據本申請的多模態眼動數據映射方法,通過獲取通過紅外攝像頭采集的紅外眼動圖像和通過可見光攝像頭采集的rgb目標圖像;所述紅外眼動圖像包括紅外圖像和眼動數據;確定所述紅外眼動圖像中包括有眼動數據的第一紅外圖像分塊;響應于所述第一紅外圖像分塊中的匹配點滿足預設條件,根據所述第一紅外圖像分塊計算所述紅外眼動圖像與所述rgb目標圖像的坐標映射關系;所述匹配點表示所述紅外眼動圖像與所述rgb目標圖像中具有相似特征的點;根據所述坐標映射關系將所述眼動數據映射至所述rgb目標圖像。本申請實施例通過獲取不同模態的紅外眼動圖像和rgb目標圖像,在包含眼動數據的紅外圖像分塊滿足預設的條件時計算紅外眼動圖像與rgb目標圖像之間的坐標映射關系,使得計算過程更加關注于圖像中與眼動數據相關的區域,而非整個紅外眼動圖像,減少了不同模態圖像之間的偏移,從而降低不同模態圖像間的映射誤差,提高眼動數據映射的準確性。

    8、根據本申請的一個實施例,在獲取紅外眼動圖像中包括有眼動數據的第一紅外圖像分塊之前,包括:

    9、將所述紅外眼動圖像和所述rgb目標圖像輸入至預設的多模態模型中,以便于所述多模態模型提取所述紅外眼動圖像和所述rgb目標圖像的特征點,并根據提取的特征點進行匹配;或者,對所述紅外眼動圖像和所述rgb目標圖像進行預處理,所述預處理包括去除所述紅外眼動圖像邊界的預設范圍內特征點,以及去除所述rgb目標圖像邊界的預設范圍內特征點,將預處理后的所述紅外眼動圖像和所述rgb目標圖像輸入至預設的多模態模型中,以便于所述多模態模型提取預處理后的所述紅外眼動圖像和所述rgb目標圖像的特征點,并根據提取的特征點進行匹配;

    10、將匹配成功的特征點確定為匹配點。

    11、在該實施例中,由于多模態模型能夠處理和分析來自不同模態的數據,通過多模態模型可以提取紅外眼動圖像和rgb目標圖像的跨模態共享特征,從而能夠在特征點匹配時提供更加準確的對應關系,提高跨模態特征點匹配的準確性。

    12、在該實施例中,通過去除圖像邊界的預設范圍內特征點,可以減少由于圖像邊界區域可能存在的噪聲或不完整性對匹配精度的負面影響,使得更加專注于圖像中更穩定和信息豐富的區域,從而提高匹配的準確性。

    13、根據本申請的一個實施例,所述多模態模型包括自注意力單元、交叉注意力單元和分類器;所述交叉注意力單元的輸入維度包括灰度通道維度;所述自注意力單元和交叉注意力單元用于提取所述紅外眼動圖像和所述rgb目標圖像的特征點,并計算所述紅外眼動圖像的特征點和所述rgb目標圖像的特征點的為匹配點的置信度,所述分類器用于在所述特征點為匹配點的置信度大于預設閾值的情況下,將所述特征點作為匹配點輸出。

    14、在該實施例中,通過將交叉注意力單元的輸入維度設置為包括灰度通道維度,使得模型在特征提取過程中更多的關注圖像在溫度分布的特征而非色彩特征,從而提高紅外紅外眼動圖像的特征提取的準確性;通過自注意力機制計算特征點作為匹配點的置信度,當置信度超過預設閾值時,分類器可以控制模型停止推理,這些特征點被分類器識別并輸出為匹配點,不僅提高了匹配點識別的準確性,可以避免不必要的計算,減少計算資源的消耗。

    15、根據本申請的一個實施例,所述紅外眼動圖像為目標視頻流中的視頻幀,所述方法還包括:

    16、響應于所述紅外眼動圖像和所述rgb目標圖像匹配失敗,從所述目標視頻流中重新選擇視頻幀替換所述紅外眼動圖像和所述rgb目標圖像進行特征點匹配。

    17、在該實施例中,通過當特征點匹配未能成功建立紅外眼動圖像與rgb目標圖像之間的準確對應關系時,能夠靈活地從連續的視頻流中選取新的視頻幀作為紅外眼動圖像,減少了因單次匹配失敗而導致的整個眼動追蹤過程的中斷風險,提高了系統的連續性。

    18、根據本申請的一個實施例,從所述目標視頻流中重新選擇視頻幀替換所述紅外眼動圖像和所述rgb目標圖像進行特征點匹配,包括:

    19、將所述目標視頻流中與所述紅外眼動圖像對應的視頻幀相鄰視頻幀或所述目標視頻流的其他視頻幀確定為重新選擇的視頻幀。

    20、在該實施例中,通過在紅外眼動圖像與rgb目標圖像的特征點匹配失敗時,從目標視頻流中選擇與當前紅外眼動圖像相鄰的視頻幀作為替代,以此來重新進行特征點匹配,使得重新選擇的視頻幀還保持了時間上的連續性,或者選擇其他視頻幀作為替代,提高了眼動追蹤過程的穩定性和準確性。

    21、根據本申請的一個實施例,所述方法還包括:

    22、存儲所述多模態模型提取的所述rgb目標圖像的特征點;

    23、從目標視頻流中重新選擇視頻幀替換所述紅外眼動圖像和所述rgb目標圖像進行特征點匹配,包括:

    24、將經過替換的紅外眼動圖像輸入至預設的多模態模型中,以便于所述多模態模型提取所述紅外眼動圖像的特征點,并根據所述紅外眼動圖像的特征點和存儲的所述rgb目標圖像的特征點進行匹配。

    25、在該實施例中,通過多模態模型提取rgb目標圖像的特征并進行存儲,其他視頻幀圖像再和該rgb目標圖像進行匹配時,可以調用該rgb目標圖像的特征點進行特征匹配,無需再重復提取rgb目標圖像的特征,提高了處理效率。

    26、根據本申請的一個實施例,所述確定所述紅外眼動圖像中包括有眼動數據的第一紅外圖像分塊,包括:

    27、確定所述眼動數據在所述紅外眼動圖像本文檔來自技高網...

    【技術保護點】

    1.一種多模態眼動數據映射方法,其特征在于,包括:

    2.根據權利要求1所述的方法,其特征在于,在確定所述紅外眼動圖像中包括有眼動數據的第一紅外圖像分塊之前,包括:

    3.根據權利要求2所述的方法,其特征在于,所述多模態模型包括自注意力單元、交叉注意力單元和分類器;所述交叉注意力單元的輸入維度包括灰度通道維度;所述自注意力單元和交叉注意力單元用于提取所述紅外眼動圖像和所述RGB目標圖像的特征點,并計算所述紅外眼動圖像的特征點和所述RGB目標圖像的特征點的為匹配點的置信度,所述分類器用于在所述特征點為匹配點的置信度大于預設閾值的情況下,將所述特征點作為匹配點輸出。

    4.根據權利要求2所述的方法,其特征在于,所述紅外眼動圖像為目標視頻流中的視頻幀,所述方法還包括:

    5.根據權利要求4所述的方法,其特征在于,從所述目標視頻流中重新選擇視頻幀替換所述紅外眼動圖像和所述RGB目標圖像進行特征點匹配,包括:

    6.根據權利要求4所述的方法,其特征在于,所述方法還包括:

    7.根據權利要求1所述的方法,其特征在于,所述確定所述紅外眼動圖像中包括有眼動數據的第一紅外圖像分塊,包括:

    8.根據權利要求7所述的方法,其特征在于,所述根據所述眼動數據在所述紅外眼動圖像中的位置確定所述第一紅外圖像分塊,包括:

    9.根據權利要求1所述的方法,其特征在于,

    10.根據權利要求9所述的方法,其特征在于,所述獲取所述紅外眼動圖像中包括有所述眼動數據的第二紅外圖像分塊,包括:

    11.根據權利要求1所述的方法,其特征在于,所述根據所述第一紅外圖像分塊計算所述紅外眼動圖像與所述RGB目標圖像的坐標映射關系,包括:

    12.根據權利要求1所述的方法,其特征在于,所述方法還包括:

    13.一種多模態眼動數據映射裝置,其特征在于,包括:

    14.一種邊緣計算設備,其特征在于,包括處理器和存儲器,所述存儲器存儲可在所述處理器上運行的程序或指令,所述程序或指令被所述處理器執行時實現如權利要求1至12任一項所述的多模態眼動數據映射方法。

    15.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲程序或指令,所述程序或指令被處理器執行時實現如權利要求1至12任一項所述的多模態眼動數據映射方法。

    ...

    【技術特征摘要】

    1.一種多模態眼動數據映射方法,其特征在于,包括:

    2.根據權利要求1所述的方法,其特征在于,在確定所述紅外眼動圖像中包括有眼動數據的第一紅外圖像分塊之前,包括:

    3.根據權利要求2所述的方法,其特征在于,所述多模態模型包括自注意力單元、交叉注意力單元和分類器;所述交叉注意力單元的輸入維度包括灰度通道維度;所述自注意力單元和交叉注意力單元用于提取所述紅外眼動圖像和所述rgb目標圖像的特征點,并計算所述紅外眼動圖像的特征點和所述rgb目標圖像的特征點的為匹配點的置信度,所述分類器用于在所述特征點為匹配點的置信度大于預設閾值的情況下,將所述特征點作為匹配點輸出。

    4.根據權利要求2所述的方法,其特征在于,所述紅外眼動圖像為目標視頻流中的視頻幀,所述方法還包括:

    5.根據權利要求4所述的方法,其特征在于,從所述目標視頻流中重新選擇視頻幀替換所述紅外眼動圖像和所述rgb目標圖像進行特征點匹配,包括:

    6.根據權利要求4所述的方法,其特征在于,所述方法還包括:

    7.根據權利要求1所述的方法,其特征在于,所述確定所述紅外眼動圖像中包括有眼動數據的...

    【專利技術屬性】
    技術研發人員:請求不公布姓名請求不公布姓名請求不公布姓名請求不公布姓名
    申請(專利權)人:北京津發科技股份有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲欧洲自拍拍偷午夜色无码| 无码人妻精品一二三区免费| 亚洲国产一二三精品无码| 无码A级毛片免费视频内谢| 亚洲av永久无码精品天堂久久| 蜜芽亚洲av无码一区二区三区 | 一本大道无码av天堂| V一区无码内射国产| 亚洲AV无码专区在线亚| 国产台湾无码AV片在线观看| 国产精品亚洲一区二区无码| 久久精品无码一区二区无码| 永久免费av无码网站yy| 亚洲不卡无码av中文字幕| 亚洲精品久久无码| 无码国产精品一区二区免费虚拟VR | 国产色无码精品视频国产| 少妇人妻无码精品视频| 亚洲AV无码精品色午夜在线观看| 国产成人年无码AV片在线观看 | julia无码人妻中文字幕在线 | 中文字幕人妻无码一夲道| 日韩精品无码视频一区二区蜜桃| 无码人妻精品一区二区三区夜夜嗨 | 久久久无码精品亚洲日韩按摩 | 无码精品尤物一区二区三区| 亚洲Av永久无码精品三区在线 | 麻豆精品无码国产在线果冻| 久久午夜夜伦鲁鲁片免费无码影视 | 亚洲AV无码国产剧情| 熟妇人妻系列aⅴ无码专区友真希| 亚洲熟妇无码爱v在线观看| 久久无码国产专区精品| 久久久无码精品亚洲日韩按摩| 无码少妇一区二区三区浪潮AV| 亚洲AV无码一区东京热| AV无码久久久久不卡蜜桃| 无码精品A∨在线观看免费| 亚洲heyzo专区无码综合| 色综合99久久久无码国产精品| 夫妻免费无码V看片|