• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種聲源追蹤方法、裝置、設(shè)備、系統(tǒng)及存儲(chǔ)介質(zhì)制造方法及圖紙

    技術(shù)編號(hào):33092559 閱讀:29 留言:0更新日期:2022-04-16 23:22
    本申請(qǐng)實(shí)施例提供一種聲源追蹤方法、裝置、設(shè)備、系統(tǒng)及存儲(chǔ)介質(zhì)。所述方法包括:獲取麥克風(fēng)陣列在至少一個(gè)時(shí)間幀下采集到的聲學(xué)信號(hào)流;基于所述聲學(xué)信號(hào)流進(jìn)行聲源方位估計(jì),以獲得包含所述至少一個(gè)時(shí)間幀下聲源方位信息的信息流;將所述信息流轉(zhuǎn)換為描述聲源的方位分布狀態(tài)的可視化數(shù)據(jù);根據(jù)所述可視化數(shù)據(jù),進(jìn)行聲源追蹤。在本申請(qǐng)實(shí)施例中,將包含聲源方位信息的信息流轉(zhuǎn)換為描述聲源的方位分布狀態(tài)的可視化數(shù)據(jù),并基于可視化數(shù)據(jù),進(jìn)行聲源追蹤。這顛覆了傳統(tǒng)的從聲學(xué)信號(hào)處理層面進(jìn)行聲源追蹤的方式,而是從可視化分析層面進(jìn)行聲源追蹤。據(jù)此,本申請(qǐng)實(shí)施例中,可有效提高聲源追蹤的準(zhǔn)確度,且可提高對(duì)各種復(fù)雜環(huán)境的適應(yīng)性。適應(yīng)性。適應(yīng)性。

    【技術(shù)實(shí)現(xiàn)步驟摘要】
    一種聲源追蹤方法、裝置、設(shè)備、系統(tǒng)及存儲(chǔ)介質(zhì)


    [0001]本申請(qǐng)涉及數(shù)據(jù)處理
    ,尤其涉及一種聲源追蹤方法、裝置、設(shè)備、系統(tǒng)及存儲(chǔ)介質(zhì)。

    技術(shù)介紹

    [0002]基于麥克風(fēng)陣列進(jìn)行聲源追蹤是近年來的聲學(xué)信號(hào)處理領(lǐng)域的熱門技術(shù)。目前,聲源追蹤技術(shù)通常是對(duì)麥克風(fēng)陣列進(jìn)行濾波、取極值、計(jì)算基頻、計(jì)算方位角等信號(hào)層面的處理,以進(jìn)行聲源追蹤。
    [0003]但是,這類處理方式的魯棒性較差,泛化能力不足,尤其是在多聲源或嘈雜的環(huán)境下,聲源追蹤的準(zhǔn)確度不足。

    技術(shù)實(shí)現(xiàn)思路

    [0004]本申請(qǐng)的多個(gè)方面提供一種聲源追蹤方法、裝置、設(shè)備、系統(tǒng)及存儲(chǔ)介質(zhì),用以提高聲源追蹤的準(zhǔn)確度。
    [0005]本申請(qǐng)實(shí)施例提供一種聲源追蹤方法,包括:
    [0006]獲取麥克風(fēng)陣列在至少一個(gè)時(shí)間幀下采集到的聲學(xué)信號(hào)流;
    [0007]基于所述聲學(xué)信號(hào)流進(jìn)行聲源方位估計(jì),以獲得包含所述至少一個(gè)時(shí)間幀下聲源方位信息的信息流;
    [0008]將所述信息流轉(zhuǎn)換為描述聲源的方位分布狀態(tài)的可視化數(shù)據(jù);
    [0009]根據(jù)所述可視化數(shù)據(jù),進(jìn)行聲源追蹤。
    [0010]本申請(qǐng)實(shí)施例還提供一種聲源追蹤方法,包括:
    [0011]在目標(biāo)時(shí)段內(nèi)的至少一個(gè)時(shí)間幀下,分別確定聲源方位信息;
    [0012]將所述至少一個(gè)時(shí)間幀下的聲源方位信息,轉(zhuǎn)換為描述聲源的方位分布狀態(tài)的至少一組圖像數(shù)據(jù),以形成圖像流;
    [0013]利用圖像識(shí)別模型對(duì)所述圖像流進(jìn)行圖像識(shí)別,以在所述目標(biāo)時(shí)段內(nèi)進(jìn)行聲源追蹤。
    [0014]本申請(qǐng)實(shí)施例還提供一種聲源追蹤裝置,包括:
    [0015]獲取模塊,用于獲取麥克風(fēng)陣列在至少一個(gè)時(shí)間幀下采集到的聲學(xué)信號(hào)流;
    [0016]計(jì)算模塊,用于基于所述聲學(xué)信號(hào)流進(jìn)行聲源方位估計(jì),以獲得包含所述至少一個(gè)時(shí)間幀下聲源方位信息的信息流;
    [0017]轉(zhuǎn)換模塊,用于將所述信息流轉(zhuǎn)換為描述聲源的方位分布狀態(tài)的可視化數(shù)據(jù);
    [0018]追蹤模塊,用于根據(jù)所述可視化數(shù)據(jù),進(jìn)行聲源追蹤。
    [0019]本申請(qǐng)實(shí)施例還提供一種計(jì)算設(shè)備,包括存儲(chǔ)器和處理器;
    [0020]所述存儲(chǔ)器用于存儲(chǔ)一條或多條計(jì)算機(jī)指令;
    [0021]所述處理器與所述存儲(chǔ)器耦合,用于執(zhí)行所述一條或多條計(jì)算機(jī)指令,以用于:
    [0022]獲取麥克風(fēng)陣列在至少一個(gè)時(shí)間幀下采集到的聲學(xué)信號(hào)流;
    [0023]基于所述聲學(xué)信號(hào)流進(jìn)行聲源方位估計(jì),以獲得包含所述至少一個(gè)時(shí)間幀下聲源方位信息的信息流;
    [0024]將所述信息流轉(zhuǎn)換為描述聲源的方位分布狀態(tài)的可視化數(shù)據(jù);
    [0025]根據(jù)所述可視化數(shù)據(jù),進(jìn)行聲源追蹤。
    [0026]本申請(qǐng)實(shí)施例還提供一種聲源追蹤裝置,包括:
    [0027]確定模塊,用于在目標(biāo)時(shí)段內(nèi)的至少一個(gè)時(shí)間幀下,分別確定聲源方位信息;
    [0028]轉(zhuǎn)換模塊,用于將所述至少一個(gè)時(shí)間幀下的聲源方位信息,轉(zhuǎn)換為描述聲源的方位分布狀態(tài)的至少一組圖像數(shù)據(jù),以形成圖像流;
    [0029]追蹤模塊,用于利用圖像識(shí)別模型對(duì)所述圖像流進(jìn)行圖像識(shí)別,以在所述目標(biāo)時(shí)段內(nèi)進(jìn)行聲源追蹤。
    [0030]本申請(qǐng)實(shí)施例還提供一種計(jì)算設(shè)備,包括存儲(chǔ)器和處理器;
    [0031]所述存儲(chǔ)器用于存儲(chǔ)一條或多條計(jì)算機(jī)指令;
    [0032]所述處理器與所述存儲(chǔ)器耦合,用于執(zhí)行所述一條或多條計(jì)算機(jī)指令,以用于:
    [0033]在目標(biāo)時(shí)段內(nèi)的至少一個(gè)時(shí)間幀下,分別確定聲源方位信息;
    [0034]將所述至少一個(gè)時(shí)間幀下的聲源方位信息,轉(zhuǎn)換為描述聲源的方位分布狀態(tài)的至少一組圖像數(shù)據(jù),以形成圖像流;
    [0035]利用圖像識(shí)別模型對(duì)所述圖像流進(jìn)行圖像識(shí)別,以在所述目標(biāo)時(shí)段內(nèi)進(jìn)行聲源追蹤。
    [0036]本申請(qǐng)實(shí)施例還提供一種聲源追蹤系統(tǒng),包括:麥克風(fēng)陣列和計(jì)算設(shè)備,所述麥克風(fēng)陣列與所述計(jì)算設(shè)備通信連接;
    [0037]所述麥克風(fēng)陣列,用于采集聲學(xué)信號(hào);
    [0038]所述計(jì)算設(shè)備,用于獲取麥克風(fēng)陣列在至少一個(gè)時(shí)間幀下采集到的聲學(xué)信號(hào)流;基于所述聲學(xué)信號(hào)流進(jìn)行聲源方位估計(jì),以獲得包含所述至少一個(gè)時(shí)間幀下聲源方位信息的信息流;將所述信息流轉(zhuǎn)換為描述聲源的方位分布狀態(tài)的可視化數(shù)據(jù);根據(jù)所述可視化數(shù)據(jù),進(jìn)行聲源追蹤。
    [0039]本申請(qǐng)實(shí)施例還提供一種存儲(chǔ)計(jì)算機(jī)指令的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),當(dāng)所述計(jì)算機(jī)指令被一個(gè)或多個(gè)處理器執(zhí)行時(shí),致使所述一個(gè)或多個(gè)處理器執(zhí)行前述的聲源追蹤方法。
    [0040]在本申請(qǐng)實(shí)施例中,可對(duì)麥克風(fēng)陣列在至少一個(gè)時(shí)間幀下采集到的聲學(xué)信號(hào)流進(jìn)行聲學(xué)方位估計(jì),以分別確定至少一個(gè)時(shí)間幀下的聲學(xué)方位信息,將包含聲源方位信息的信息流轉(zhuǎn)換為描述聲源的方位分布狀態(tài)的可視化數(shù)據(jù),并基于可視化數(shù)據(jù),進(jìn)行聲源追蹤。這樣,本申請(qǐng)實(shí)施例中,顛覆了傳統(tǒng)的從聲學(xué)信號(hào)處理層面進(jìn)行聲源追蹤的方式,而是從可視化分析層面進(jìn)行聲源追蹤。而由于本實(shí)施例中,可視化數(shù)據(jù)可準(zhǔn)確、全面地反映出聲源的方位分布狀態(tài),這保證了可視化分析的基礎(chǔ)的準(zhǔn)確性、全面性,規(guī)避了魯棒性問題;而且,在可視化分析過程中,分析的視野可覆蓋更多的時(shí)間幀,因此,可發(fā)現(xiàn)視野內(nèi)的噪聲,從而避免噪聲干擾;據(jù)此,本申請(qǐng)實(shí)施例中,可有效提高聲源追蹤的準(zhǔn)確度,且可提高對(duì)各種復(fù)雜環(huán)境的適應(yīng)性。
    附圖說明
    [0041]此處所說明的附圖用來提供對(duì)本申請(qǐng)的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本申
    請(qǐng)的示意性實(shí)施例及其說明用于解釋本申請(qǐng),并不構(gòu)成對(duì)本申請(qǐng)的不當(dāng)限定。在附圖中:
    [0042]圖1為本申請(qǐng)一示例性實(shí)施例提供的一種聲源追蹤方法的流程示意圖;
    [0043]圖2為本申請(qǐng)一示例性實(shí)施例提供的一種聲源追蹤方案的邏輯示意圖;
    [0044]圖3為本申請(qǐng)一示例性實(shí)施例提供的一種聲源方位信息的示意;
    [0045]圖4為本申請(qǐng)一示例性實(shí)施例提供的一種聲源的方位分布熱力圖的示意圖;
    [0046]圖5為本申請(qǐng)一示例性實(shí)施例提供的一種聲源追蹤裝置的結(jié)構(gòu)示意圖;
    [0047]圖6為本申請(qǐng)又一示例性實(shí)施例提供的一種計(jì)算設(shè)備的結(jié)構(gòu)示意圖;
    [0048]圖7為本申請(qǐng)一示例性實(shí)施例提供的另一種聲源追蹤方法的流程圖;
    [0049]圖8為本申請(qǐng)一示例性實(shí)施例提供的另一種聲源追蹤裝置的結(jié)構(gòu)示意圖;
    [0050]圖9為本申請(qǐng)一示例性實(shí)施例提供的另一種計(jì)算設(shè)備的結(jié)構(gòu)示意圖;
    [0051]圖10為本申請(qǐng)一示例性實(shí)施例提供的一種聲源追蹤系統(tǒng)的結(jié)構(gòu)示意圖。
    具體實(shí)施方式
    [0052]為使本申請(qǐng)的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本申請(qǐng)具體實(shí)施例及相應(yīng)的附圖對(duì)本申請(qǐng)技術(shù)方案進(jìn)行清楚、完整地描述。顯然,所描述的實(shí)施例僅是本申請(qǐng)一部分實(shí)施例,而不是全部的實(shí)施例。基于本申請(qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本申請(qǐng)保護(hù)的范圍。
    [0053]針對(duì)現(xiàn)有聲源追蹤方案存在的魯棒性較差,泛化能力不足本文檔來自技高網(wǎng)
    ...

    【技術(shù)保護(hù)點(diǎn)】

    【技術(shù)特征摘要】
    1.一種聲源追蹤方法,其特征在于,包括:獲取麥克風(fēng)陣列在至少一個(gè)時(shí)間幀下采集到的聲學(xué)信號(hào)流;基于所述聲學(xué)信號(hào)流進(jìn)行聲源方位估計(jì),以獲得包含所述至少一個(gè)時(shí)間幀下聲源方位信息的信息流;將所述信息流轉(zhuǎn)換為描述聲源的方位分布狀態(tài)的可視化數(shù)據(jù);根據(jù)所述可視化數(shù)據(jù),進(jìn)行聲源追蹤。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述信息流轉(zhuǎn)換為描述聲源的方位分布狀態(tài)的可視化數(shù)據(jù),包括:將所述信息流轉(zhuǎn)換為所述至少一個(gè)時(shí)間幀下聲源的方位分布熱力圖,所述方位分布熱力圖用于描述在所述至少一個(gè)時(shí)間幀下聲源在不同方位上的分布熱度。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述聲源方位信息中包含聲源處于各方位的置信度;所述將所述信息流轉(zhuǎn)換為在所述至少一個(gè)時(shí)間幀下聲源的方位分布熱力圖,包括:基于置信度與顯示亮度之間的對(duì)應(yīng)關(guān)系,根據(jù)所述至少一個(gè)時(shí)間幀下的聲源處于各方位的置信度,在所述至少一個(gè)時(shí)間幀下分別確定各方位對(duì)應(yīng)的顯示亮度,不同顯示亮度表征不同的分布熱度;根據(jù)所述顯示亮度,生成所述至少一個(gè)時(shí)間幀下聲源的方位分布熱力圖。4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述顯示亮度,生成所述至少一個(gè)時(shí)間幀下聲源的方位分布熱力圖,包括:根據(jù)所述至少一個(gè)時(shí)間幀下各方位對(duì)應(yīng)的顯示亮度,分別確定所述至少一個(gè)時(shí)間幀各自對(duì)應(yīng)的圖像內(nèi)容;按照所述至少一個(gè)時(shí)間幀之間的時(shí)間順序,依次排列所述至少一個(gè)時(shí)間幀各自對(duì)應(yīng)的圖像內(nèi)容,以生成所述方位分布熱力圖。5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述可視化數(shù)據(jù),進(jìn)行聲源追蹤,包括:利用機(jī)器學(xué)習(xí)模型以及所述可視化數(shù)據(jù),進(jìn)行聲源追蹤。6.根據(jù)權(quán)利要求5所述的方法,其特征在于,若所述可視化數(shù)據(jù)為所述至少一個(gè)時(shí)間幀下聲源的方位分布熱力圖,則所述利用機(jī)器學(xué)習(xí)模型以及所述可視化數(shù)據(jù),進(jìn)行聲源追蹤,包括:在所述機(jī)器學(xué)習(xí)模型中,提取所述方位分布熱力圖中的圖像特征;基于圖像特征與聲源屬性參數(shù)之間的映射關(guān)系以及從所述方位分布熱力圖中提取到的圖像特征,確定所述至少一個(gè)時(shí)間幀下的目標(biāo)聲源屬性參數(shù),以進(jìn)行聲源追蹤。7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述聲源屬性參數(shù)包括方位、數(shù)量、發(fā)聲時(shí)長(zhǎng)和所覆蓋時(shí)間幀中的一個(gè)或多個(gè)。8.根據(jù)權(quán)利要求6所述的方法,其特征在于,還包括:獲取若干樣本時(shí)間幀組各自對(duì)應(yīng)的樣本熱力圖,所述樣本熱力圖用于描述在樣本時(shí)間幀下聲源在不同方位上的分布熱度;為各樣本熱力圖標(biāo)注聲源屬性參數(shù),以獲得各樣本熱力圖對(duì)應(yīng)的標(biāo)注信息;將所述各樣本熱力圖及其對(duì)應(yīng)的標(biāo)注信息輸入所述機(jī)器學(xué)習(xí)模型,以供所述機(jī)器學(xué)習(xí)
    模型學(xué)習(xí)所述圖像特征與聲源屬性參數(shù)之間的映射關(guān)系。9.根據(jù)權(quán)利要求6所述的方法,其特征在于,還包括:獲取若樣本時(shí)間幀組各自對(duì)應(yīng)的樣本信息流;為各樣本信息流標(biāo)注聲源屬性參數(shù),以獲得各樣本信息流對(duì)應(yīng)的標(biāo)注信息;將所述各樣本信息流及其對(duì)應(yīng)的標(biāo)注信息輸入所述機(jī)器學(xué)習(xí)模型,以供所述機(jī)器學(xué)習(xí)模型將各樣本信息流轉(zhuǎn)換為描述聲源的方位分布狀態(tài)的可視化數(shù)據(jù)并學(xué)習(xí)所述圖像特征與聲源屬性參數(shù)之間的映射關(guān)系。10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述將所述信息流轉(zhuǎn)換為描述聲源的方位分布狀態(tài)的可視化數(shù)據(jù),包括:將所述信息流輸入機(jī)器學(xué)習(xí)模型;在所述機(jī)器學(xué)習(xí)模型中,將所述信息流轉(zhuǎn)換為描述聲源的方位分布狀態(tài)的可視化數(shù)據(jù)。11.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述聲學(xué)信號(hào)流包含所述麥克風(fēng)陣列中各陣元采集到的時(shí)域信號(hào)流,所述基于所述聲學(xué)信號(hào)流進(jìn)行聲源方位估計(jì),以獲得包含所述至少一個(gè)時(shí)間幀下的聲源方位信息的信息流,包括:將各陣元采集到的時(shí)域信號(hào)流分別轉(zhuǎn)換時(shí)頻域信號(hào);采用聲源方位估計(jì)技術(shù),根據(jù)所述各陣元下的時(shí)頻域信號(hào),確...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:黃偉隆李威馮津偉
    申請(qǐng)(專利權(quán))人:阿里巴巴集團(tuán)控股有限公司
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評(píng)論
    • 還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

    1
    主站蜘蛛池模板: 人妻丰满熟妇AV无码片| 国产成人无码A区在线观看导航 | 亚洲AV成人无码网站| 在线a亚洲v天堂网2019无码| 中文字幕AV无码一区二区三区| 国产无码一区二区在线| 久久精品岛国av一区二区无码| a级毛片免费全部播放无码| 精品人妻大屁股白浆无码| 久久久久亚洲精品无码网址| 丰满熟妇人妻Av无码区| 日韩AV无码精品人妻系列| 国产成年无码久久久久下载| 日韩精品无码人妻一区二区三区| 亚洲午夜无码AV毛片久久| 亚洲AV无码资源在线观看| 永久免费AV无码网站国产| 在线A级毛片无码免费真人| 亚洲∧v久久久无码精品| 久久午夜无码鲁丝片午夜精品| 曰产无码久久久久久精品| 无码国产精品一区二区免费vr| 国产∨亚洲V天堂无码久久久| 人妻丰满熟妇AV无码区| 亚洲精品无码aⅴ中文字幕蜜桃| 免费看成人AA片无码视频吃奶| AV无码精品一区二区三区| 无码欧精品亚洲日韩一区夜夜嗨 | 久久亚洲精品AB无码播放| 精品少妇人妻av无码专区| 在线精品自偷自拍无码中文| 无码国内精品久久人妻| 成人无码午夜在线观看| 日韩少妇无码一区二区三区| 国产成人亚洲精品无码AV大片| 人妻系列无码专区久久五月天| 无码高潮爽到爆的喷水视频app | 无码人妻丰满熟妇区96| 久久久亚洲精品无码| 人妻丰满熟妇av无码区不卡| 精品爆乳一区二区三区无码av |