• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種多設(shè)備錄音的自動(dòng)切分對(duì)齊方法技術(shù)

    技術(shù)編號(hào):17939787 閱讀:72 留言:0更新日期:2018-05-15 20:10
    本發(fā)明專利技術(shù)公開一種多設(shè)備錄音的自動(dòng)切分對(duì)齊方法,包括步驟:將不同形式的多個(gè)原始錄音對(duì)應(yīng)處理成同一格式的多個(gè)長(zhǎng)時(shí)錄音;將多個(gè)所述長(zhǎng)時(shí)錄音中所包含的相同長(zhǎng)時(shí)錄音進(jìn)行關(guān)聯(lián);利用短時(shí)參考錄音對(duì)相關(guān)聯(lián)的長(zhǎng)時(shí)錄音分別進(jìn)行對(duì)齊,然后切分成與所述短時(shí)參考錄音對(duì)應(yīng)的短時(shí)錄音。本發(fā)明專利技術(shù)解決了錄制多設(shè)備語(yǔ)音識(shí)別數(shù)據(jù)庫(kù)的數(shù)據(jù)處理中復(fù)雜的問(wèn)題。

    An automatic segmentation and alignment method for multi device recording

    The invention discloses an automatic segmentation and alignment method for multi device recording, which includes steps to process multiple original recordings in different forms into a plurality of long time recordings in the same format; relate the same long time recordings contained in a plurality of long time recordings, and use short time reference recordings for the related long time recordings. Do not alignment, and then cut into short time recording corresponding to the short reference recording. The invention solves complex problems in data processing of recording multi device speech recognition database.

    【技術(shù)實(shí)現(xiàn)步驟摘要】
    一種多設(shè)備錄音的自動(dòng)切分對(duì)齊方法
    本專利技術(shù)涉及語(yǔ)音識(shí)別數(shù)據(jù)庫(kù)制作
    ,涉及一種多設(shè)備錄音的自動(dòng)切分對(duì)齊方法。
    技術(shù)介紹
    在語(yǔ)音識(shí)別數(shù)據(jù)庫(kù)制作過(guò)程中,通過(guò)利用多設(shè)備同時(shí)采集錄音,可大幅提高錄音的效率和多樣性。例如,通過(guò)在錄音中同時(shí)采集頭戴麥克風(fēng)、手機(jī)和麥克風(fēng)陣列的信號(hào),可保證信道的多樣性,進(jìn)而提高識(shí)別數(shù)據(jù)庫(kù)的實(shí)用性,使得數(shù)據(jù)庫(kù)可在遠(yuǎn)場(chǎng)識(shí)別、喚醒、降噪等應(yīng)用中使用。由于同時(shí)存在近講、遠(yuǎn)講的對(duì)應(yīng)數(shù)據(jù),可方便評(píng)估遠(yuǎn)場(chǎng)識(shí)別、喚醒、降噪算法的性能。然而在多設(shè)備錄音采集的過(guò)程中,由于錄音設(shè)備不同,各錄音設(shè)備無(wú)法在時(shí)間上同時(shí)開始錄音(即同時(shí)按下錄音開關(guān)或發(fā)出錄音命令);部分錄音設(shè)備的錄音丟幀問(wèn)題和錄音過(guò)程中的操作失誤,給語(yǔ)音識(shí)別數(shù)據(jù)的后期處理帶來(lái)一定挑戰(zhàn)。
    技術(shù)實(shí)現(xiàn)思路
    本專利技術(shù)的目的是針對(duì)現(xiàn)有技術(shù)中存在的技術(shù)缺陷,而提供一種用于語(yǔ)音識(shí)別數(shù)據(jù)庫(kù)制作的多設(shè)備錄音的自動(dòng)切分對(duì)齊方法,通過(guò)以短時(shí)參考錄音作為參考,實(shí)現(xiàn)自動(dòng)分別地多個(gè)目標(biāo)錄音中的關(guān)聯(lián)錄音對(duì)齊,然后切分形成對(duì)應(yīng)的短時(shí)錄音存儲(chǔ)在語(yǔ)音識(shí)別數(shù)據(jù)庫(kù)中,從而實(shí)現(xiàn)將不同原始錄音轉(zhuǎn)化為語(yǔ)音識(shí)別系統(tǒng)可使用的短時(shí)錄音。為實(shí)現(xiàn)本專利技術(shù)的目的所采用的技術(shù)方案是:一種多設(shè)備錄音的自動(dòng)切分對(duì)齊方法,包括步驟:將不同形式的多個(gè)原始錄音對(duì)應(yīng)處理成同一格式的多個(gè)長(zhǎng)時(shí)錄音;將多個(gè)所述長(zhǎng)時(shí)錄音中所包含的相同長(zhǎng)時(shí)錄音進(jìn)行關(guān)聯(lián);利用短時(shí)參考錄音對(duì)相關(guān)聯(lián)的長(zhǎng)時(shí)錄音分別進(jìn)行對(duì)齊,然后切分成與所述短時(shí)參考錄音對(duì)應(yīng)的短時(shí)錄音。本專利技術(shù)中,所述長(zhǎng)時(shí)錄音是指不同錄音設(shè)備自其錄音開始時(shí)刻至結(jié)束時(shí)刻不間斷采集的全部錄音,包括有效錄音與無(wú)效錄音;所述短時(shí)錄音指自所述長(zhǎng)時(shí)錄音中切分出的有效錄音。本專利技術(shù)中,所述原始錄音包括原始短時(shí)錄音與原始長(zhǎng)時(shí)錄音,分別通過(guò)以下步驟形成所述長(zhǎng)時(shí)錄音;對(duì)原始長(zhǎng)時(shí)錄音,則在原始長(zhǎng)時(shí)錄音解壓后進(jìn)行統(tǒng)一格式轉(zhuǎn)換,并按統(tǒng)一采樣率對(duì)原始長(zhǎng)時(shí)錄音重新采樣,從而形成所述長(zhǎng)時(shí)錄音;對(duì)原始短時(shí)錄音,則在原始短時(shí)錄音解壓后進(jìn)行統(tǒng)一格式轉(zhuǎn)換,并按統(tǒng)一采樣率對(duì)原始短時(shí)錄音重新采樣后,將原始短時(shí)錄音根據(jù)時(shí)間戳拼接成所述長(zhǎng)時(shí)錄音。其中,利用短時(shí)參考錄音對(duì)多個(gè)相關(guān)聯(lián)的長(zhǎng)時(shí)錄音分別進(jìn)行對(duì)齊,可以是采用在多個(gè)所述相關(guān)聯(lián)的長(zhǎng)時(shí)錄音中分別搜索短時(shí)參考錄音來(lái)實(shí)現(xiàn)。進(jìn)一步的,利用短時(shí)參考錄音對(duì)多個(gè)相關(guān)聯(lián)的長(zhǎng)時(shí)錄音分別進(jìn)行對(duì)齊,還可以采用下方式實(shí)現(xiàn):分別截取相關(guān)聯(lián)的長(zhǎng)時(shí)錄音和短時(shí)參考錄音的頭尾兩段,計(jì)算相關(guān)聯(lián)的長(zhǎng)時(shí)錄音和短時(shí)參考錄音在錄音開始階段、結(jié)束階段的錄音偏移;根據(jù)所述錄音偏移獲取短時(shí)參考錄音在相關(guān)聯(lián)的長(zhǎng)時(shí)錄音中的位置,然后利用該短時(shí)參考錄音在相關(guān)聯(lián)的長(zhǎng)時(shí)錄音中切出對(duì)應(yīng)的短錄音。具體的,所述錄音偏移的計(jì)算,可在原始時(shí)域信號(hào)上計(jì)算,或是在降噪后的時(shí)域信號(hào)上計(jì)算,或是在信號(hào)特征的域上計(jì)算。其中,所述短時(shí)參考錄音可以是對(duì)參考錄音設(shè)備錄制的長(zhǎng)時(shí)參考錄音切分而形成,或是參考錄音設(shè)備直接錄制的短時(shí)錄音。所述對(duì)參考錄音設(shè)備錄制的長(zhǎng)時(shí)參考錄音切分,是利用語(yǔ)音活動(dòng)檢測(cè)信息進(jìn)行切分的。本專利技術(shù)中,將多個(gè)所述長(zhǎng)時(shí)錄音中所包含的相同長(zhǎng)時(shí)錄音進(jìn)行關(guān)聯(lián),是通過(guò)讀取長(zhǎng)時(shí)錄音的內(nèi)容,通過(guò)計(jì)算多個(gè)長(zhǎng)時(shí)錄音的內(nèi)容的相關(guān)度來(lái)實(shí)現(xiàn)。上述的所述相關(guān)度包括錄音的時(shí)域相關(guān)度與音頻特征序列的相關(guān)度。本專利技術(shù)的多設(shè)備錄音的自動(dòng)切分對(duì)齊方法,通過(guò)對(duì)多不同錄音設(shè)備的原始錄音格式統(tǒng)一后,自動(dòng)關(guān)聯(lián)目標(biāo)錄音文件、對(duì)目標(biāo)錄音利用參考短時(shí)錄音進(jìn)行對(duì)齊后切分,能自動(dòng)將多錄音設(shè)備錄制的不同格式的原始錄音轉(zhuǎn)化為語(yǔ)音識(shí)別系統(tǒng)使用的短時(shí)錄音,解決了錄制多設(shè)備語(yǔ)音識(shí)別數(shù)據(jù)庫(kù)的數(shù)據(jù)處理復(fù)雜的問(wèn)題。附圖說(shuō)明圖1是多設(shè)備錄音的自動(dòng)切分對(duì)齊方法的處理流程示意圖;圖2是對(duì)原始錄音進(jìn)行格式統(tǒng)一處理的流程示意圖。具體實(shí)施方式以下結(jié)合附圖和具體實(shí)施例對(duì)本專利技術(shù)作進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本專利技術(shù),并不用于限定本專利技術(shù)。參見(jiàn)圖1-2所示,一種多設(shè)備錄音的自動(dòng)切分對(duì)齊方法,包括步驟:將不同形式的多個(gè)原始錄音對(duì)應(yīng)處理成同一格式的多個(gè)長(zhǎng)時(shí)錄音;將多個(gè)所述長(zhǎng)時(shí)錄音中所包含的相同長(zhǎng)時(shí)錄音進(jìn)行關(guān)聯(lián);利用短時(shí)參考錄音對(duì)相關(guān)聯(lián)的長(zhǎng)時(shí)錄音分別進(jìn)行對(duì)齊,然后切分成與所述短時(shí)參考錄音對(duì)應(yīng)的短時(shí)錄音。所述切分成與所述短時(shí)參考錄音對(duì)應(yīng)的短時(shí)錄音,存儲(chǔ)在語(yǔ)音識(shí)別數(shù)據(jù)庫(kù)中進(jìn)行識(shí)別使用,從而實(shí)現(xiàn)將不同的原始錄音轉(zhuǎn)化為語(yǔ)音識(shí)別系統(tǒng)可使用的短時(shí)錄音。其中,不同形式的多個(gè)原始錄音由不同的錄音輸入設(shè)備,如圖1所示,由錄音設(shè)備1、錄音設(shè)備2……錄音設(shè)備N輸入,首先通過(guò)格式統(tǒng)一處理的步驟,將不同形式的多個(gè)原始錄音對(duì)應(yīng)處理成同一格式的多個(gè)長(zhǎng)時(shí)錄音,然后將同一格式的長(zhǎng)時(shí)錄音中的同一錄音文件中的相同的錄音文件進(jìn)行關(guān)聯(lián),然后利用短時(shí)參考錄音對(duì)相關(guān)聯(lián)的長(zhǎng)時(shí)錄音分別進(jìn)行對(duì)齊后,進(jìn)行切分,即可實(shí)現(xiàn)形成語(yǔ)音識(shí)別數(shù)據(jù)庫(kù)存儲(chǔ)的錄音,然后由錄音設(shè)備1、錄音設(shè)備2……錄音設(shè)備N分別輸出到語(yǔ)音識(shí)別數(shù)據(jù)庫(kù)存儲(chǔ)。所述的原始錄音,是來(lái)自于不同的錄音設(shè)備,如頭戴麥克風(fēng)、手機(jī)和麥克風(fēng)陣列等,由于各個(gè)錄音設(shè)備的采集的錄音的格式會(huì)存在不一致的可能,為了方便后續(xù)切分處理,本專利技術(shù)中,首先對(duì)不同的不同形式的多個(gè)原始錄音對(duì)應(yīng)處理成同一格式的多個(gè)長(zhǎng)時(shí)錄音,以便為后續(xù)處理提供處理的基礎(chǔ)。由于錄音設(shè)備的不同,在采集音頻的過(guò)程中,有可能形成的原始錄音是原始短時(shí)錄音,也有可能是原始長(zhǎng)時(shí)錄音,因此,針對(duì)原始短時(shí)錄音與原始長(zhǎng)時(shí)錄音的處理,分別通過(guò)以下步驟形成相應(yīng)的長(zhǎng)時(shí)錄音;對(duì)原始長(zhǎng)時(shí)錄音,則在原始長(zhǎng)時(shí)錄音解壓(與解密)后進(jìn)行統(tǒng)一格式轉(zhuǎn)換,并按統(tǒng)一采樣率對(duì)原始長(zhǎng)時(shí)錄音重新采樣,從而形成所述長(zhǎng)時(shí)錄音;對(duì)原始短時(shí)錄音,則在原始短時(shí)錄音解壓(與解密)后進(jìn)行統(tǒng)一格式轉(zhuǎn)換,并按統(tǒng)一采樣率對(duì)原始短時(shí)錄音重新采樣后,將原始短時(shí)錄音根據(jù)時(shí)間戳信息,拼接成所述長(zhǎng)時(shí)錄音。對(duì)原始短時(shí)錄音拼接具體可以是:若Sk為第k個(gè)原始短時(shí)錄音(1≤k≤K),K為自然數(shù),Sk對(duì)應(yīng)的時(shí)間戳為tk=[tkstart,tkend],則對(duì)應(yīng)時(shí)間戳t所拼接的長(zhǎng)時(shí)錄音S(t)為:Sk(t)為時(shí)間戳t對(duì)應(yīng)的第k個(gè)原始短時(shí)錄音;tkstart,tkend為Sk對(duì)應(yīng)的時(shí)間戳的起始時(shí)刻與結(jié)束時(shí)刻。其中,短時(shí)參考錄音,可以由相應(yīng)的錄音參考設(shè)備選取,錄音參考設(shè)備可根據(jù)錄音文件信噪比選取信噪比高的設(shè)備作為錄音參考設(shè)備,也可以根據(jù)實(shí)際錄音項(xiàng)目需求來(lái)選取錄音參考設(shè)備。通過(guò)統(tǒng)一文件格式和采樣率,并統(tǒng)一形成長(zhǎng)時(shí)錄音,方便后續(xù)處理。本專利技術(shù)中,所述長(zhǎng)時(shí)錄音是指不同錄音設(shè)備自其錄音開始時(shí)刻至結(jié)束時(shí)刻不間斷采集的全部錄音,包括有效錄音與無(wú)效錄音;由于各個(gè)錄音設(shè)備的開始和/或結(jié)束的時(shí)間不一定相同,采集音頻中間的重錄、暫停等過(guò)程都包含在長(zhǎng)時(shí)錄音中。所述短時(shí)錄音指自所述長(zhǎng)時(shí)錄音中按照切分規(guī)則所切分出的有效錄音,通常為一完整的句子或段落等。由于不同錄音設(shè)備的啟動(dòng)、停止時(shí)間不同以及部分錄音設(shè)備在錄音過(guò)程中可能出現(xiàn)丟幀,暫停現(xiàn)象,因此在對(duì)其他錄音設(shè)備的錄音切分時(shí),需要將短時(shí)參考錄音與目標(biāo)長(zhǎng)時(shí)錄音(即關(guān)聯(lián)的相同長(zhǎng)時(shí)錄音)先進(jìn)行對(duì)齊處理。其中,利用短時(shí)參考錄音對(duì)多個(gè)相關(guān)聯(lián)的長(zhǎng)時(shí)錄音分別進(jìn)行對(duì)齊,可以是采用在多個(gè)所述相關(guān)聯(lián)的長(zhǎng)時(shí)錄音中分別搜索短時(shí)參考錄音來(lái)實(shí)現(xiàn),此方法需要對(duì)每句短錄音都搜索,搜索范圍比較大且容易導(dǎo)致對(duì)齊出錯(cuò)。進(jìn)一步的,利用短時(shí)參考錄音對(duì)多個(gè)相關(guān)聯(lián)的長(zhǎng)時(shí)錄音分別進(jìn)行對(duì)齊,還可以采本文檔來(lái)自技高網(wǎng)...
    一種多設(shè)備錄音的自動(dòng)切分對(duì)齊方法

    【技術(shù)保護(hù)點(diǎn)】
    一種多設(shè)備錄音的自動(dòng)切分對(duì)齊方法,其特征在于,包括步驟:將不同形式的多個(gè)原始錄音對(duì)應(yīng)處理成同一格式的多個(gè)長(zhǎng)時(shí)錄音;將多個(gè)所述長(zhǎng)時(shí)錄音中所包含的相同長(zhǎng)時(shí)錄音進(jìn)行關(guān)聯(lián);利用短時(shí)參考錄音對(duì)相關(guān)聯(lián)的長(zhǎng)時(shí)錄音分別進(jìn)行對(duì)齊,然后切分成與所述短時(shí)參考錄音對(duì)應(yīng)的短時(shí)錄音。

    【技術(shù)特征摘要】
    1.一種多設(shè)備錄音的自動(dòng)切分對(duì)齊方法,其特征在于,包括步驟:將不同形式的多個(gè)原始錄音對(duì)應(yīng)處理成同一格式的多個(gè)長(zhǎng)時(shí)錄音;將多個(gè)所述長(zhǎng)時(shí)錄音中所包含的相同長(zhǎng)時(shí)錄音進(jìn)行關(guān)聯(lián);利用短時(shí)參考錄音對(duì)相關(guān)聯(lián)的長(zhǎng)時(shí)錄音分別進(jìn)行對(duì)齊,然后切分成與所述短時(shí)參考錄音對(duì)應(yīng)的短時(shí)錄音。2.如權(quán)利要求1所述多設(shè)備錄音的自動(dòng)切分對(duì)齊方法,其特征在于,所述長(zhǎng)時(shí)錄音是指不同錄音設(shè)備自其錄音開始時(shí)刻至結(jié)束時(shí)刻不間斷采集的全部錄音,包括有效錄音與無(wú)效錄音;所述短時(shí)錄音指自所述長(zhǎng)時(shí)錄音中切分出的有效錄音。3.如權(quán)利要求1所述多設(shè)備錄音的自動(dòng)切分對(duì)齊方法,其特征在于,所述原始錄音包括原始短時(shí)錄音與原始長(zhǎng)時(shí)錄音,分別通過(guò)以下步驟形成所述長(zhǎng)時(shí)錄音;對(duì)原始長(zhǎng)時(shí)錄音,則在原始長(zhǎng)時(shí)錄音解壓后進(jìn)行統(tǒng)一格式轉(zhuǎn)換,并按統(tǒng)一采樣率對(duì)原始長(zhǎng)時(shí)錄音重新采樣,從而形成所述長(zhǎng)時(shí)錄音;對(duì)原始短時(shí)錄音,則在原始短時(shí)錄音解壓后進(jìn)行統(tǒng)一格式轉(zhuǎn)換,并按統(tǒng)一采樣率對(duì)原始短時(shí)錄音重新采樣后,將原始短時(shí)錄音根據(jù)時(shí)間戳拼接成所述長(zhǎng)時(shí)錄音。4.如權(quán)利要求1所述多設(shè)備錄音的自動(dòng)切分對(duì)齊方法,其特征在于,利用短時(shí)參考錄音對(duì)多個(gè)相關(guān)聯(lián)的長(zhǎng)時(shí)錄音分別進(jìn)行對(duì)齊,是采用在多個(gè)所述相關(guān)聯(lián)的長(zhǎng)時(shí)錄音中分別搜索短時(shí)參考錄音來(lái)實(shí)現(xiàn)。5.如權(quán)利要求1所述多設(shè)備錄音的自動(dòng)切分...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:吳妍鄭羲光
    申請(qǐng)(專利權(quán))人:北京慧聽(tīng)科技有限公司
    類型:發(fā)明
    國(guó)別省市:北京,11

    網(wǎng)友詢問(wèn)留言 已有0條評(píng)論
    • 還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

    1
    主站蜘蛛池模板: 精品无码国产一区二区三区麻豆| 亚洲AV无码久久久久网站蜜桃 | 免费无码国产V片在线观看| 四虎国产精品永久在线无码| 国产成人精品一区二区三区无码 | 亚洲AV成人噜噜无码网站| 日产无码1区2区在线观看| 亚洲av无码一区二区三区乱子伦| 少妇爆乳无码专区| 台湾无码一区二区| 亚洲中文久久精品无码| 国产成年无码v片在线| 在线看片无码永久免费视频| 一本色道无码不卡在线观看| 伊人久久大香线蕉无码麻豆| 无码人妻一区二区三区一| 亚洲va无码手机在线电影| 久久精品无码av| 日韩aⅴ人妻无码一区二区| 无码福利一区二区三区| 无码AV天堂一区二区三区| 亚洲色无码专区在线观看| 无码欧精品亚洲日韩一区夜夜嗨| 人妻aⅴ中文字幕无码| 麻豆AV无码精品一区二区| 亚洲va成无码人在线观看| 日韩人妻无码一区二区三区99| 少妇性饥渴无码A区免费 | 亚洲爆乳无码专区| 久久亚洲av无码精品浪潮| 无码日韩人妻AV一区免费l| 成人免费无遮挡无码黄漫视频| 精品无码综合一区二区三区| 午夜无码性爽快影院6080| 亚洲精品久久无码| 国产强被迫伦姧在线观看无码| 国产午夜av无码无片久久96| 无码人妻aⅴ一区二区三区有奶水| 日韩av无码成人无码免费| 无码人妻av一区二区三区蜜臀| 国产精品爽爽va在线观看无码|