• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種音頻批量分割方法及裝置制造方法及圖紙

    技術編號:15331938 閱讀:101 留言:0更新日期:2017-05-16 15:05
    本發明專利技術適用計算機技術領域,提供了一種音頻批量分割方法及裝置,所述方法包括:獲取錄音文本以及錄音后的音頻,將所述音頻進行語音識別,得到對應的待匹配文本;將所述待匹配文本與所述錄音文本進行匹配;根據預設匹配度,從所述音頻中分割出對應的小音頻段。本發明專利技術將錄音后的音頻通過語音識別得到待匹配文本,將待匹配文本與錄音文本進行匹配后,從音頻中分割出對應的小音頻段,通過語音識別與文本匹配,實現將錄音的音頻,按錄音文本的要求,直接批量分割成多個小音頻段,無需逐個一一加標識再導出分割小音頻段,從而提高拆分效率,節約人力成本以及降低出錯率。

    Audio batch segmentation method and apparatus

    The invention is applied to computer technology, provides an audio volume segmentation method and device, the method comprises: obtaining recording text and audio recording of the audio speech recognition, get the corresponding matching text; the text to be matched with the recording text matching according to the preset matching; the degree of segmentation of small, corresponding to the audio from the audio in. In the invention, after recording audio through voice recognition by matching text, text and audio to be matched text matching, segmentation of small audio segment from the audio, through voice recognition and text matching, to achieve the recording of the audio recording text, according to the requirements of direct batch splitting into multiple small audio section one by one without added one by one mark export segment small audio segments, so as to improve the separation efficiency, saving labor costs and reduce the error rate.

    【技術實現步驟摘要】
    一種音頻批量分割方法及裝置
    本專利技術屬于計算機
    ,尤其涉及一種音頻批量分割方法及裝置。
    技術介紹
    目前根據錄音文本的內容錄制對應的音頻后,需要進行后期音頻處理,將錄音文本的內容分割成多個對應的小音頻段,現有的音頻分割方法是:把音頻導入Audition音頻處理軟件中,通過人工一邊看錄音文本,一邊聽錄音后的音頻,同時將每小段加上標識,之后導出標記有標識的小音頻段,從而完成音頻拆分,該方法依賴人工進行分割,需要花費大量的時間,從而增加人力成本,另外,通過人工去邊看錄音文本邊標記,需要一直集中注意力,否則出錯率很高,后期還需要人工進行校正,保證正確率,效率極低。
    技術實現思路
    本專利技術的目的在于提供一種音頻批量分割方法及裝置,旨在解決現有技術中需要依賴人工對音頻進行分割,導致人力成本過高、分割效率較低以及出錯率較高的問題。一方面,本專利技術提供了一種音頻批量分割方法,所述方法包括下述步驟:獲取錄音文本以及錄音后的音頻,將所述音頻進行語音識別,得到對應的待匹配文本;將所述待匹配文本與所述錄音文本進行匹配;根據預設匹配度,從所述音頻中分割出對應的小音頻段。另一方面,本專利技術提供了一種音頻批量分割裝置,所述裝置包括:待匹配文本識別單元,用于獲取錄音文本以及錄音后的音頻,將所述音頻進行語音識別,得到對應的待匹配文本;文本匹配單元,用于將所述待匹配文本與所述錄音文本進行匹配;以及小音頻分割單元,用于根據預設匹配度,從所述音頻中分割出對應的小音頻段。在本專利技術實施例中,將錄音后的音頻通過語音識別得到待匹配文本,將待匹配文本與錄音文本進行匹配后,從音頻中分割出對應的小音頻段,通過語音識別與文本匹配,實現將錄音的音頻,按錄音文本的要求,直接批量分割成多個小音頻段,無需逐個一一加標識再導出分割小音頻段,從而提高拆分效率,節約人力成本以及降低出錯率。附圖說明圖1是本專利技術實施例一提供的音頻批量分割方法的實現流程圖;以及圖2是本專利技術實施例二提供的音頻批量分割裝置的結構示意圖。具體實施方式為了使本專利技術的目的、技術方案及優點更加清楚明白,以下結合附圖及實施例,對本專利技術進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本專利技術,并不用于限定本專利技術。以下結合具體實施例對本專利技術的具體實現進行詳細描述:實施例一:圖1示出了本專利技術實施例一提供的音頻批量分割方法的實現流程圖,為了便于說明,僅示出了與本專利技術實施例相關的部分,詳述如下:在步驟S101中,獲取錄音文本以及錄音后的音頻,將音頻進行語音識別,得到對應的待匹配文本。在本專利技術實施例中,根據已有的錄音文本進行錄音,得到錄音后的音頻,錄音之后需要對該音頻進行處理,通過語音識別技術得到識別后的待匹配文本,該待匹配文本是對應該音頻識別出的文本數據。進一步地,根據說話的時間間隔,將音頻分割為臨時音頻段;將臨時音頻段進行語音識別,得到對應的待匹配文本。具體地,為了降低數據處理量,可以通過預處理將音頻根據說話的時間間隔進行臨時分割,得到臨時音頻段,然后對該臨時音頻段進行語音識別,得到對應的待匹配文本。在步驟S102中,將待匹配文本與錄音文本進行匹配。在本專利技術實施例中,通過對音頻進行語音識別得到待匹配文本,將待匹配文本與錄音文本進行匹配。進一步地,獲取待匹配文本的字符串;將待匹配文本的字符串與錄音文本的字符串進行逐字符匹配。具體地,獲取待匹配文本的字符串,通過將待匹配文本的字符串與錄音文本的字符串進行逐字符匹配,有效地保證了匹配的精確度,同時提高匹配效率。在步驟S103中,根據預設匹配度,從音頻中分割出對應的小音頻段。在本專利技術實施例中,將待匹配文本與錄音文本進行匹配,根據預設匹配度,從音頻中分割出對應的小音頻段,該小音頻段包括對應字、詞、短語和\或句子的音頻。進一步地,當待匹配文本與錄音文本的匹配度大于預設匹配度時,從音頻中分割出對應的小音頻段。具體地,當待匹配文本與錄音文本的匹配度為全完匹配時,從音頻中分割出對應的小音頻段,還可以通過預設匹配度,將大于預設匹配度的待匹配文本所對應的音頻中分割出對應的小音頻段。根據實際經驗,可以將預設匹配度設定為60%-80%。又進一步地,當待匹配文本與錄音文本的匹配度小于預設匹配度時,從錄音文本中提取出未匹配到的文本。具體地,將待匹配文本與錄音文本進行匹配,當待匹配文本與錄音文本的匹配度小于預設匹配度時,從錄音文本中提取出未匹配到的文本,以便于后期再次對該未匹配到的文本,進一步進行處理。在本專利技術實施例中,將錄音后的音頻通過語音識別得到待匹配文本,將待匹配文本與錄音文本進行匹配后,從音頻中分割出對應的小音頻段,通過語音識別與文本匹配,實現將錄音的音頻,按錄音文本的要求,直接批量分割成多個小音頻段,無需逐個一一加標識再導出分割小音頻段,從而提高拆分效率,節約人力成本以及降低出錯率。本領域普通技術人員可以理解實現上述實施例方法中的全部或部分步驟是可以通過程序來指令相關的硬件來完成,所述的程序可以存儲于一計算機可讀取存儲介質中,所述的存儲介質,如ROM/RAM、磁盤、光盤等。實施例二:圖2示出了本專利技術實施例二提供的音頻批量分割裝置的結構示意圖,為了便于說明,僅示出了與本專利技術實施例相關的部分。在本專利技術實施例中,音頻批量分割裝置包括:待匹配文本識別單元21、文本匹配單元22以及小音頻分割單元23,其中:待匹配文本識別單元21,用于獲取錄音文本以及錄音后的音頻,將音頻進行語音識別,得到對應的待匹配文本。在本專利技術實施例中,根據已有的錄音文本進行錄音,得到錄音后的音頻,錄音之后需要對該音頻進行處理,通過語音識別技術得到識別后的待匹配文本,該待匹配文本是對應該音頻識別出的文本數據。進一步地,該待匹配文本識別單元21包括:臨時分割單元211以及待匹配文本識別子單元212,其中:臨時分割單元211,用于根據說話的時間間隔,將音頻分割為臨時音頻段;以及待匹配文本識別子單元212,用于將臨時音頻段進行語音識別,得到對應的待匹配文本。具體地,為了降低數據處理量,可以通過預處理將音頻根據說話的時間間隔進行臨時分割,得到臨時音頻段,然后對該臨時音頻段進行語音識別,得到對應的待匹配文本。文本匹配單元22,用于將待匹配文本與錄音文本進行匹配。在本專利技術實施例中,通過對音頻進行語音識別得到待匹配文本,將待匹配文本與錄音文本進行匹配。進一步地,該文本匹配單元22包括:字符串單元221以及文本匹配子單元222,其中:字符串單元221,用于獲取待匹配文本的字符串;以及文本匹配子單元222,用于將待匹配文本的字符串與錄音文本的字符串進行逐字符匹配。具體地,獲取待匹配文本的字符串,通過將待匹配文本的字符串與錄音文本的字符串進行逐字符匹配,有效地保證了匹配的精確度,同時提高匹配效率。小音頻分割單元23,用于根據預設匹配度,從音頻中分割出對應的小音頻段。在本專利技術實施例中,將待匹配文本與錄音文本進行匹配,根據預設匹配度,從音頻中分割出對應的小音頻段,該小音頻段包括對應字、詞、短語和\或句子的音頻。進一步地,該小音頻分割單元23,包括:分割子單元231,用于當待匹配文本與錄音文本的匹配度大于預設匹配度時,從音頻中分割出對應的小音頻段,該小音頻段包括對應字、詞、短語和\或句子的音頻。具體地,當待匹配文本與錄音文本的匹配度本文檔來自技高網...
    一種音頻批量分割方法及裝置

    【技術保護點】
    一種音頻批量分割方法,其特征在于,所述方法包括下述步驟:獲取錄音文本以及錄音后的音頻,將所述音頻進行語音識別,得到對應的待匹配文本;將所述待匹配文本與所述錄音文本進行匹配;根據預設匹配度,從所述音頻中分割出對應的小音頻段。

    【技術特征摘要】
    1.一種音頻批量分割方法,其特征在于,所述方法包括下述步驟:獲取錄音文本以及錄音后的音頻,將所述音頻進行語音識別,得到對應的待匹配文本;將所述待匹配文本與所述錄音文本進行匹配;根據預設匹配度,從所述音頻中分割出對應的小音頻段。2.如權利要求1所述的方法,其特征在于,所述獲取錄音文本以及錄音后的音頻,將所述音頻進行語音識別,得到對應的待匹配文本的步驟,包括:根據說話的時間間隔,將所述音頻分割為臨時音頻段;將所述臨時音頻段進行語音識別,得到對應的待匹配文本。3.如權利要求1所述的方法,其特征在于,所述將所述待匹配文本與所述錄音文本進行匹配的步驟,包括:獲取所述待匹配文本的字符串;將所述待匹配文本的字符串與所述錄音文本的字符串進行逐字符匹配。4.如權利要求1所述的方法,其特征在于,所述預設匹配度,從所述音頻中分割出對應的小音頻段的步驟,包括:當所述待匹配文本與所述錄音文本的匹配度大于預設匹配度時,從所述音頻中分割出對應的小音頻段,所述小音頻段包括對應字、詞、短語和\或句子的音頻。5.如權利要求1所述的方法,其特征在于,所述預設匹配度,從所述音頻中分割出對應的小音頻段的步驟,還包括:當所述待匹配文本與所述錄音文本的匹配度小于預設匹配度時,從所述錄音文本中提取出未匹配到的文本。6.一...

    【專利技術屬性】
    技術研發人員:王金龍丁小響吳小龍
    申請(專利權)人:廣東小天才科技有限公司
    類型:發明
    國別省市:廣東,44

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲色无码专区在线观看| 久久久久久亚洲av无码蜜芽| 波多野结衣AV无码| 国产精品成人无码久久久久久| 亚洲AV无码日韩AV无码导航| 激情无码亚洲一区二区三区| 亚洲日韩精品无码一区二区三区| 亚洲午夜无码毛片av久久京东热| 久久精品无码一区二区app| 亚洲AV成人无码网站| 中文无码成人免费视频在线观看| 亚洲AV无码专区在线观看成人| 亚洲AV永久无码精品一百度影院| 国产精品成人一区无码| 亚洲Av无码国产一区二区| 无码h黄动漫在线播放网站| 中文字幕无码AV波多野吉衣| 日韩精品无码久久一区二区三 | 亚洲6080yy久久无码产自国产| 国产成人无码区免费内射一片色欲| 性色av无码不卡中文字幕| 久久亚洲AV无码精品色午夜 | 中文字幕有码无码AV| 无码天堂va亚洲va在线va| 无码日韩人妻av一区免费| 亚洲av无码一区二区三区观看| 无码人妻少妇色欲AV一区二区| 中文字幕无码日韩专区免费| 一区二区三区无码视频免费福利 | 乱色精品无码一区二区国产盗| 中文字幕久久精品无码| 人妻AV中出无码内射| 日韩精品无码人成视频手机 | 亚洲av永久无码| 一区二区无码免费视频网站| 亚洲中文无码卡通动漫野外| 免费无码黄十八禁网站在线观看| 免费无码肉片在线观看| mm1313亚洲精品无码又大又粗| 国产a v无码专区亚洲av| 中文字幕无码AV波多野吉衣|