• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    確定文本語音單元的方法及系統技術方案

    技術編號:14117252 閱讀:93 留言:0更新日期:2016-12-08 00:21
    本發明專利技術公開了一種確定文本語音單元的方法及系統,該方法包括:接收待處理文本;確定所述待處理文本的音素集合;根據所述音素集合對所述待處理文本進行字音轉換,得到所述待處理文本的語音符號序列;確定所述語音符號序列中的各音節結構;在各音節結構內,將聲學層面緊密結合的音素組合在一起擴充為音素串;根據所述音素串及所述語音符號序列確定所述待處理文本的語音單元。利用本發明專利技術,可以有效避免緊密結合的語音單元被強行拆分的問題。

    【技術實現步驟摘要】

    本專利技術涉及語音信息處理
    ,具體涉及一種確定文本語音單元的方法及系統
    技術介紹
    在互聯網技術高速發展的今天,智能語音應用已經成為人們生活中不可缺少的方向。語音識別、語音合成及語音搜索等技術的成熟,推動了穿戴式設備、智能家居及車載設備的應用。與此同時,在研究一個語言的語音特性時,需要從語音單元入手,語音單元描述的是一個語言語音系統的基本問題,如何確定語音單元也是研究各語音系統必不可少的語音基礎,所述語音系統比如可以是語音合成系統、語音識別系統。現有的語音單元的確定方法基本上可以分為兩種:即直接使用音素或聲韻母作為語音單元,比如,對于音素語言,如英語等西方語言,一般直接使用音素作為基本語音單元;對于音節語言,如中文,一般直接使用聲韻母作為基本語音單元。現有的基本語音單元一般是建立在語音系統的基礎上的,而未考慮連續語音的實際聲學表現,進而會產生如下問題:(1)由于連續語音是由人的發音器官連續變化產生的,因此,在聲學層面上會存在一些結合緊密的語音單元很難分割。而現有方法直接使用音素或聲韻母作為基本語音單元時,一般是強制將這些結合緊密的語音單元分開,造成語音系統效果的下降。如拼接語音合成時,在語音單元拼接點處經常會出現跳變的情況。(2)為了表現詞義或語義,連續語音在語法單元層面上存在不同的韻律表現,如語音單元在前綴、中綴、后綴等不同語法單元位置時韻律表現是不同的。現有方法未考慮語音單元在語法單元層面的韻律表現,從而影響語音系統語義的表現或理解。如語音合成時,將本來屬于前綴的語音單元在合成時放到了后綴上,造成合成語音在韻律上存在嚴重問題,導致合成的語音不自然,影
    響合成語音所要表達的語義。
    技術實現思路
    本專利技術實施例提供一種確定文本語音單元的方法及系統,以避免緊密結合的語音單元被強行拆分的問題。為此,本專利技術實施例提供如下技術方案:一種確定文本語音單元的方法,包括:接收待處理文本;確定所述待處理文本的音素集合;根據所述音素集合對所述待處理文本進行字音轉換,得到所述待處理文本的語音符號序列;確定所述語音符號序列中的各音節結構;在各音節結構內,將聲學層面緊密結合的音素組合在一起擴充為音素串;根據所述音素串及所述語音符號序列確定所述待處理文本的語音單元。優選地,所述確定所述語音符號序列中的各音節結構包括:對基本音素進行分類;確定基于所述分類的音素結構表示形式;根據所述音素結構的表示形式,確定音節結構的表示形式;根據所述音節結構的表示形式確定所述語音符號序列中的各音節結構。優選地,所述基本音素的類型包括:輔音頭、介音、元音核、響輔音尾、輔音尾;所述音素串的類型包括:輔音群音素串,和/或依據音節結構擴充的音素串;所述將聲學層面緊密結合的音素組合在一起擴充為音素串包括:將所述輔音頭Ci、響輔音尾Cs、輔音尾Ct擴充為包含兩個或兩個以上基本音素的音素串;和/或將一個音節結構內符合預先確定的音素串組成形式的連續音素組合為一個音素串。優選地,所述方法還包括:根據所述音素串在大量文本中出現的頻率對所述音素串進行篩選,得到篩
    選后的音素串;所述根據所述音素串及所述語音符號序列確定所述待處理文本的語音單元包括:根據篩選后的音素串及所述語音符號序列確定所述待處理文本的語音單元。優選地,所述根據所述音素串在大量文本中出現的頻率對所述音素串進行篩選,得到篩選后的音素串包括:獲取所述音素串所在音節在語法單元中的位置信息,并將內容相同位置不同的音素串標記為不同的音素串;統計各音素串在與待處理文本相同語種的大量文本數據中出現的頻率;根據所述音素串在大量文本數據中出現的頻率對音素串進行篩選,得到篩選后的音素串。優選地,所述方法還包括:在確定所述語音符號序列中的各音節結構之前,判斷所述待處理文本的語言類型;如果所述待處理文本為音節語言,則將所述語音符號序列中的聲韻母轉換為對應的音素。一種確定文本語音單元的系統,包括:接收模塊,用于接收待處理文本;音素集合獲取模塊,用于確定所述待處理文本的音素集合;字音轉換模塊,用于根據所述音素集合對所述待處理文本進行字音轉換,得到所述待處理文本的語音符號序列;音節結構劃分模塊,用于確定所述語音符號序列中的各音節結構;擴充模塊,用于在各音節結構內,將聲學層面緊密結合的音素組合在一起擴充為音素串;語音單元提取模塊,用于根據所述音素串及所述語音符號序列確定所述待處理文本的語音單元。優選地,所述音節結構劃分模塊包括:分類單元,用于對基本音素進行分類;表示形式確定單元,用于確定基于所述分類的音素結構表示形式,并根據所述音素結構的表示形式,確定音節結構的表示形式;音節結構確定單元,用于根據所述音節結構的表示形式確定所述語音符號序列中的各音節結構。優選地,所述基本音素的類型包括:輔音頭、介音、元音核、響輔音尾、輔音尾;所述音素串的類型包括:輔音群音素串,和/或依據音節結構擴充的音素串;所述擴充模塊,具體用于將所述輔音頭Ci、響輔音尾Cs、輔音尾Ct擴充為包含兩個或兩個以上基本音素的音素串;和/或將一個音節結構內符合預先確定的音素串組成形式的連續音素組合為一個音素串。優選地,所述系統還包括:篩選模塊,用于根據所述音素串在大量文本中出現的頻率對所述音素串進行篩選,得到篩選后的音素串;所述語音單元提取模塊根據所述篩選模塊篩選后的音素串及所述語音符號序列確定所述待處理文本的語音單元。優選地,所述篩選模塊包括:位置信息獲取單元,用于獲取所述音素串所在音節在語法單元中的位置信息,并將內容相同位置不同的音素串標記為不同的音素串;統計單元,用于統計各音素串在與待處理文本相同語種的大量文本數據中出現的頻率;篩選單元,用于根據所述音素串在大量文本數據中出現的頻率對音素串進行篩選,得到篩選后的音素串。優選地,所述系統還包括:判斷模塊,用于在所述音節結構劃分模塊確定所述語音符號序列中的各音節結構之前,判斷所述待處理文本的語言類型;調整模塊,用于在所述判斷模塊判斷所述待處理文本為音節語言后,將所述語音符號序列中的聲韻母轉換為對應的音素。本專利技術實施例提供的確定文本語音單元的方法及系統,通過將音節結構內聲學層面緊密結合的音素組合在一起擴充為音素串,將音素串作為一個語音單
    元,有效地避免了緊密結合的語音單元被強行拆分的情況。進一地,根據音素串在大量文本中出現的頻率對擴充后的音素串進行篩選,并且將內容相同位置不同的音素串作為不同的音素串,從而篩選出常用音素串,使得擴充后的音素串表示的語音單元更有效,而且可以更準確地體現語音單元在語法單元層面的韻律表現。附圖說明為了更清楚地說明本申請實施例或現有技術中的技術方案,下面將對實施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本專利技術中記載的一些實施例,對于本領域普通技術人員來講,還可以根據這些附圖獲得其他的附圖。圖1是本專利技術實施例確定文本語音單元的方法的流程圖;圖2是本專利技術實施例確定文本語音單元的系統的一種結構示意圖;圖3是本專利技術實施例確定文本語音單元的系統的另一種結構示意圖;圖4是本專利技術實施例確定文本語音單元的系統的另一種結構示意圖。具體實施方式為了使本
    的人員更好地理解本專利技術實施例的方案,下面結合附圖和實施方式對本專利技術實施例作進一步的詳細說本文檔來自技高網
    ...
    確定文本語音單元的方法及系統

    【技術保護點】
    一種確定文本語音單元的方法,其特征在于,包括:接收待處理文本;確定所述待處理文本的音素集合;根據所述音素集合對所述待處理文本進行字音轉換,得到所述待處理文本的語音符號序列;確定所述語音符號序列中的各音節結構;在各音節結構內,將聲學層面緊密結合的音素組合在一起擴充為音素串;根據所述音素串及所述語音符號序列確定所述待處理文本的語音單元。

    【技術特征摘要】
    1.一種確定文本語音單元的方法,其特征在于,包括:接收待處理文本;確定所述待處理文本的音素集合;根據所述音素集合對所述待處理文本進行字音轉換,得到所述待處理文本的語音符號序列;確定所述語音符號序列中的各音節結構;在各音節結構內,將聲學層面緊密結合的音素組合在一起擴充為音素串;根據所述音素串及所述語音符號序列確定所述待處理文本的語音單元。2.根據權利要求1所述的方法,其特征在于,所述確定所述語音符號序列中的各音節結構包括:對基本音素進行分類;確定基于所述分類的音素結構表示形式;根據所述音素結構的表示形式,確定音節結構的表示形式;根據所述音節結構的表示形式確定所述語音符號序列中的各音節結構。3.根據權利要求2所述的方法,其特征在于,所述基本音素的類型包括:輔音頭Ci、介音Cj、元音核Vc、響輔音尾Cs、輔音尾Ct;所述音素串的類型包括:輔音群音素串,和/或依據音節結構擴充的音素串;所述將聲學層面緊密結合的音素組合在一起擴充為音素串包括:將所述輔音頭Ci、響輔音尾Cs、輔音尾Ct擴充為包含兩個或兩個以上基本音素的音素串;和/或將一個音節結構內符合預先確定的音素串組成形式的連續音素組合為一個音素串。4.根據權利要求1至3任一項所述的方法,其特征在于,所述方法還包括:根據所述音素串在大量文本中出現的頻率對所述音素串進行篩選,得到篩選后的音素串;所述根據所述音素串及所述語音符號序列確定所述待處理文本的語音單元包括:根據篩選后的音素串及所述語音符號序列確定所述待處理文本的語音單
    \t元。5.根據權利要求4所述的方法,其特征在于,所述根據所述音素串在大量文本中出現的頻率對所述音素串進行篩選,得到篩選后的音素串包括:獲取所述音素串所在音節在語法單元中的位置信息,并將內容相同位置不同的音素串標記為不同的音素串;統計各音素串在與待處理文本相同語種的大量文本數據中出現的頻率;根據所述音素串在大量文本數據中出現的頻率對音素串進行篩選,得到篩選后的音素串。6.根據權利要求1至3任一項所述的方法,其特征在于,所述方法還包括:在確定所述語音符號序列中的各音節結構之前,判斷所述待處理文本的語言類型;如果所述待處理文本為音節語言,則將所述語音符號序列中的聲韻母轉換為對應的音素。7.一種確定文本語音單元的系統,其特征在于,包括:接收模塊,用于接收...

    【專利技術屬性】
    技術研發人員:祖漪清王影胡國平胡郁劉慶峰
    申請(專利權)人:科大訊飛股份有限公司
    類型:發明
    國別省市:安徽;34

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 国产丰满乱子伦无码专| 亚洲精品一级无码中文字幕| 亚洲成在人线在线播放无码| 亚洲av永久无码精品秋霞电影秋 | 无码精品A∨在线观看中文| 人妻丰满av无码中文字幕| 亚洲日韩精品无码专区网址| 亚洲a无码综合a国产av中文 | 国产精品无码无卡无需播放器| 精品无码AV一区二区三区不卡 | 日韩乱码人妻无码中文字幕视频| 亚洲AV无码不卡在线播放| 国产激情无码视频在线播放性色| 亚洲人成无码www久久久| 50岁人妻丰满熟妇αv无码区| 激情无码人妻又粗又大中国人| a级毛片免费全部播放无码| 精品人妻系列无码人妻免费视频| 亚洲精品无码久久| 免费A级毛片无码A∨免费| 成人无码网WWW在线观看| 国产∨亚洲V天堂无码久久久| 无码国模国产在线观看免费| 日韩乱码人妻无码中文字幕视频| 亚洲精品中文字幕无码AV| 无码国产精品一区二区免费16 | 成在人线av无码免费高潮水| 无码人妻aⅴ一区二区三区| 亚洲av无码一区二区三区在线播放| 亚洲av无码一区二区三区观看| 无码中文人妻视频2019| 亚洲Av无码专区国产乱码DVD | 亚洲精品无码av人在线观看| 国产网红主播无码精品 | 无码人妻一区二区三区免费n鬼沢| 在线播放无码高潮的视频| 亚洲欧洲自拍拍偷午夜色无码| 亚洲中文字幕无码不卡电影| 国产V亚洲V天堂A无码| 人妻丰满熟妇AV无码片| 亚洲精品无码不卡在线播放|