• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    多語種混語文本字音轉(zhuǎn)換方法及系統(tǒng)技術(shù)方案

    技術(shù)編號:13796087 閱讀:123 留言:0更新日期:2016-10-06 14:33
    本發(fā)明專利技術(shù)公開了一種多語種混語文本字音轉(zhuǎn)換方法及系統(tǒng),該方法包括:接收待處理多語種混語文本;確定所述混語文本中的主語種文本及次語種文本;采用統(tǒng)一發(fā)音符號對所述混語文本中的主語種文本和次語種文本分別進行字音轉(zhuǎn)換,得到主語種文本語音符號序列和次語種文本語音符號序列;修正所述次語種文本語音符號序列的韻律;連接所述主語種文本語音符號序列及修正后的次語種文本語音符號序列,得到混語文本語音符號序列。利用本發(fā)明專利技術(shù),可以使主語種文本語音符號序列和次語種文本語音符號序列連接處的韻律感更平穩(wěn)。

    【技術(shù)實現(xiàn)步驟摘要】

    本專利技術(shù)涉及自然語言處理領(lǐng)域,具體涉及一種多語種混語文本字音轉(zhuǎn)換方法及系統(tǒng)
    技術(shù)介紹
    隨著世界經(jīng)濟、文化交流的日益增多,以及互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,全球信息化程度迅速提高,進而產(chǎn)生大量新詞、新術(shù)語。然而,并不是所有語種都可以完全表達所有新詞、新術(shù)語。因此,在一個語種文本中經(jīng)常會出現(xiàn)其它語種的文本,即混語文本,如“APEC成立于1989年”,“Microsoft Office是微軟公司開發(fā)的一套辦公軟件”等中文中混有英文文本的情況。一般混語文本的主語種是預(yù)先確定的,所述主語種文本占據(jù)混語文本的主要內(nèi)容,非主語種的文本稱為次語種文本。由于不同語種在聲學(xué)層面有很大區(qū)別,如主語種為中文,次語種為英文時,中文詞由單音節(jié)字組成,每個音節(jié)都有聲調(diào),所述聲調(diào)表示基頻高低變化;英文詞音節(jié)個數(shù)為一個或多個,詞內(nèi)重音落在其中一個音節(jié)上,所述重音表示聲強大小變化。因此,混語文本的字音轉(zhuǎn)換必須考慮主語種與次語種連接處韻律的平穩(wěn)性。而現(xiàn)有的混語文本字音轉(zhuǎn)換方法一般是針對混語文本中每個語種使用各自的字音轉(zhuǎn)換方法,即主語種使用主語種字音轉(zhuǎn)換方法,次語種使用次語種字音轉(zhuǎn)換方法,最后將主、次語種字音轉(zhuǎn)換后的語音符號序列相連接得到混語文本字音轉(zhuǎn)換后的語音符號序列。顯然現(xiàn)有方法容易造成混語文本中主語種和次語種連接處的韻律感較差,韻律不平穩(wěn)的現(xiàn)象,從而降低應(yīng)用效果。如混語文本的拼接語音合成系統(tǒng)中,主語種和次語種的合成語音段拼接處容易出現(xiàn)韻律平穩(wěn)性較差,韻律變化較突兀的現(xiàn)象,嚴(yán)重影響混語文本合成語音的自然度。因此,如何對混語文本進行字音轉(zhuǎn)換,使得到的語音符號序列在主語種和次語種連接處的韻律更加平穩(wěn)成為研究人員的重要研究任務(wù)。
    技術(shù)實現(xiàn)思路
    本專利技術(shù)實施例提供一種多語種混語文本字音轉(zhuǎn)換方法及系統(tǒng),以使主語種文本語音符號序列和次語種文本語音符號序列連接處的韻律感更平穩(wěn)。為此,本專利技術(shù)實施例提供如下技術(shù)方案:一種多語種混語文本字音轉(zhuǎn)換方法,包括:接收待處理多語種混語文本;確定所述混語文本中的主語種文本及次語種文本;采用統(tǒng)一發(fā)音符號對所述混語文本中的主語種文本和次語種文本分別進行字音轉(zhuǎn)換,得到主語種文本語音符號序列和次語種文本語音符號序列;修正所述次語種文本語音符號序列的韻律;連接所述主語種文本語音符號序列及修正后的次語種文本語音符號序列,得到混語文本語音符號序列。優(yōu)選地,所述確定所述混語文本中的主語種文本及次語種文本包括:根據(jù)各語種詞典或通過字符編碼確定當(dāng)前文本是主語種文本還是次語種文本。優(yōu)選地,所述修正所述次語種文本語音符號序列的韻律包括以下任意一種或多種修正:對主語種缺失的次語種發(fā)音符號的發(fā)音進行修正;對次語種音節(jié)結(jié)構(gòu)進行修正;對次語種韻律特征進行修正。優(yōu)選地,所述對主語種缺失的次語種發(fā)音符號的發(fā)音進行修正包括:將所述次語種發(fā)音符號映射為主語種發(fā)音最相近的發(fā)音符號;或者對主語種缺失的次語種發(fā)音符號進行錄音。優(yōu)選地,所述對次語種音節(jié)結(jié)構(gòu)進行修正包括:對于次語種中的音節(jié)結(jié)構(gòu)Ci$V$Ct,Ci為輔音頭,V為元音核,Ct為輔音尾,如果次語種音節(jié)結(jié)構(gòu)Ci$V$Ct中的Ci和Ct在主語種中不出現(xiàn),則根據(jù)主語種輔音頭集合{Ci本文檔來自技高網(wǎng)
    ...

    【技術(shù)保護點】
    一種多語種混語文本字音轉(zhuǎn)換方法,其特征在于,包括:接收待處理多語種混語文本;確定所述混語文本中的主語種文本及次語種文本;采用統(tǒng)一發(fā)音符號對所述混語文本中的主語種文本和次語種文本分別進行字音轉(zhuǎn)換,得到主語種文本語音符號序列和次語種文本語音符號序列;修正所述次語種文本語音符號序列的韻律;連接所述主語種文本語音符號序列及修正后的次語種文本語音符號序列,得到混語文本語音符號序列。

    【技術(shù)特征摘要】
    1.一種多語種混語文本字音轉(zhuǎn)換方法,其特征在于,包括:接收待處理多語種混語文本;確定所述混語文本中的主語種文本及次語種文本;采用統(tǒng)一發(fā)音符號對所述混語文本中的主語種文本和次語種文本分別進行字音轉(zhuǎn)換,得到主語種文本語音符號序列和次語種文本語音符號序列;修正所述次語種文本語音符號序列的韻律;連接所述主語種文本語音符號序列及修正后的次語種文本語音符號序列,得到混語文本語音符號序列。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定所述混語文本中的主語種文本及次語種文本包括:根據(jù)各語種詞典或通過字符編碼確定當(dāng)前文本是主語種文本還是次語種文本。3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述修正...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:閆潤強蘇增亮姚佳祖漪清王影胡國平胡郁劉慶峰
    申請(專利權(quán))人:訊飛智元信息科技有限公司
    類型:發(fā)明
    國別省市:安徽;34

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 久久久久无码精品国产| av潮喷大喷水系列无码| 亚洲av无码乱码在线观看野外| 国产精品va无码免费麻豆| 精品人妻无码专区中文字幕| 久久精品中文字幕无码绿巨人| 亚洲高清无码综合性爱视频| 精品日韩亚洲AV无码一区二区三区| 无码少妇一区二区浪潮av| 精品无码一区二区三区在线| 深夜a级毛片免费无码| 久久久久成人精品无码中文字幕| 精品一区二区无码AV| 亚洲av无码成人精品区一本二本| 久久精品无码一区二区三区| 国产精品亚洲а∨无码播放麻豆| 无码少妇一区二区三区| HEYZO无码综合国产精品| 性饥渴少妇AV无码毛片| 久久午夜夜伦鲁鲁片无码免费| AV无码小缝喷白浆在线观看| 亚洲中文字幕无码一久久区| 丰满亚洲大尺度无码无码专线| 亚洲综合无码一区二区| 中文字幕丰满伦子无码| 在线精品自拍无码| 无码专区国产无套粉嫩白浆内射| 内射精品无码中文字幕| 亚洲AV无码成人精品区日韩| 亚洲天然素人无码专区| 久久Av无码精品人妻系列| 日韩免费人妻AV无码专区蜜桃| 亚洲精品无码专区久久久| 国产午夜精品无码| 无码国产福利av私拍| 精品亚洲A∨无码一区二区三区| 无码国产精品一区二区免费式芒果| 无码精品人妻一区二区三区人妻斩 | 国产网红主播无码精品| 国产精品热久久无码av| 亚洲欧洲无码AV电影在线观看|