【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)涉及自然語言處理領(lǐng)域,具體涉及一種多語種混語文本字音轉(zhuǎn)換方法及系統(tǒng)。
技術(shù)介紹
隨著世界經(jīng)濟、文化交流的日益增多,以及互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,全球信息化程度迅速提高,進而產(chǎn)生大量新詞、新術(shù)語。然而,并不是所有語種都可以完全表達所有新詞、新術(shù)語。因此,在一個語種文本中經(jīng)常會出現(xiàn)其它語種的文本,即混語文本,如“APEC成立于1989年”,“Microsoft Office是微軟公司開發(fā)的一套辦公軟件”等中文中混有英文文本的情況。一般混語文本的主語種是預(yù)先確定的,所述主語種文本占據(jù)混語文本的主要內(nèi)容,非主語種的文本稱為次語種文本。由于不同語種在聲學(xué)層面有很大區(qū)別,如主語種為中文,次語種為英文時,中文詞由單音節(jié)字組成,每個音節(jié)都有聲調(diào),所述聲調(diào)表示基頻高低變化;英文詞音節(jié)個數(shù)為一個或多個,詞內(nèi)重音落在其中一個音節(jié)上,所述重音表示聲強大小變化。因此,混語文本的字音轉(zhuǎn)換必須考慮主語種與次語種連接處韻律的平穩(wěn)性。而現(xiàn)有的混語文本字音轉(zhuǎn)換方法一般是針對混語文本中每個語種使用各自的字音轉(zhuǎn)換方法,即主語種使用主語種字音轉(zhuǎn)換方法,次語種使用次語種字音轉(zhuǎn)換方法,最后將主、次語種字音轉(zhuǎn)換后的語音符號序列相連接得到混語文本字音轉(zhuǎn)換后的語音符號序列。顯然現(xiàn)有方法容易造成混語文本中主語種和次語種連接處的韻律感較差,韻律不平穩(wěn)的現(xiàn)象,從而降低應(yīng)用效果。如混語文本的拼接語音合成系統(tǒng)中,主語種和次語種的合成語音段拼接處容易出現(xiàn)韻律平穩(wěn)性較差,韻律變化較突兀的現(xiàn)象,嚴(yán)重影響混語文本合成語音的自然度。因此,如何對混語文本進行字音轉(zhuǎn)換,使得到的語音符號序列在主語種和次語種連接處的韻律更加平 ...
【技術(shù)保護點】
一種多語種混語文本字音轉(zhuǎn)換方法,其特征在于,包括:接收待處理多語種混語文本;確定所述混語文本中的主語種文本及次語種文本;采用統(tǒng)一發(fā)音符號對所述混語文本中的主語種文本和次語種文本分別進行字音轉(zhuǎn)換,得到主語種文本語音符號序列和次語種文本語音符號序列;修正所述次語種文本語音符號序列的韻律;連接所述主語種文本語音符號序列及修正后的次語種文本語音符號序列,得到混語文本語音符號序列。
【技術(shù)特征摘要】
1.一種多語種混語文本字音轉(zhuǎn)換方法,其特征在于,包括:接收待處理多語種混語文本;確定所述混語文本中的主語種文本及次語種文本;采用統(tǒng)一發(fā)音符號對所述混語文本中的主語種文本和次語種文本分別進行字音轉(zhuǎn)換,得到主語種文本語音符號序列和次語種文本語音符號序列;修正所述次語種文本語音符號序列的韻律;連接所述主語種文本語音符號序列及修正后的次語種文本語音符號序列,得到混語文本語音符號序列。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定所述混語文本中的主語種文本及次語種文本包括:根據(jù)各語種詞典或通過字符編碼確定當(dāng)前文本是主語種文本還是次語種文本。3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述修正...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:閆潤強,蘇增亮,姚佳,祖漪清,王影,胡國平,胡郁,劉慶峰,
申請(專利權(quán))人:訊飛智元信息科技有限公司,
類型:發(fā)明
國別省市:安徽;34
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。