本發明專利技術公開了一種個性化語音采集與語義確定系統及其方法,語音采集模塊,采集發音者說話時發音器官發出的語音;語音單元模塊,對語音采集模塊采集到的語音進行分類整理,以單音節、雙音節、多音節為單位建立語音單元;語音數據庫,以語音單元為基本單位建立語音數據庫;語義數據庫;語音對應語義數據庫,將語音數據庫的語音單元與語義數據庫的文本文字一一對應,建立語音對應語義數據庫;語義規范模塊和語音對應標準語義數據庫。本發明專利技術由發音者直接確定語音與語義文本文字的對應關系,對發音者沒有要求,無需對發音者進行訓練,也無需對系統進行訓練,正確率在99.9%。
【技術實現步驟摘要】
本專利技術涉及一種語音系統,具體為一種。
技術介紹
隨著時代的發展,各地區各民族人與人之間的交流越來越頻繁,隨著軟件系統的發展,人與機器的交流也越來越頻繁。在不同民族、不同地區之間的人相互交流時,由于語種或方言的不同,每個人都有他自己的個性化語音、個性化語法、個性化詞匯范疇,當他發出一個聲音或說出一句話時,可能只有他自己能準確無誤地明白所要表達的意義,他的親人、朋友、熟人因習慣了他的個性化語音,能較好地明白其語意,然而,陌生人就可能不能準確無誤地明白他的聲音所要表達的意義,非同一地方語系、非同一國家語言者就更不能明白他的聲音所表達的意思。近十多年來,國內外出現了多種語音轉化為文本文字的軟硬件。這些軟硬件是針對某種語言、某種語系設計的軟件和制造的硬件,通過建立本國家語言、本地方語系標準的語音數據庫,對應能準確表達意義的文本文字,建立語音與文本文字的轉化系統。但系統接收到的語音全部是個性化語音,當系統接收到個性化的語音時,系統對語音進行分析,提取參數,確定語意,轉化成文本文字。這個難度是相當大的,難度之一數據庫龐大,但依然不能囊括本國語言、本地語系的所有個性化語音;難度之二 復雜的分析程序和過程,但依然不能準確無誤地分析出發音者的語音所要表達的意思。為了解決這些問題,這類軟硬件需要對使用者進行培訓,就是說要說出標準的本國語言、本地語系的語音,或者對軟硬件系統進行培訓,就是說要讓事先按本國本地標準語音設計好的軟硬件系統來適應使用者的個性化語音,本末倒置,同樣不能達到理想的效果。譬如IBM ViaVoice語音識別系統(語音輸入語音控制)專利技術出來后,向全世界宣 布這是一場解放雙手的革命,然而十多年過去了,人們普遍還在用雙手輸入信息和操控硬件。微軟的語音輸入系統,讀音要非常標準,電腦才能識別,即使在這種情況下,錯誤率還是很高。漢王手寫板的語音變文字功能,因發音者的普通話不標準,還是不如用手來書寫方便省事。當前日本專利技術的最新語音輸入技術,將聲波先轉化為電磁波,然后用電磁波和聲波原型相對照,并提出最合適的單詞,雖然加入了電磁波,準確性有所提高,但還是沒有解決根本性問題,他們自稱正確率在85%,而且只適合日語。蘋果新iPad語音輸入文字功能,目前只支持英、法、德、日四個語種,同樣需要發音者的發音要標準,Mac系列的產品需要搭配網絡才可使用。美國國防部高級研究計劃局(DARPA )2012年投入大量資金對“泛用語言翻譯計劃”進行技術研發,如果本科技項目攻關成功,就可以實現讓美國士兵們聽懂外國民眾的語言,美國士兵的話實時翻譯成外語,在一些特殊情況下,國家與國家之間要員無需翻譯人員在場實時交流,從而減少知情人數,降低泄密機率,實現完全不了解彼此語言的人與之間的流暢交流。近十年來,與語音相關的軟硬件不斷地被設計和創造出來,應用范圍極其廣泛,但存在著對發音者的要求較高,轉化后的文本文字反映出語音所表達的語意的準確性不高,而普通大眾沒有經過特殊訓練的人,其發音幾乎都不標準,這就是這類軟硬件不能在社會上普及的主要原因,或者只能在一定語系范圍內才可正常使用。文本文字不能準確無誤地表達出發音者的真實意思,成為限制這一行業發展的瓶頸。數據顯示,在中國有159件與語音輸入相關的專利技術專利授權,從95年開始有專利授權,以后逐年上升,到2005年達到最高授權量,為25件,但由于語音轉化為文本文字的準確率問題無法解決,中國和國外一樣這類專利開始逐年下降,到2010年僅有I件。另有數據顯示,中國大陸在這方面的技術成果非常薄弱,授權的這類專利技術專利前8名分別是國際商業機器公司9件,臺達電子工業股份有限公司8件,松下電器產業株式會社7件,微軟公司7件,株式會社建伍5件,索尼公司5件,日本電氣株式會社5件,三星電子株式會社4件,沒有一家中國大陸的公司。為什么現有的這類系統不能準確無誤地表達發音者的真實意思呢?是因為全世界這類語音軟硬件的設計者都走進了一個誤區認為人發出的聲波(語音)本身具有含義,是信息的載體,于是采取“分析語音提取參數”、“語音識別來確定語義”、“語言解碼”、“語音信息拾取”等等方法,來使音頻音波轉化為文本文字,其實聲波(語音)本身沒有含義,是人類賦予了它含義。為什么現有的這類系統也可以表達發音者的意思呢?是系統設計者采用 了本國語言、本地語系所共認的語音所賦予的含義。所以這類系統總是要求發音者要發出標準的語音、訓練使用者來適應系統、訓練系統來適應發音者。
技術實現思路
本專利技術的目的在于解決語音輸入系統中文本文字不能準確無誤地表達發音者所要表達的意思的不足,提供一種,通過個性語音(由人的發音器官發出的聲音,包括音高、音強、音質、音色、音頻、音長、音速、聲波、聲調)米集器、語言歸正復讀機、口譯機、計算機、手機及各類接受語言指令的等等硬件,采集某個人的語音,由發音者自己確定語音所表達意義的系統和方法。本專利技術采用以下技術方案 一種個性化語音采集與語義確定方法,采用如下步驟 步驟A,發音者發出語音; 步驟B,語音采集模塊采集發音者說話時發音器官發出的語音,語音特征包括音高、音強、音質、音色、音頻、音長、音速、聲波、聲調; 步驟C,對語音采集模塊采集到的語音進行分類整理,以單音節、雙音節、多音節為單位建立語音單元; 步驟D,以語音單元為基本單位建立語音數據庫; 步驟E,由發音者以文本文字定義語音數據庫中的各語音單元,建立語義數據庫; 步驟F,將語音數據庫的語音單元與語義數據庫的文本文字一一對應,建立語音對應語義數據庫; 步驟G,由語義規范模塊對語音對應語義數據庫進行分析規范,將語音對應語義數據庫中的文本文字轉變為標準化大眾化; 步驟H,經語義規范模塊將發音者的語音與標準語義對應,建立語音對應標準語義數據庫。作為優選,所述步驟D中,語音數據庫在接收到新的語音單元時,與語音數據庫的語音單元進行對比,如不相同,則存入語音數據庫。作為優選,所述步驟E采用如下步驟 1)由聲音設備將語音單兀以原發音者的語音復讀出來; 2)發音者將語音單元以自己認為的語義,用文本文字的形式輸入系統; 3)建立發音者的語義數據庫。作為優選,所述步驟G中,語義規范模塊包括語匯分析單元、語法分析單元和習慣用語分析單元,對語音對應語義數據庫進行詞匯分析、語法分析和習慣用語分析。作為優選,所述步驟G中,將語音對應語義數據庫的文本文字根據本國語言本地語系標準的字、詞、句、語法、習慣轉變為標準語義。 一種個性化語音采集與語義確定系統,其中,包括如下部分 語音采集模塊,采集發音者說話時發音器官發出的語音,語音特征包括音高、音強、音質、音色、音頻、音長、音速、聲波、聲調; 語音單元模塊,對語音采集模塊采集到的語音進行分類整理,以單音節、雙音節、多音節為單位建立語音單元; 語音數據庫,以語音單元為基本單位建立語音數據庫; 語義數據庫,由發音者以文本文字定義語音數據庫中的各語音單元; 語音對應語義數據庫,將語音數據庫的語音單元與語義數據庫的文本文字一一對應,建立語音對應語義數據庫; 語義規范模塊,對語音對應語義數據庫進行分析規范,將語音對應語義數據庫的文本文字標準化大眾化; 語音對應標準語義數據庫,經語義規范模塊將發音者的語音與標準語義對應,建立語音對應標本文檔來自技高網...
【技術保護點】
一種個性化語音采集與語義確定方法,其特征在于:采用如下步驟:步驟A,發音者發出語音;步驟B,語音采集模塊采集發音者說話時發音器官發出的語音,語音特征包括:音高、音強、音質、音色、音頻、音長、音速、聲波、聲調;步驟C,對語音采集模塊采集到的語音進行分類整理,以單音節、雙音節、多音節為單位建立語音單元;步驟D,以語音單元為基本單位建立語音數據庫;步驟E,由發音者以文本文字定義語音數據庫中的各語音單元,建立語義數據庫;步驟F,將語音數據庫的語音單元與語義數據庫的文本文字一一對應,建立語音對應語義數據庫;步驟G,由語義規范模塊對語音對應語義數據庫進行分析規范,將語音對應語義數據庫中的文本文字轉變為標準語義;步驟H,經語義規范模塊將發音者的語音與標準語義對應,建立語音對應標準語義數據庫。
【技術特征摘要】
【專利技術屬性】
技術研發人員:楊京廣,張永忠,李樹成,陳培基,劉軍,
申請(專利權)人:河南省佰騰電子科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。