語音數據句類識別方法和裝置及系統(tǒng)制造方法及圖紙

技術編號：15439037 閱讀：138 留言：0更新日期：2017-05-26 04:48

本申請?zhí)岢鲆环N語音數據句類識別方法和裝置及系統(tǒng)，該方法包括：接收待識別的語音數據；獲取所述語音數據的句類識別特征，所述句類識別特征包括如下項中的至少一項：聲學句類識別特征，語義句類識別特征；根據預先構建的句類識別模型和所述句類識別特征，識別所述語音數據的句類，所述句類識別模型根據獲取的語音數據樣本的句類識別特征構建得到。該方法能夠解決依據規(guī)則識別句類的局限性，擴展使用范圍，并且可以提高識別準確度。

Speech data sentence class identification method and device and system

The invention provides a voice data sentence recognition method and device and system. The method comprises: receiving the voice data to be identified; obtaining the voice data types of sentence recognition features, the sentence recognition features include at least one of the following: acoustic sentence recognition features, semantic class feature recognition according to the sentence recognition model; pre built and the types of sentence recognition features, identifying the voice data sentence type, the sentence recognition model based on voice data acquisition of samples of sentence recognition feature was constructed. This method can solve the limitations of identifying sentences according to the rules, expand the range of application and improve the accuracy of recognition.

全部詳細技術資料下載

【技術實現步驟摘要】
語音數據句類識別方法和裝置及系統(tǒng)
本申請涉及自然語言處理
，尤其涉及一種語音數據句類識別方法和裝置及系統(tǒng)。
技術介紹
語音數據的句類指按照語音數據中句子的語氣，將句子劃分的類型，如陳述句、祈使句、感嘆句、一般疑問句及特殊疑問句等，不同句類的句子往往具有不同語義，單純從文本語義上很難區(qū)分開，如在智能問答系統(tǒng)中，語音數據“我開通了幾個增值服務”和“我開通了哪幾個增值服務”，二者僅差一個字，但語義完全不同，答案也完全不同，通過句類識別后，得到這兩句語音數據分別屬于不同的句類，第一句的句類為數量類疑問句，第二句的句類為實體類疑問句。為了提高反饋給用戶的答案的準確度，關鍵點之一是識別語音數據的句類。相關技術中，語音數據句類識別方法一般通過編寫每種句類的規(guī)則，將待識別語音數據對應的識別文本與規(guī)則進行匹配，識別出語音數據句類，比如依據包含的關鍵詞識別。然而，由于自然語言的多樣性，單純通過規(guī)則從文本上匹配，局限性較大，很難準確區(qū)分出不同語音數據的句類,尤其是包含相同關鍵詞的語音數據，更難準確區(qū)分出語音數據的句類，如語音數據“怎么用這么快我的話費”和語音數據“怎么查詢話費”，包含共同的疑問詞“怎么”，但是句類不同，第一句為原因類疑問句，第二句為方式類疑問句，僅僅通過規(guī)則的方式很難區(qū)分；此外，相關技術的方法一般只針對疑問句的句類識別，對陳述句、祈使句、感嘆句等非疑問句識別效果較差，應用范圍較小，實用性差。
技術實現思路
本申請旨在至少在一定程度上解決相關技術中的技術問題之一。為此，本申請的一個目的在于提出一種語音數據句類識別方法，該方法可以解決依據規(guī)則識別句類的局限性，擴展...
語音數據句類識別方法和裝置及系統(tǒng)

【技術保護點】
一種語音數據句類識別方法，其特征在于，包括：接收待識別的語音數據；獲取所述語音數據的句類識別特征，所述句類識別特征包括如下項中的至少一項：聲學句類識別特征，語義句類識別特征；根據預先構建的句類識別模型和所述句類識別特征，識別所述語音數據的句類，所述句類識別模型根據獲取的語音數據樣本的句類識別特征構建得到。

【技術特征摘要】
1.一種語音數據句類識別方法，其特征在于，包括：接收待識別的語音數據；獲取所述語音數據的句類識別特征，所述句類識別特征包括如下項中的至少一項：聲學句類識別特征，語義句類識別特征；根據預先構建的句類識別模型和所述句類識別特征，識別所述語音數據的句類，所述句類識別模型根據獲取的語音數據樣本的句類識別特征構建得到。2.根據權利要求1所述的方法，其特征在于，還包括：構建句類識別模型，所述構建句類識別模型包括：獲取語音數據樣本；確定所述語音數據樣本的句類；獲取所述語音數據樣本的句類識別特征；根據所述語音數據樣本的句類識別特征和所述語音數據樣本的句類，進行模型訓練，構建得到句類識別模型。3.根據權利要求1所述的方法，其特征在于，獲取所述語音數據的聲學句類識別特征，包括：對所述語音數據進行劃分，得到所述語音數據包含的多個語音片段；計算所述語音片段的短時平均能量；根據所述短時平均能量確定所述語音數據的聲學句類識別特征。4.根據權利要求3所述的方法，其特征在于，所述根據所述短時平均能量確定聲學句類識別特征，包括：將所有所述短時平均能量組成的向量，確定為所述語音數據的聲學句類識別特征；或者，在所有所述短時平均能量中確定出最大短時平均能量，將所述最大短時平均能量確定為所述語音數據的聲學句類識別特征；或者，將所有所述短時平均能量和最大短時平均能量組成的向量，確定為所述語音數據的聲學句類識別特征。5.根據權利要求1所述的方法，其特征在于，獲取所述語音數據的語義句類識別特征，包括：對所述語音數據進行劃分，得到所述語音數據包含的多個語音片段，以及，從所述多個語音片段中獲取短時平均能量最大的語音片段；根據所述短時平均能量最大的語音片段，獲取擴展后的語音片段對應的文本數據；根據所述文本數據確定所述語音數據的語義句類識別特征。6.根據權利要求5所述的方法，其特征在于，所述語義句類識別特征包括如下項的至少一項：句互信息向量，所述句互信息向量為所述文本數據包含的詞語對應的互信息向量的加權和，所述互信息向量為所述詞語與每種句類之間的互信息組成的向量；句子向量，所述句子向量為所述文本數據包含的詞語對應的詞向量的加權和。7.根據權利要求3或5所述的方法，其特征在于，所述對所述語音數據進行劃分，得到所述語音數據包含的多個語音片段，包括：對所述語音數據進行語音識別，得到對應的整句文本數據；將所述整句文本數據劃分為多個文本片段，并根據所述文本片段對所述語音數據進行劃分，得到多個語音片段。8.根據權利要求7所述的方法，其特征在于，所述根據所述短時平均能量最大的語音片段，獲取擴展后的語音片段對應的文本數據，包括：對所述整句文本數據進行分詞，得到分詞結果；在所述整句文本數據中提取出所述短時平均能量最大的語音片段對應的文本數據，并確定所述提取出的文本數據包含的起始詞語的位置和結束詞語的位置；確定擴展窗的窗口大小；根據所述提取出的文本數據包含的起始詞語的位置和結束詞語的位置，以及所述窗口大小，確定擴展后語音片段對應的文本數據。9.一種語音數據句類識別裝置，其特征在于，包括：接收模塊，用于接收待識別的語音數據；獲取模塊，用于獲取所述語音數據的句類識別特征，所述句類識別特征包括如下項中的至少一項：聲學句類識別特征，語義句類識別特征；識別模塊，用于根據預先構建的句類識別模型和所述句類識別特征，識別所述語...

【專利技術屬性】
技術研發(fā)人員：李莉，司華建，李寶善，
申請(專利權)人：科大訊飛股份有限公司，
類型：發(fā)明
國別省市：安徽,34

全部詳細技術資料下載我是這個專利的主人

相關技術