• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    語音數據句類識別方法和裝置及系統(tǒng)制造方法及圖紙

    技術編號:15439037 閱讀:138 留言:0更新日期:2017-05-26 04:48
    本申請?zhí)岢鲆环N語音數據句類識別方法和裝置及系統(tǒng),該方法包括:接收待識別的語音數據;獲取所述語音數據的句類識別特征,所述句類識別特征包括如下項中的至少一項:聲學句類識別特征,語義句類識別特征;根據預先構建的句類識別模型和所述句類識別特征,識別所述語音數據的句類,所述句類識別模型根據獲取的語音數據樣本的句類識別特征構建得到。該方法能夠解決依據規(guī)則識別句類的局限性,擴展使用范圍,并且可以提高識別準確度。

    Speech data sentence class identification method and device and system

    The invention provides a voice data sentence recognition method and device and system. The method comprises: receiving the voice data to be identified; obtaining the voice data types of sentence recognition features, the sentence recognition features include at least one of the following: acoustic sentence recognition features, semantic class feature recognition according to the sentence recognition model; pre built and the types of sentence recognition features, identifying the voice data sentence type, the sentence recognition model based on voice data acquisition of samples of sentence recognition feature was constructed. This method can solve the limitations of identifying sentences according to the rules, expand the range of application and improve the accuracy of recognition.

    【技術實現步驟摘要】
    語音數據句類識別方法和裝置及系統(tǒng)
    本申請涉及自然語言處理
    ,尤其涉及一種語音數據句類識別方法和裝置及系統(tǒng)。
    技術介紹
    語音數據的句類指按照語音數據中句子的語氣,將句子劃分的類型,如陳述句、祈使句、感嘆句、一般疑問句及特殊疑問句等,不同句類的句子往往具有不同語義,單純從文本語義上很難區(qū)分開,如在智能問答系統(tǒng)中,語音數據“我開通了幾個增值服務”和“我開通了哪幾個增值服務”,二者僅差一個字,但語義完全不同,答案也完全不同,通過句類識別后,得到這兩句語音數據分別屬于不同的句類,第一句的句類為數量類疑問句,第二句的句類為實體類疑問句。為了提高反饋給用戶的答案的準確度,關鍵點之一是識別語音數據的句類。相關技術中,語音數據句類識別方法一般通過編寫每種句類的規(guī)則,將待識別語音數據對應的識別文本與規(guī)則進行匹配,識別出語音數據句類,比如依據包含的關鍵詞識別。然而,由于自然語言的多樣性,單純通過規(guī)則從文本上匹配,局限性較大,很難準確區(qū)分出不同語音數據的句類,尤其是包含相同關鍵詞的語音數據,更難準確區(qū)分出語音數據的句類,如語音數據“怎么用這么快我的話費”和語音數據“怎么查詢話費”,包含共同的疑問詞“怎么”,但是句類不同,第一句為原因類疑問句,第二句為方式類疑問句,僅僅通過規(guī)則的方式很難區(qū)分;此外,相關技術的方法一般只針對疑問句的句類識別,對陳述句、祈使句、感嘆句等非疑問句識別效果較差,應用范圍較小,實用性差。
    技術實現思路
    本申請旨在至少在一定程度上解決相關技術中的技術問題之一。為此,本申請的一個目的在于提出一種語音數據句類識別方法,該方法可以解決依據規(guī)則識別句類的局限性,擴展使用范圍,并且可以提高識別準確度。本申請的另一個目的在于提出一種語音數據句類識別裝置。本申請的另一個目的在于提出一種語音數據句類識別系統(tǒng)。為達到上述目的,本申請第一方面實施例提出的語音數據句類識別方法,包括:接收待識別的語音數據;獲取所述語音數據的句類識別特征,所述句類識別特征包括如下項中的至少一項:聲學句類識別特征,語義句類識別特征;根據預先構建的句類識別模型和所述句類識別特征,識別所述語音數據的句類,所述句類識別模型根據獲取的語音數據樣本的句類識別特征構建得到。本申請第一方面實施例提出的語音數據句類識別方法,通過依據句類識別模型對語音數據的句類進行識別,可以有效解決依據規(guī)則進行識別的局限性,擴展使用范圍,以及依據聲學上和語義上的特征進行識別,可以提高識別準確度。為達到上述目的,本申請第二方面實施例提出的語音數據句類識別裝置,包括:接收模塊,用于接收待識別的語音數據;獲取模塊,用于獲取所述語音數據的句類識別特征,所述句類識別特征包括如下項中的至少一項:聲學句類識別特征,語義句類識別特征;識別模塊,用于根據預先構建的句類識別模型和所述句類識別特征,識別所述語音數據的句類,所述句類識別模型根據獲取的語音數據樣本的句類識別特征構建得到。本申請第二方面實施例提出的語音數據句類識別裝置,通過依據句類識別模型對語音數據的句類進行識別,可以有效解決依據規(guī)則進行識別的局限性,擴展使用范圍,以及依據聲學上和語義上的特征進行識別,可以提高識別準確度。為達到上述目的,本申請第三方面實施例提出的語音數據句類識別系統(tǒng),包括:客戶端,用于采集用戶發(fā)出的待識別的語音數據;服務端,用于接收所述客戶端發(fā)送的所述待識別的語音數據;獲取所述語音數據的句類識別特征,所述句類識別特征包括如下項中的至少一項:聲學句類識別特征,語義句類識別特征;以及,根據預先構建的句類識別模型和所述句類識別特征,識別所述語音數據的句類,所述句類識別模型根據獲取的語音數據樣本的句類識別特征構建得到。本申請第三方面實施例提出的語音數據句類識別系統(tǒng),通過依據句類識別模型對語音數據的句類進行識別,可以有效解決依據規(guī)則進行識別的局限性,擴展使用范圍,以及依據聲學上和語義上的特征進行識別,可以提高識別準確度。本申請附加的方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本申請的實踐了解到。附圖說明本申請上述的和/或附加的方面和優(yōu)點從下面結合附圖對實施例的描述中將變得明顯和容易理解,其中:圖1是本申請一個實施例提出的語音數據句類識別方法的流程示意圖;圖2是本申請另一個實施例提出的語音數據句類識別方法的流程示意圖;圖3是本申請實施例中獲取句類識別特征的方法的流程示意圖;圖4是本申請一個實施例提出的語音數據句類識別裝置的結構示意圖;圖5是本申請另一個實施例提出的語音數據句類識別裝置的結構示意圖;圖6是本申請一個實施例提出的語音數據句類識別系統(tǒng)的結構示意圖。具體實施方式下面詳細描述本申請的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標號表示相同或類似的模塊或具有相同或類似功能的模塊。下面通過參考附圖描述的實施例是示例性的,僅用于解釋本申請,而不能理解為對本申請的限制。相反,本申請的實施例包括落入所附加權利要求書的精神和內涵范圍內的所有變化、修改和等同物。圖1是本申請一個實施例提出的語音數據句類識別方法的流程示意圖。如圖1所示,本實施例的方法包括:S11:接收待識別的語音數據。待識別的語音數據例如為智能交互時用戶發(fā)出的語音數據。進一步的,待識別的語音數據可以以句為單位,從而可以對應每句語音數據進行識別,得到每句語音數據的句類。S12:獲取所述語音數據的句類識別特征,所述句類識別特征包括如下項中的至少一項:聲學句類識別特征,語義句類識別特征。聲學句類識別特征是指語音數據的聲學上的特征,語義句類識別特征是指語音數據的語義上的特征。在后續(xù)內容中,還會涉及對獲取樣本的句類識別特征的步驟,因此,此處的語音數據以及后續(xù)的樣本可以統(tǒng)稱為待提取數據。具體的獲取待提取數據的句類識別特征的方法可以參見后續(xù)內容。S13:根據預先構建的句類識別模型和所述句類識別特征,識別所述語音數據的句類,所述句類識別模型根據獲取的語音數據樣本的句類識別特征構建得到。具體構建句類識別模型的方法可以參見后續(xù)描述。句類識別模型的輸入為句類識別特征,輸出為句類信息,從而在提取得到句類識別特征后,將提取得到的句類識別特征作為句類識別模型的輸入,得到句類識別模型輸出的句類信息,再根據句類信息確定待識別的語音數據的句類,比如,句類信息為每種預設句類的概率值,則將概率值最高的句類確定為待識別的語音數據的句類。所述語音數據的句類是指按照語音數據中句子的語氣將句子劃分的類型,句類包括但不限于:陳述句、祈使句、感嘆句、一般疑問句及特殊疑問句,進一步的,還可以對上述的句類進行細分,如所述特殊疑問句包括實體類疑問句(what)、人物類疑問句(who)、原因類疑問句(why)、時間類疑問句(when)、地點類疑問句(where)、數量類疑問句(howmuch/many)和方式類疑問句(how)等。在具體應用時,所述語音數據句類識別方法可以由客戶端和服務端執(zhí)行。例如包括:客戶端采集用戶發(fā)出的待識別的語音數據;以及,客戶端將待識別的語音數據發(fā)送給服務端;以及,服務端接收到客戶端發(fā)送的待識別的語音數據后,獲取所述語音數據的句類識別特征,所述句類識別特征包括如下項中的至少一項:聲學句類識別特征,語義句類識別特征;以及,服務端根據預先構建的句類識別模型本文檔來自技高網...
    語音數據句類識別方法和裝置及系統(tǒng)

    【技術保護點】
    一種語音數據句類識別方法,其特征在于,包括:接收待識別的語音數據;獲取所述語音數據的句類識別特征,所述句類識別特征包括如下項中的至少一項:聲學句類識別特征,語義句類識別特征;根據預先構建的句類識別模型和所述句類識別特征,識別所述語音數據的句類,所述句類識別模型根據獲取的語音數據樣本的句類識別特征構建得到。

    【技術特征摘要】
    1.一種語音數據句類識別方法,其特征在于,包括:接收待識別的語音數據;獲取所述語音數據的句類識別特征,所述句類識別特征包括如下項中的至少一項:聲學句類識別特征,語義句類識別特征;根據預先構建的句類識別模型和所述句類識別特征,識別所述語音數據的句類,所述句類識別模型根據獲取的語音數據樣本的句類識別特征構建得到。2.根據權利要求1所述的方法,其特征在于,還包括:構建句類識別模型,所述構建句類識別模型包括:獲取語音數據樣本;確定所述語音數據樣本的句類;獲取所述語音數據樣本的句類識別特征;根據所述語音數據樣本的句類識別特征和所述語音數據樣本的句類,進行模型訓練,構建得到句類識別模型。3.根據權利要求1所述的方法,其特征在于,獲取所述語音數據的聲學句類識別特征,包括:對所述語音數據進行劃分,得到所述語音數據包含的多個語音片段;計算所述語音片段的短時平均能量;根據所述短時平均能量確定所述語音數據的聲學句類識別特征。4.根據權利要求3所述的方法,其特征在于,所述根據所述短時平均能量確定聲學句類識別特征,包括:將所有所述短時平均能量組成的向量,確定為所述語音數據的聲學句類識別特征;或者,在所有所述短時平均能量中確定出最大短時平均能量,將所述最大短時平均能量確定為所述語音數據的聲學句類識別特征;或者,將所有所述短時平均能量和最大短時平均能量組成的向量,確定為所述語音數據的聲學句類識別特征。5.根據權利要求1所述的方法,其特征在于,獲取所述語音數據的語義句類識別特征,包括:對所述語音數據進行劃分,得到所述語音數據包含的多個語音片段,以及,從所述多個語音片段中獲取短時平均能量最大的語音片段;根據所述短時平均能量最大的語音片段,獲取擴展后的語音片段對應的文本數據;根據所述文本數據確定所述語音數據的語義句類識別特征。6.根據權利要求5所述的方法,其特征在于,所述語義句類識別特征包括如下項的至少一項:句互信息向量,所述句互信息向量為所述文本數據包含的詞語對應的互信息向量的加權和,所述互信息向量為所述詞語與每種句類之間的互信息組成的向量;句子向量,所述句子向量為所述文本數據包含的詞語對應的詞向量的加權和。7.根據權利要求3或5所述的方法,其特征在于,所述對所述語音數據進行劃分,得到所述語音數據包含的多個語音片段,包括:對所述語音數據進行語音識別,得到對應的整句文本數據;將所述整句文本數據劃分為多個文本片段,并根據所述文本片段對所述語音數據進行劃分,得到多個語音片段。8.根據權利要求7所述的方法,其特征在于,所述根據所述短時平均能量最大的語音片段,獲取擴展后的語音片段對應的文本數據,包括:對所述整句文本數據進行分詞,得到分詞結果;在所述整句文本數據中提取出所述短時平均能量最大的語音片段對應的文本數據,并確定所述提取出的文本數據包含的起始詞語的位置和結束詞語的位置;確定擴展窗的窗口大小;根據所述提取出的文本數據包含的起始詞語的位置和結束詞語的位置,以及所述窗口大小,確定擴展后語音片段對應的文本數據。9.一種語音數據句類識別裝置,其特征在于,包括:接收模塊,用于接收待識別的語音數據;獲取模塊,用于獲取所述語音數據的句類識別特征,所述句類識別特征包括如下項中的至少一項:聲學句類識別特征,語義句類識別特征;識別模塊,用于根據預先構建的句類識別模型和所述句類識別特征,識別所述語...

    【專利技術屬性】
    技術研發(fā)人員:李莉司華建李寶善
    申請(專利權)人:科大訊飛股份有限公司
    類型:發(fā)明
    國別省市:安徽,34

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 久久伊人亚洲AV无码网站| 无码任你躁久久久久久老妇App | 暴力强奷在线播放无码| 亚洲精品无码成人AAA片| AV无码久久久久不卡网站下载| 日韩av无码国产精品| 亚洲午夜无码久久久久| 无码中文字幕色专区| 无码精品国产VA在线观看 | 无码夫の前で人妻を侵犯| 国产a v无码专区亚洲av| 永久免费av无码不卡在线观看| 潮喷失禁大喷水aⅴ无码| 久久天堂av综合色无码专区| 国产午夜精品无码| 久久久久亚洲AV无码专区桃色| 亚洲国产精品无码久久久| 亚洲精品无码成人AAA片| 国产精品无码不卡一区二区三区 | 成人免费a级毛片无码网站入口| 熟妇人妻中文字幕无码老熟妇| 久久精品无码一区二区app| 成人免费无码精品国产电影| 久久精品无码一区二区三区不卡 | 无码日韩精品一区二区免费暖暖 | 亚洲精品无码mv在线观看网站| 天堂无码在线观看| 国产莉萝无码AV在线播放| 无码精品A∨在线观看十八禁| 亚洲av无码一区二区三区不卡 | 亚洲av中文无码| 亚洲av无码成人精品区在线播放| 四虎国产精品永久在线无码| 久久精品无码中文字幕| 人妻少妇精品无码专区动漫 | 无码精品日韩中文字幕| 无码人妻精品一区二区三18禁| 在线播放无码高潮的视频 | 亚洲国产精品无码久久九九大片 | 亚洲av无码成人精品区在线播放| 中文字幕AV无码一区二区三区|