The invention discloses a voice processing method of the robot, the voice processing method comprises the following steps: S1, the preprocessing stage, according to the special characters to punctuate the text analysis, text segmentation will be cut for only Chinese sentences, the sentence is the basic unit of word processing, the next step; the special characters including English letters, numbers and punctuation; S2: the phrase sentence for bidirectional maximum matching, two-way matching, in accordance with the principle of priority of long word, the results of segmentation as the input of S3; S3: comparison of step segmentation results, to determine whether there is ambiguity. If there is some ambiguity, disambiguation; S4: repeat S2 and S3 till all the sentences in a sentence unit step divided.
【技術(shù)實(shí)現(xiàn)步驟摘要】
一種機(jī)器人的語(yǔ)音處理方法
本專(zhuān)利技術(shù)屬于互聯(lián)網(wǎng)
,尤其涉及一種機(jī)器人的語(yǔ)音處理方法。
技術(shù)介紹
隨著社會(huì)的發(fā)展,通訊工具變得越來(lái)越多樣化,各種即時(shí)通訊應(yīng)用程序大大豐富了人們之間的相互流通與交流的方式,在各種電子終端上就可以發(fā)送文字、語(yǔ)音、視頻消息,更具有各種群組功能。然而,現(xiàn)有的各種即時(shí)通訊應(yīng)用程序一般都是按照一個(gè)客戶(hù)端一個(gè)用戶(hù)的方式設(shè)計(jì)的,也就是說(shuō)輸出消息的對(duì)象就是當(dāng)前的用戶(hù),而且播放、輸出消息的操作也依賴(lài)于當(dāng)前用戶(hù)的交互操作。用戶(hù)在聊天時(shí)的一個(gè)顯著特點(diǎn)是所提出的話(huà)題一般都是比較短小的,而不是長(zhǎng)篇大論,不具有段落篇章結(jié)構(gòu),絕大多數(shù)就是少數(shù)幾句話(huà)。基于統(tǒng)計(jì)的分詞方法適用于有段落、篇章結(jié)構(gòu)以及上下文關(guān)系的文段。基于理解的分詞方法目前并不成熟,且時(shí)間復(fù)雜度高,速度慢。因此,需要一種新的機(jī)器人的語(yǔ)音處理方法來(lái)克服上述技術(shù)中的缺陷。
技術(shù)實(shí)現(xiàn)思路
針對(duì)現(xiàn)有技術(shù)的不足,本專(zhuān)利技術(shù)的目的是提供一種新的機(jī)器人的語(yǔ)音處理方法,使得機(jī)器人能夠在短時(shí)間以?xún)?nèi)識(shí)別更多語(yǔ)言,簡(jiǎn)單方便快速的進(jìn)行溝通。一種機(jī)器人的語(yǔ)音處理方法,所述語(yǔ)音處理方法包括以下步驟:S1:預(yù)處理階段,按照特殊字符將待分析文本進(jìn)行斷句,將待切分的文本切分為只有中文的短句,所述短句是下一步分詞處理的基本單位;其中,所述特殊字符包括英文字母、數(shù)字和標(biāo)點(diǎn)符號(hào)。S2:對(duì)短句出來(lái)的句子進(jìn)行雙向最大匹配分詞,按照雙向匹配、長(zhǎng)詞優(yōu)先的原則進(jìn)行,分詞后的結(jié)果作為S3的輸入;S3:對(duì)上一步分詞得到的結(jié)果進(jìn)行比較,判斷是否存在歧義,如果存在歧義,就進(jìn)行一定的歧義消解;S4:重復(fù)S2、S3,直到處理完步驟一中斷句所切分出的所有句子單 ...
【技術(shù)保護(hù)點(diǎn)】
一種機(jī)器人的語(yǔ)音處理方法,其特征在于,所述語(yǔ)音處理方法包括以下步驟:S1:預(yù)處理階段,按照特殊字符將待分析文本進(jìn)行斷句,將待切分的文本切分為只有中文的短句,所述短句是下一步分詞處理的基本單位;其中,所述特殊字符包括英文字母、數(shù)字和標(biāo)點(diǎn)符號(hào);S2:對(duì)短句出來(lái)的句子進(jìn)行雙向最大匹配分詞,按照雙向匹配、長(zhǎng)詞優(yōu)先的原則進(jìn)行,分詞后的結(jié)果作為S3的輸入;S3:對(duì)上一步分詞得到的結(jié)果進(jìn)行比較,判斷是否存在歧義,如果存在歧義,就進(jìn)行一定的歧義消解;S4:重復(fù)S2、S3,直到處理完步驟一中斷句所切分出的所有句子單元。
【技術(shù)特征摘要】
1.一種機(jī)器人的語(yǔ)音處理方法,其特征在于,所述語(yǔ)音處理方法包括以下步驟:S1:預(yù)處理階段,按照特殊字符將待分析文本進(jìn)行斷句,將待切分的文本切分為只有中文的短句,所述短句是下一步分詞處理的基本單位;其中,所述特殊字符包括英文字母、數(shù)字和標(biāo)點(diǎn)符號(hào);S2:對(duì)短...
【專(zhuān)利技術(shù)屬性】
技術(shù)研發(fā)人員:彭建盛,覃勇,彭金松,苗劍,
申請(qǐng)(專(zhuān)利權(quán))人:河池學(xué)院,
類(lèi)型:發(fā)明
國(guó)別省市:廣西,45
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。