本發(fā)明專利技術(shù)提供了一種網(wǎng)絡(luò)教學(xué)實(shí)時(shí)語(yǔ)音分析系統(tǒng),包括:捕獲組件,其用于捕獲語(yǔ)音輸入;自動(dòng)語(yǔ)音識(shí)別ASR組件,其用于執(zhí)行所述語(yǔ)音輸入的實(shí)時(shí)識(shí)別;分析組件,其用于根據(jù)分析語(yǔ)音輸入內(nèi)容獲取相應(yīng)數(shù)據(jù),并對(duì)相應(yīng)數(shù)據(jù)進(jìn)行處理,包括數(shù)據(jù)采集模塊、數(shù)據(jù)分類模塊、分類檢測(cè)模塊和檢測(cè)融合模塊。本發(fā)明專利技術(shù)的有益效果為:實(shí)現(xiàn)了實(shí)時(shí)語(yǔ)音教學(xué)。
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及語(yǔ)音分析領(lǐng)域,具體涉及一種網(wǎng)絡(luò)教學(xué)實(shí)時(shí)語(yǔ)音分析系統(tǒng)。
技術(shù)介紹
常規(guī)的語(yǔ)音識(shí)別組件經(jīng)過(guò)預(yù)先訓(xùn)練,因此高度地非個(gè)人化。實(shí)際上,常規(guī)計(jì)算機(jī)輔助工具不能動(dòng)態(tài)適應(yīng)用戶語(yǔ)音或者用戶與他人對(duì)話中的內(nèi)容。常規(guī)方法還需要主動(dòng)練習(xí)。預(yù)先選擇的文本可能不對(duì)應(yīng)于用戶最常說(shuō)的單詞和詞組。使用常規(guī)技術(shù),可能難以涵蓋用戶習(xí)慣性說(shuō)的某些事物。
技術(shù)實(shí)現(xiàn)思路
針對(duì)上述問(wèn)題,本專利技術(shù)旨在提供一種網(wǎng)絡(luò)教學(xué)實(shí)時(shí)語(yǔ)音分析系統(tǒng)。本專利技術(shù)的目的采用以下技術(shù)方案來(lái)實(shí)現(xiàn):提供了一種網(wǎng)絡(luò)教學(xué)實(shí)時(shí)語(yǔ)音分析系統(tǒng),包括:捕獲組件,其用于捕獲語(yǔ)音輸入;自動(dòng)語(yǔ)音識(shí)別ASR組件,其用于執(zhí)行所述語(yǔ)音輸入的實(shí)時(shí)識(shí)別;分析組件,其用于根據(jù)分析語(yǔ)音輸入內(nèi)容獲取相應(yīng)數(shù)據(jù),并對(duì)相應(yīng)數(shù)據(jù)進(jìn)行處理,包括數(shù)據(jù)采集模塊、數(shù)據(jù)分類模塊、分類檢測(cè)模塊和檢測(cè)融合模塊。本專利技術(shù)的有益效果為:實(shí)現(xiàn)了實(shí)時(shí)語(yǔ)音教學(xué)。附圖說(shuō)明利用附圖對(duì)本專利技術(shù)作進(jìn)一步說(shuō)明,但附圖中的實(shí)施例不構(gòu)成對(duì)本專利技術(shù)的任何限制,對(duì)于本領(lǐng)域的普通技術(shù)人員,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)以下附圖獲得其它的附圖。圖1是本專利技術(shù)的結(jié)構(gòu)連接示意圖;圖2是本專利技術(shù)分析組件示意圖。附圖標(biāo)記:捕獲組件1、自動(dòng)語(yǔ)音識(shí)別ASR組件2、分析組件3、數(shù)據(jù)采集模塊31、數(shù)據(jù)分類模塊32、分類檢測(cè)模塊33、檢測(cè)融合模塊34。具體實(shí)施方式結(jié)合以下實(shí)施例對(duì)本專利技術(shù)作進(jìn)一步描述。參見(jiàn)圖1、圖2,本實(shí)施例的一種網(wǎng)絡(luò)教學(xué)實(shí)時(shí)語(yǔ)音分析系統(tǒng),包括:捕獲組件1,其用于捕獲語(yǔ)音輸入;自動(dòng)語(yǔ)音識(shí)別ASR組件2,其用于執(zhí)行所述語(yǔ)音輸入的實(shí)時(shí)識(shí)別;分析組件3,其用于根據(jù)分析語(yǔ)音輸入內(nèi)容獲取相應(yīng)數(shù)據(jù),并對(duì)相應(yīng)數(shù)據(jù)進(jìn)行處理,包括數(shù)據(jù)采集模塊31、數(shù)據(jù)分類模塊32、分類檢測(cè)模塊33和檢測(cè)融合模塊34,所述數(shù)據(jù)采集模塊31用于采集需要進(jìn)行檢測(cè)的數(shù)據(jù);所述數(shù)據(jù)分類模塊32用于將由數(shù)據(jù)采集模塊31輸出的數(shù)據(jù)劃分為圖像數(shù)據(jù)和文本數(shù)據(jù),并對(duì)分類后的數(shù)據(jù)進(jìn)行過(guò)濾處理;所述分類檢測(cè)模塊33用于對(duì)分類后的數(shù)據(jù)進(jìn)行分析檢測(cè);所述檢測(cè)融合模塊34用于根據(jù)檢測(cè)需求篩選所需的圖像數(shù)據(jù)和文本數(shù)據(jù)。優(yōu)選地,還包括錯(cuò)誤匯總組件,其對(duì)無(wú)法進(jìn)行識(shí)別和識(shí)別錯(cuò)誤的語(yǔ)音進(jìn)行匯總。本優(yōu)選實(shí)施例能夠?qū)φZ(yǔ)音分析系統(tǒng)進(jìn)行改進(jìn)。優(yōu)選地,還包括交互式用戶接口組件,其中所述接口組件使用用戶反饋信息來(lái)分析錯(cuò)誤并建議錯(cuò)誤糾正。本優(yōu)選實(shí)施例語(yǔ)音分析系統(tǒng)更加個(gè)性化。優(yōu)選的,所述采集需要進(jìn)行檢測(cè)的數(shù)據(jù),包括:(1)采集一定時(shí)間段內(nèi)需要進(jìn)行檢測(cè)的數(shù)據(jù),按設(shè)定的過(guò)濾規(guī)則對(duì)該數(shù)據(jù)進(jìn)行初步過(guò)濾處理,所述設(shè)定的過(guò)濾規(guī)則包括刪除包含特殊字符、推廣相關(guān)的特殊漢字和網(wǎng)頁(yè)鏈接的內(nèi)容的數(shù)據(jù);(2)設(shè)所述一定時(shí)間段的時(shí)間范圍為[VB,VE],將[VB,VE]按照時(shí)間順序平均分為n個(gè)子時(shí)間段,對(duì)每個(gè)子時(shí)間段內(nèi)的數(shù)據(jù)進(jìn)行重要度評(píng)估,評(píng)估公式定義為:Si=STi+ZiZ×100%,1≤i≤n]]>式中,Si為第i個(gè)子時(shí)間段的重要程度,STi為設(shè)定的第i個(gè)子時(shí)間段的重要程度值,Zi為第i個(gè)子時(shí)間段的數(shù)據(jù)的數(shù)量,Z為在[VB,VE]內(nèi)的數(shù)據(jù)的數(shù)量。(3)將各重要度按照由小到大進(jìn)行排序,按照重要度的排列順序,將數(shù)據(jù)依次發(fā)送至數(shù)據(jù)分類模塊32。本優(yōu)選實(shí)施例通過(guò)設(shè)定過(guò)濾規(guī)則,將不需要進(jìn)行檢測(cè)的數(shù)據(jù)進(jìn)行刪除,減少了檢測(cè)后續(xù)處理的數(shù)據(jù)量;通過(guò)對(duì)各子時(shí)間段的數(shù)據(jù)進(jìn)行重要度評(píng)估,并按照重要度的排列順序,將數(shù)據(jù)依次發(fā)送至數(shù)據(jù)分類模塊32,使后續(xù)的模塊能夠預(yù)先處理重要程度高的數(shù)據(jù),提高了檢測(cè)的速度。優(yōu)選的,所述對(duì)分類后的數(shù)據(jù)進(jìn)行過(guò)濾處理,包括:提取文本數(shù)據(jù),對(duì)該文本數(shù)據(jù)進(jìn)行聚類處理,形成多個(gè)類別的文本數(shù)據(jù)集;計(jì)算每個(gè)類別的文本數(shù)據(jù)集中的數(shù)據(jù)的數(shù)量,按照數(shù)量由少到大的順序?qū)Χ鄠€(gè)文本數(shù)據(jù)集進(jìn)行排序;刪除前23%的文本數(shù)據(jù)集,將剩余的文本數(shù)據(jù)集以及圖像數(shù)據(jù)發(fā)送至分類檢測(cè)模塊33。本優(yōu)選實(shí)施例進(jìn)一步對(duì)文本數(shù)據(jù)進(jìn)行聚類處理,過(guò)濾掉數(shù)量較少的文本數(shù)據(jù)集,減少了后續(xù)檢測(cè)的數(shù)據(jù)量,從而進(jìn)一步提高了檢測(cè)的速度。優(yōu)選的,所述對(duì)該文本數(shù)據(jù)進(jìn)行聚類處理,包括:(1)確定聚簇的個(gè)數(shù)K,包括:對(duì)該文本數(shù)據(jù)采用等距法設(shè)定k-means聚類算法的初始中心,得到聚類中心;在得到聚類中心后將相鄰的聚類中心的中點(diǎn)作為分類的劃分點(diǎn),將各個(gè)對(duì)象加入到距離最近的類中,從而確定聚簇的個(gè)數(shù)K;(2)將該文本數(shù)據(jù)劃分為n個(gè)樣本,對(duì)n個(gè)樣本進(jìn)行向量化,通過(guò)夾角余弦函數(shù)計(jì)算所有樣本兩兩之間的相似度,得到相似度矩陣SIM:SIM=[sim(ci,cj)]n×n,i,j=1,…,n(3)計(jì)算每一個(gè)樣本與其它所有樣本的相似度之和,求和公式為:SIMci=Σj=1nsim(ci,cj)]]>式中,為樣本ci與其它所有樣本的相似度之和,sim(ci,cj)表示樣本ci,cj間的相似度,i,j=1,…,n;(4)按降序排列設(shè)按從大到小排列的前4個(gè)值對(duì)應(yīng)的樣本為cmax,cmax-1,cmax-2,cmax-3,根據(jù)下列公式確定第一個(gè)初始的聚簇中心MEDIUM:MEDIUM=14Σμ=03ωmax-μcmax-μ]]>式中,ωmax-μ表示cmax-μ的重要度權(quán)值;(5)對(duì)中的最大值對(duì)應(yīng)的矩陣中行向量的元素進(jìn)行升序排列,假設(shè)前k-1個(gè)最小的元素為SIMpq,q=1,…k-1,選擇前k-1個(gè)最小的元素SIMpq相對(duì)應(yīng)的樣本作為剩余的k-1個(gè)初始的聚簇中心;(6)計(jì)算剩余樣本與各初始的聚簇中心之間的相似度,將剩余樣本分發(fā)到相似度最高的聚簇中,形成變化后的k個(gè)聚簇;計(jì)算變化后的聚簇中各樣本的均值,將其作為更新后的聚簇中心代替更新前的聚簇中心;若更新前的聚簇中心與更新后的聚簇中心相同,或者目標(biāo)函數(shù)達(dá)到了最小值,停止更新,所述目標(biāo)函數(shù)為:L=Σl=1kΣcx∈Cl||cx-cxl‾||2]]>式中,Cl表示k個(gè)聚簇中的第l個(gè)聚簇,cx為第l個(gè)聚簇中的樣本,為第l個(gè)聚簇的中心。本優(yōu)選實(shí)施例有效避免單一采取隨機(jī)抽樣方法所帶來(lái)的偶然性,解決對(duì)該文本數(shù)據(jù)進(jìn)行聚類處理時(shí)在選取k值以及初始化聚類中心時(shí)所存在的問(wèn)題,提高了聚類穩(wěn)定性,進(jìn)一步提高了對(duì)文本數(shù)據(jù)進(jìn)行過(guò)濾處理的精度。優(yōu)選的,所述分類檢測(cè)模塊33包括圖像數(shù)據(jù)檢測(cè)單元和文本數(shù)據(jù)檢測(cè)單元;所述圖像數(shù)據(jù)檢測(cè)單元基于語(yǔ)義特征對(duì)圖像數(shù)據(jù)進(jìn)行檢測(cè),具體為:采用小波變換的方法對(duì)圖像進(jìn)行分割,對(duì)區(qū)域低層特征進(jìn)行提取,構(gòu)造特征矩陣,再應(yīng)用非負(fù)矩陣分解訓(xùn)練算法構(gòu)造語(yǔ)義空間,將圖像投影到該空間以獲取圖像語(yǔ)義特征;所述文本數(shù)據(jù)檢測(cè)單元包括文本數(shù)據(jù)建模子單元、文本數(shù)據(jù)分類子單元、檢測(cè)子單元,具體為:(1)文本數(shù)據(jù)建模子單元,用于使用構(gòu)成文檔的詞項(xiàng)來(lái)表達(dá)文檔的語(yǔ)義,其將n篇文檔t1,t2,…,tn的每篇文檔表示成m維特征向量v1,v2,…,vm,構(gòu)成n×m的文檔-特征矩陣:式中,m為構(gòu)成文檔的詞項(xiàng)的數(shù)量;w(ti,vj)=f(ti,vj)×n/f(vj)Σj=1m[f(ti,vj)×n/f(vj)]2,1≤i≤n,1≤j≤m]]>式中,w(ti,vj)表示詞項(xiàng)vj在文檔ti中所占權(quán)重,f(ti,vj)表示詞項(xiàng)vj在文檔ti中出本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
一種網(wǎng)絡(luò)教學(xué)實(shí)時(shí)語(yǔ)音分析系統(tǒng),其特征是,包括:捕獲組件,其用于捕獲語(yǔ)音輸入;自動(dòng)語(yǔ)音識(shí)別ASR組件,其用于執(zhí)行所述語(yǔ)音輸入的實(shí)時(shí)識(shí)別;分析組件,其用于根據(jù)分析語(yǔ)音輸入內(nèi)容獲取相應(yīng)數(shù)據(jù),并對(duì)相應(yīng)數(shù)據(jù)進(jìn)行處理,包括數(shù)據(jù)采集模塊、數(shù)據(jù)分類模塊、分類檢測(cè)模塊和檢測(cè)融合模塊。
【技術(shù)特征摘要】
1.一種網(wǎng)絡(luò)教學(xué)實(shí)時(shí)語(yǔ)音分析系統(tǒng),其特征是,包括:捕獲組件,其用于捕獲語(yǔ)音輸入;自動(dòng)語(yǔ)音識(shí)別ASR組件,其用于執(zhí)行所述語(yǔ)音輸入的實(shí)時(shí)識(shí)別;分析組件,其用于根據(jù)分析語(yǔ)音輸入內(nèi)容獲取相應(yīng)數(shù)據(jù),并對(duì)相應(yīng)數(shù)據(jù)進(jìn)行處理,包括數(shù)據(jù)采集模塊、數(shù)據(jù)分類模塊、分類檢測(cè)模塊和檢測(cè)融合模塊。2.根據(jù)權(quán)利要求1所述的一種網(wǎng)絡(luò)教學(xué)實(shí)時(shí)語(yǔ)音分析系統(tǒng),其特征是,還包括錯(cuò)誤匯總組件,其對(duì)無(wú)法進(jìn)行識(shí)別和識(shí)別錯(cuò)誤的語(yǔ)音進(jìn)行匯總。3.根據(jù)權(quán)利要求2所述的一種網(wǎng)絡(luò)教學(xué)實(shí)時(shí)語(yǔ)音分析系統(tǒng),其特征是,還包括交互式用戶接口組件,其中所述接口組件使用用戶反饋信息來(lái)分析錯(cuò)誤并建議錯(cuò)誤糾正。4.根據(jù)權(quán)利要求3所述的一種網(wǎng)絡(luò)教學(xué)實(shí)時(shí)語(yǔ)音分析系統(tǒng),其特征是,所述采集需要進(jìn)行檢測(cè)的數(shù)據(jù),...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:不公告發(fā)明人,
申請(qǐng)(專利權(quán))人:深圳大圖科創(chuàng)技術(shù)開(kāi)發(fā)有限公司,
類型:發(fā)明
國(guó)別省市:廣東;44
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。