【技術(shù)實(shí)現(xiàn)步驟摘要】
一種筆跡特征提取的方法和裝置
本申請(qǐng)涉及聯(lián)機(jī)手寫(xiě)漢字識(shí)別
,特別是涉及一種筆跡特征提取的方法和 裝直。
技術(shù)介紹
聯(lián)機(jī)手寫(xiě)的筆跡數(shù)據(jù),由于書(shū)寫(xiě)者的書(shū)寫(xiě)習(xí)慣、筆跡采集設(shè)備的精度的不同,對(duì)于 相同的文字,存在很大的形變和圖形上的差異,因此,對(duì)于筆跡數(shù)據(jù)的特征提取提出了更高 的要求,需要在筆跡數(shù)據(jù)特征提取時(shí)能夠有效的表達(dá)手寫(xiě)筆跡數(shù)據(jù)的本質(zhì),體現(xiàn)相同字的 筆跡數(shù)據(jù)的相同點(diǎn),并區(qū)分不同字的筆跡數(shù)據(jù)的不同點(diǎn)。 目前傳統(tǒng)筆跡數(shù)據(jù)的特征提取方法,是通過(guò)對(duì)筆跡數(shù)據(jù)進(jìn)行順序掃描方法和網(wǎng)格 統(tǒng)計(jì)方法進(jìn)行筆跡數(shù)據(jù)特征的提取。其中,筆跡數(shù)據(jù)進(jìn)行順序掃描方法是按照書(shū)寫(xiě)的順序 對(duì)筆跡數(shù)據(jù)中的點(diǎn)位置或角度進(jìn)行掃描,該方法未考慮筆跡數(shù)據(jù)特征中的軌跡的角度變化 信息,也未考慮筆跡數(shù)據(jù)特征相鄰角度間的相似性。網(wǎng)絡(luò)統(tǒng)計(jì)方法是按照等寬和等高的方 式進(jìn)行筆跡數(shù)據(jù)特征的提取,該方法未考慮筆跡數(shù)據(jù)特征對(duì)稱投影的信息,并且,該方法存 在手寫(xiě)筆跡特征的提取過(guò)于機(jī)械、規(guī)整以及形變適應(yīng)性不佳的問(wèn)題。 上述方法,存在筆跡數(shù)據(jù)特征提取不全面和筆跡數(shù)據(jù)特征適應(yīng)性不佳的問(wèn)題,以 上問(wèn)題嚴(yán)重影響了后續(xù)分類器的分類效果,進(jìn)而導(dǎo)致了聯(lián)機(jī)手寫(xiě)筆跡數(shù)據(jù)特征識(shí)別準(zhǔn)確率 低的問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
本申請(qǐng)?zhí)峁┮环N筆跡特征提取的方法和裝置,以解決聯(lián)機(jī)手寫(xiě)筆跡數(shù)據(jù)特征識(shí)別 準(zhǔn)確率低的問(wèn)題。 為了解決上述問(wèn)題,本申請(qǐng)公開(kāi)了一種筆跡特征提取的方法,包括: 按照筆跡數(shù)據(jù)書(shū)寫(xiě)的時(shí)間序列采集筆跡數(shù)據(jù)并進(jìn)行預(yù)處理,獲得預(yù)處理后的筆跡 數(shù)據(jù); 依據(jù)所述時(shí)間序列對(duì)所述預(yù)處理后的筆跡數(shù)據(jù)進(jìn) ...
【技術(shù)保護(hù)點(diǎn)】
一種筆跡特征提取的方法,其特征在于,包括:按照筆跡數(shù)據(jù)書(shū)寫(xiě)的時(shí)間序列采集筆跡數(shù)據(jù)并進(jìn)行預(yù)處理,獲得預(yù)處理后的筆跡數(shù)據(jù);依據(jù)所述時(shí)間序列對(duì)所述預(yù)處理后的筆跡數(shù)據(jù)進(jìn)行等間隔分段,獲得多個(gè)筆畫(huà)段向量;獲取所述多個(gè)筆畫(huà)段向量的聯(lián)機(jī)特征,所述聯(lián)機(jī)特征包括所述多個(gè)筆畫(huà)段向量的角度和中心坐標(biāo);根據(jù)所述預(yù)處理后的筆跡數(shù)據(jù)獲取所述筆跡數(shù)據(jù)的重心,依據(jù)所述重心提取所述預(yù)處理后的筆跡數(shù)據(jù)的脫機(jī)特征;依據(jù)所述聯(lián)機(jī)特征和脫機(jī)特征,進(jìn)行數(shù)值歸一化處理,將所述數(shù)值歸一化處理的結(jié)果作為采集的所述筆跡數(shù)據(jù)的特征。
【技術(shù)特征摘要】
1. 一種筆跡特征提取的方法,其特征在于,包括: 按照筆跡數(shù)據(jù)書(shū)寫(xiě)的時(shí)間序列采集筆跡數(shù)據(jù)并進(jìn)行預(yù)處理,獲得預(yù)處理后的筆跡數(shù) 據(jù); 依據(jù)所述時(shí)間序列對(duì)所述預(yù)處理后的筆跡數(shù)據(jù)進(jìn)行等間隔分段,獲得多個(gè)筆畫(huà)段向 量; 獲取所述多個(gè)筆畫(huà)段向量的聯(lián)機(jī)特征,所述聯(lián)機(jī)特征包括所述多個(gè)筆畫(huà)段向量的角度 和中心坐標(biāo); 根據(jù)所述預(yù)處理后的筆跡數(shù)據(jù)獲取所述筆跡數(shù)據(jù)的重心,依據(jù)所述重心提取所述預(yù)處 理后的筆跡數(shù)據(jù)的脫機(jī)特征; 依據(jù)所述聯(lián)機(jī)特征和脫機(jī)特征,進(jìn)行數(shù)值歸一化處理,將所述數(shù)值歸一化處理的結(jié)果 作為采集的所述筆跡數(shù)據(jù)的特征。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述按照筆跡數(shù)據(jù)書(shū)寫(xiě)的時(shí)間序列采集 筆跡數(shù)據(jù)并進(jìn)行預(yù)處理,獲得預(yù)處理后的筆跡數(shù)據(jù)的步驟包括: 將采集的筆跡數(shù)據(jù)按照書(shū)寫(xiě)的時(shí)間序列進(jìn)行線性尺寸規(guī)整化后,獲得各個(gè)自然筆畫(huà)段 長(zhǎng)度; 依據(jù)獲得的所述各個(gè)自然筆畫(huà)段長(zhǎng)度,得到由所述各個(gè)自然筆畫(huà)段組成的筆跡數(shù)據(jù)的 長(zhǎng)度。3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述多個(gè)筆畫(huà)段向量的角度包括:各個(gè)筆 畫(huà)段向量與X軸正方向的角度、各個(gè)筆畫(huà)段向量與Y軸正方向的角度以及各個(gè)筆畫(huà)段向量 與其相鄰的筆畫(huà)段向量之間的角度。4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述脫機(jī)特征包括投影脫機(jī)特征、或網(wǎng)格 脫機(jī)特征、或扇形脫機(jī)特征、或輪廓脫機(jī)特征。5. 根據(jù)權(quán)利要求4所述的方法,其特征在于, 當(dāng)所述脫機(jī)特征為所述投影脫機(jī)特征時(shí),所述依據(jù)所述重心提取所述預(yù)處理后的筆跡 數(shù)據(jù)的脫機(jī)特征的步驟包括: 以所述筆跡數(shù)據(jù)的重心為分割點(diǎn)對(duì)所述預(yù)處理后的筆跡數(shù)據(jù)進(jìn)行水平方向分割和垂 直方向分割,將所述預(yù)處理后的筆跡數(shù)據(jù)從水平方向分割為上部分區(qū)域和下部分區(qū)域,從 垂直方向分割為左部分區(qū)域和右部分區(qū)域,分別掃描各個(gè)筆畫(huà)段向量的中心坐標(biāo)在所述上 部分區(qū)域、下部分區(qū)域、左部分區(qū)域和右部分區(qū)域出現(xiàn)的個(gè)數(shù); 當(dāng)所述脫機(jī)特征為所述網(wǎng)格脫機(jī)特征時(shí),所述依據(jù)所述重心提取所述預(yù)處理后的筆跡 數(shù)據(jù)的脫機(jī)特征的步驟包括: 定義二維平面的八個(gè)方向,東、西、南、北、東南、東北、西南、西北; 以所述筆跡數(shù)據(jù)的重心為分割點(diǎn)對(duì)所述預(yù)處理后的筆跡數(shù)據(jù)進(jìn)行水平方向分割和垂 直方向分割,將所述預(yù)處理后的筆跡數(shù)據(jù)從水平方向分割為上網(wǎng)格和下網(wǎng)格,從垂直方向 分割為左網(wǎng)格和右網(wǎng)格,分別掃描各個(gè)筆畫(huà)段向量的中心坐標(biāo)在所述上網(wǎng)格、下網(wǎng)格、左網(wǎng) 格和右網(wǎng)格的八個(gè)方向上出現(xiàn)的個(gè)數(shù); 當(dāng)所述脫機(jī)特征為所述扇形脫機(jī)特征時(shí),所述依據(jù)所述重心提取所述預(yù)處理后的筆跡 數(shù)據(jù)的扇形脫機(jī)特征的步驟包括: 定義二維平面的八個(gè)方向,東、西、南、北、東南、東北、西南、西北; 以所述筆跡數(shù)據(jù)的重心為圓心,對(duì)所述預(yù)處理后的筆跡數(shù)據(jù)分割為多個(gè)扇形區(qū)域,分 別掃描各個(gè)筆畫(huà)段向量的中心坐標(biāo)在八個(gè)方向上出現(xiàn)的個(gè)數(shù); 當(dāng)所述脫機(jī)特征為所述輪廓脫機(jī)特征時(shí),所述依據(jù)所述重心提取所述預(yù)處理后的筆跡 數(shù)據(jù)的輪廓脫機(jī)特征的步驟包括: 定義二維平面的八個(gè)方向,東、西、南、北、東南、東北、西南、西北; 以所述筆跡數(shù)據(jù)的重心為結(jié)束點(diǎn),分別掃描各個(gè)筆畫(huà)段向量的中心坐標(biāo)在八個(gè)方向出 現(xiàn)的個(gè)數(shù)。6. -種筆跡特征提...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:曹驥,李健,張連毅,武衛(wèi)東,
申請(qǐng)(專利權(quán))人:北京捷通華聲語(yǔ)音技術(shù)有限公司,
類型:發(fā)明
國(guó)別省市:北京;11
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。