• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>
    當前位置: 首頁 > 專利查詢>武漢大學專利>正文

    基于多分類器融合的筆跡鑒別方法技術

    技術編號:3826552 閱讀:477 留言:0更新日期:2012-04-11 18:40
    本發明專利技術公開了一種基于多分類器融合的筆跡鑒別方法。首先,將影響筆跡鑒別分類輸出的因子分為兩類:書寫因子與字符因子。建立分類輸出的兩因子分解模型,采用數據挖掘方法,得到兩因子分解模型中的常用漢字的字符因子。然后,對兩因子分解模型中的書寫因子給出了估計方法。最后,把書寫因子作為最終的筆跡鑒別分類器進行筆跡鑒別。本發明專利技術方法解決了文本依存筆跡鑒別的理論方法無法滿足實際應用需求的問題。面向大型樣本筆跡庫時,本鑒別方法能得到十分理想的一對多筆跡鑒別分類結果。作一對一筆跡鑒別,其鑒別準確率高達98%。

    【技術實現步驟摘要】

    本專利技術涉及一種,屬于基于筆跡的計算機 身份認證
    背景內容筆跡鑒別(Handwriting Identification)是根據不同人的書寫筆跡來判斷 書寫人身份的一種技術。 一對多的筆跡鑒別是從對應不同書寫人的多份參考 樣本筆跡中找出與待檢驗筆跡的書寫風格最接近的樣本。計算機筆跡鑒別方法根據所考察的對象可分為兩大類文本獨立(Text ind印endent)方法和文本依存(Text d印endent)方法。己有的文本獨立方法主要 是提取整幅筆跡的布局特征或字符大致形態,一般需要幾頁寫滿字跡的筆跡樣本 以提取穩定的特征。文本依存方法則從檢驗筆跡和參考筆跡中選擇相同字(在筆 跡鑒別領域稱為特征字)進行比較。文本依存方法相對文本獨立方法而言,可以 提取更多的字符特征進行分析,只需要少量字符就可以有較高的準確度,因此在 中文筆跡鑒別中屬常用方法。作一對一筆跡鑒別時,文本依存方法較為有效,但 作一對多筆跡鑒別時,則會遇到很大的問題在實際的筆跡鑒別中收集到的筆跡 大多書寫內容不相同,檢材筆跡與不同樣本筆跡的特征字內容都不相同,文本依 存方法的分類器與字符有關,不同的字符產生的分類器有時無法相互比較。
    技術實現思路
    本專利技術目的就是為了克服上述現有技術的不足而提供一種筆跡鑒別分類器, 該分類器是基于多個文本依存的分類器融合而成,消除了文本依存分類器中的字 符因子,具有近似的文本獨立性。本筆跡鑒別分類器解決了由于檢材筆跡與不同 樣本筆跡的特征字不同、分類器不同而無法準確分類鑒別的問題。本專利技術提供一種,包括以下步驟(1) 以單個字符為圖像單元分別提取檢材筆跡和樣本筆跡的筆跡特征向量;(2) 將檢材筆跡和樣本筆跡中的相同字符進行特征匹配,設檢材筆跡特征向量 為f ,樣本筆跡特征向量為f,則特征匹配距離為"i/(Z力 (1.1)(3) 建立文本依存分類器的兩因子分解模型 檢材筆跡和樣本筆跡中有多個相同字符匹配,所以文本依存的筆跡鑒別過程產生多個分類器,有多個分類鑒別結果。在一對一的筆跡鑒別中,必須將多個分 類結果綜合成一個結果,得出最終的鑒別結論。 一對多的筆跡識別檢索中,也須 將多個分類器綜合成一個分類器,以便于分類排序。影響特征匹配距離d-d(X,f)的因素有兩個筆跡書寫因子和字符因子。 筆跡書寫因子包括書寫者、書寫風格、書寫速度、書寫工具和書寫環境等。字 符因子包括字符結構(與字符的文本內容有關)和字體等。檢材筆跡與樣本筆跡書寫因子的差異大小,直接決定分類器d = 的分 類輸出值大小。由于書寫習慣,書寫水平的差異,不同人書寫的字符,在筆畫的緊湊程度, 字符的傾斜方向,筆畫起、收筆的位置,方向和形態等書寫風格上存在差異。同 時,書寫速度、書寫工具和書寫環境等因素也對字符的書寫造成影響。書寫因子 的差異造成書寫的相同字符在形狀上的差異,這是筆跡鑒別的基礎。 一般來說, 筆跡間書寫因子的差異性越大,筆跡特征向量的距離匹配值^-"(W)就越大。書寫因子通過字符反映出來,但字符自身的結構對分類器J = C/(U)也有顯著的影響。實驗表明,字符結構形態的復雜度與匹配距離cZ-d(i,f)的大小成反比關系字符筆劃少、結構簡單,則數學期望£(力較大;字符筆劃多、結構復 雜,則數學期望£(力較小。通過實驗研究,分類器d-d(x,:P)可按如下模型進行分解:lnc/" + a + y5 + s (1.2) 其中//為常數,a為書寫因子效應(簡稱書寫因子),/ 為字符因子效應(簡 稱為字符因子),f為隨機誤差。(4) //、 a、 p的求解設筆跡鑒別中,檢材筆跡一份,樣本筆跡有N份,樣本筆跡編號為 hl,2,…iV,設檢材筆跡與每份樣本筆跡具有M個相同的匹配字符,編號為j、l,2,…M,如果N = l,即為一對一的筆跡鑒別。用《表示第/份樣本筆跡中 編號為j'的字符與檢材筆跡中編號為/的字符進行特征向量距離匹配的結果,模型(1.2)可具體表示為ln《=A + a,+A+~ (/ = 1,2,...仏y-l,2,…M ) (1.3) 其中,;/為常數,a,是檢材書寫因子與第/號樣本書寫因子的差異效應,^為檢 材筆跡與樣本筆跡中編號為/的字符因子的差異效應, 為均值為0的隨機誤//、 a,、 ^的估計表達為《=—"n《—^(,、1,2,…AO (1.3.2) 'M臺 yA;丄f]in^-//(/ = 1,2,...M) (1.3.3)式(1.3)——(1.3.3)的理論依據是無重復的兩因子方差分析法。 采用方差分析法,模型(1.3)可用矩法、高階相關法、城市街區距離匹配 法、方向指數法、簡化的Wigner法等文本依存筆跡鑒別法進行驗證。在筆跡鑒別實際應用中,要求檢材筆跡與所有樣本筆跡匹配的相同字符都一 致是很難滿足的。如檢材筆跡與1號樣本的相同漢字可能是"你、我、他",而 與2號樣本的相同漢字可能是"的、地、得",兩組字符不一致。在這種情況下, 無法用公式(1.3.1)——(1.3.3)來估計書寫因子和字符因子。針對中文筆跡 鑒別的實際應用,可以只考慮常用漢字的筆跡鑒別。對常用漢字字符進行統一編 號。設檢材筆跡與第Z份樣本筆跡的有^f,個相同漢字,其相同漢字對應的統一編號集為"4^-l,2,…M,j,則模型(1.2)具體表示為ln《=// + "〖+;^ +、 (/:l,2,…AO (1.4)采用信息挖掘技術可解決字符因子/ ^與常數y"的求解問題。為便于信息挖掘,將式(1.4)中的常數項A與字符因子々^合并,則ln《=",+/ 么" = l,2,,.,AO (1.5)厶為Q個常用漢字中的任意一個,用如下信息挖掘方法求解所有的々1 : 第一步,收集常用手寫漢字P份,即P個人每人書寫Q個常用漢字1份;第二步,選出所有編號為j' (j' =1, 2, 3……Q)的漢字,共P個;第三步,計算檢材筆跡中編號為y的漢字與第二步所提到的p個漢字筆跡特征匹配距離,共有P個距離;第四步,對第三步得到的每個距離值取對數,并求這P個距離對數的平均值,用此平均值作為"二的估計值^二 。在模型(1.5)中,用信息挖掘值^二代替P二 ,令《=ln《-(1.6)于是有(/",2,…AO (1.7)書寫因子"/的用下式估計《=;2X "、l,2,…iV) (1.8)氣't=i(5)基于多個文依存分類器融合的新分類器 將式(1.8)的《作為一對多筆跡鑒別新分類器,對于此分類器,有如下結論此分類器是基于多個文本依存分類器融合而成,它消除了多個文本依存分類器中的字符因子,具有近似文本獨立性。此分類器能大幅提高筆跡分類鑒別準確率。式(1.8)中,當N充分大時, 也能得到非常理想的筆跡鑒別準確率,這表明此分類器滿足實戰應用的需求。此分類器也可以作為一對一筆跡鑒別分類器。模型U.3)中,N=l時,便 是一對一筆跡鑒別模型。該分類器對于一對一的筆跡鑒別可得到非常高的鑒別準 確率。本專利技術方法提高了面向大樣本筆跡數據庫的一對多筆跡鑒別檢索的準確率, 同時也提高一對一筆跡鑒別精度。利用計算機筆跡鑒別進行身份認證,在公共安 全,金融,考古等需要確定書寫筆跡作者的領域有廣泛的應用前景。 具體實施例方式下面結合具體實施例對本專利技術作進一步的說明。一種包括以下步驟(1) 以本文檔來自技高網...

    【技術保護點】
    一種基于多分類器融合的筆跡鑒別方法,其特征在于包括以下步驟: (1)以單個字符為圖像單元分別提取檢材筆跡和樣本筆跡的筆跡特征向量; (2)將檢材筆跡和樣本筆跡中的相同字符進行特征向量匹配,設檢材筆跡特征向量為*,樣本筆跡特征向量為*,則特征向量匹配距離為 d=d(*,*) (1.1) (3)建立文依存分類器分解模型 分類器d=d(*,*)按如下模型進行分解: lnd=μ+α+β+ε (1.2) 設筆跡鑒別中,檢材筆跡一份,樣本筆跡有N份,樣本筆跡編號為i=1,2,…N,檢材筆跡與每份樣本筆跡具有M個相同的匹配字符,編號為j=1,2,…M,用d↓[ij]表示第i份樣本筆跡中編號為j的字符與檢材筆跡中編號為j的字符進行特征向量距離匹配的結果, lnd↓[ij]=μ+α↓[i]+β↓[j]+ε↓[ij](i=1,2,…N,j=1,2,…M) (1.3) 其中,μ為常數,α↓[i]是檢材書寫因子與第i號樣本書寫因子的差異效應,β↓[j]為檢材筆跡與樣本筆跡中編號為j的字符因子的差異效應,ε↓[ij]為均值為0的隨機誤差; 對常用漢字字符進行統一編號,設檢材筆跡與第i份樣本筆跡的有M↓[i]個相同漢字,其相同漢字對應的統一編號集為{j↓[k]|k=1,2,…M↓[i]},分類器分解模型為 lnd↓[ij↓[k]]=μ+α↓[i]+β↓[j↓[k]]+ε↓[ij↓[k]] (i=1,2,…N) (1.4) (4)字符因子挖掘與書寫因子估計 將式(1. 4)中的常數項μ與字符因子β↓[j↓[k]]合并,則 lnd↓[ij↓[k]]=α↓[i]+β′↓[j↓[k]]+ε↓[ij↓[k]] (i=1,2,…N) (1.5) j↓[k]為Q個常用漢字中的任意一個,用如下信息挖掘方法求解所有的β′↓[j↓[k]]: 第一步,收集常用手寫漢字P份,即P個人每人書寫Q個常用漢字1份; 第二步,選出所有編號為j′(j′=1,2,3……Q)的漢字,共P個; 第三步,計算檢材筆跡中編號為j的漢字與第二步所提到的P個漢字筆跡特征匹配距離,共有P個距離; 第四步,對第三步得到的每個距離值取對數,并求這P個距離對數的平均值,用此平均值作為β′↓[j↓[k]]的估計值*′↓[j↓[k]]; 在模型(1. 5)中,用信息挖掘值*′↓[j↓[k]]代替β′↓[j↓[k]],令: d′↓[ij↓[k]]=lnd↓[ij↓[k]]-*′↓[j↓[k]] (1...

    【技術特征摘要】

    【專利技術屬性】
    技術研發人員:陳慶虎鄧偉鄢煜塵袁鳳
    申請(專利權)人:武漢大學
    類型:發明
    國別省市:83[中國|武漢]

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 中文字幕无码一区二区三区本日 | 国产在线无码精品电影网| 无码夜色一区二区三区| 亚洲精品无码少妇30P| 国产成人无码区免费A∨视频网站| 国产成人亚洲综合无码精品 | 亚洲AV永久无码精品网站在线观看| 青春草无码精品视频在线观| 亚洲中文字幕久久精品无码A| 东京热人妻无码人av| 无码Aⅴ在线观看| 亚洲成AV人片在线观看无码| 无码国产69精品久久久久孕妇 | MM1313亚洲精品无码久久| 亚洲色中文字幕无码AV| 色欲香天天综合网无码| 西西大胆无码视频免费| 国产成人无码免费看视频软件| 九九久久精品无码专区| 无码日韩精品一区二区人妻| 亚洲AV无码一区二区三区性色| 久久久无码一区二区三区 | 久久久久亚洲av无码尤物| 亚洲精品无码av天堂| 国产精品无码无片在线观看3D | 亚洲国产a∨无码中文777| 亚洲精品无码你懂的网站| 无码av大香线蕉伊人久久| 无码办公室丝袜OL中文字幕| 日本精品无码一区二区三区久久久 | 亚洲中文字幕无码av永久| 久久午夜无码鲁丝片秋霞| 特级无码毛片免费视频尤物| 亚洲av无码不卡| 免费无码中文字幕A级毛片| 秋霞鲁丝片Av无码少妇| AV无码久久久久不卡网站下载| 一本无码人妻在中文字幕免费 | 国产午夜无码福利在线看网站 | 熟妇人妻系列aⅴ无码专区友真希| 国产精品热久久无码av|