• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基于特征提取的圖書檢索方法技術

    技術編號:14013466 閱讀:94 留言:0更新日期:2016-11-17 15:08
    本發明專利技術涉及一種基于特征提取的圖書檢索方法,屬于網絡通信技術領域。本發明專利技術首先針對書庫圖書信息進行數據采集,提取圖書標簽信息,進行編碼標識,建立圖書信息庫,存儲圖書信息;其次,依據圖書標簽信息元素進行圖書聚類,對聚類后的書籍進行類別編碼作為檢索書籍的原始庫源,并結合圖書原始標簽進行圖書特征重組,提取各類別圖書的新的特征詞組,作為聚類圖書信息庫;然后,提取用戶訪問圖書落在聚類圖書信息庫中某類別的頻次,建立用戶訪問模型,形成用戶閱讀模式標簽,作為用戶特征標簽值;最后,建立匹配關聯度模型,為匹配成功用戶提供檢索圖書列表。本發明專利技術能夠針對用戶訪問特征進行實時檢索,能夠精確的滿足用戶訪問需求。

    【技術實現步驟摘要】

    本專利技術涉及一種基于特征提取的圖書檢索方法,屬于網絡通信

    技術介紹
    隨著圖書數量的劇增,以及相關部門對于閱讀書籍行為的推廣,較多的人開始重新開啟書籍知識的閱讀體驗。但是由于書籍種類繁雜,數目眾多,且均無序的陳列在藏書處或圖書庫,無形中增高了人們查閱書籍的難度,影響人們的閱讀體驗度。如何在快節奏的生活中,讓人們更加便捷的閱讀書籍,更加快速的找到自己需要的書籍種類是現下圖書檢索的核心問題。而常見圖書檢索方法常常采用書籍區域分庫陳列,圖書管理員定期分類整理,書店售貨員人工講解等方式來進行圖書檢索,不僅效率角度而且不利于讀者挑選,時間成本和人力投入都較大,不能滿足用戶的閱讀需求。
    技術實現思路
    本專利技術要解決的技術問題是提出一種基于特征提取的圖書檢索方法,用以解決上述問題。本專利技術的技術方案是:一種基于特征提取的圖書檢索方法,首先針對書庫圖書信息進行數據采集,提取圖書標簽信息,進行編碼標識,建立圖書信息庫,存儲圖書標簽特征信息;其次,依據圖書標簽信息元素進行圖書聚類,對聚類后的書籍進行類別編碼作為檢索書籍的原始庫源,并結合圖書原始標簽進行圖書特征重組,提取各類別圖書的新的特征詞組,作為聚類圖書信息庫;然后,提取用戶訪問圖書落在聚類圖書信息庫中某類別的頻次,建立用戶訪問模型,形成用戶閱讀模式標簽,作為用戶特征標簽值;最后,建立匹配關聯度模型,為匹配成功用戶提供檢索圖書列表。具體步驟為:Step1:建立圖書信息庫:對書庫中圖書信息進行數據采集,提取圖書標簽信息,包括圖書名稱、圖書所述領域及圖書出版信息,并對采集后的圖書進行編碼標識,按照【領域-名稱-出版社-出版日期】的形式進行存儲,所有圖書標簽特征信息均按照編碼依次放在圖書信息中;Step2:建立聚類圖書信息庫:依據圖書標簽信息元素進行圖書聚類,對聚類后的書籍進行類別編碼作為檢索書籍的原始庫源,并結合圖書原始標簽進行圖書特征重組,提取各類別圖書的新的特征詞組,作為聚類圖書信息庫:Step2.1:書簽聚類:1、首先,整合按照編碼依次存儲的圖書書簽信息,運用Spearman等級相關系數法建立圖書標簽定序信息之間的相關系數,定義該聚類參考系數的計算公式為: r s = 1 - 6 Σd i 2 n ( n 2 - 1 ) ; ( i , s = 1 , 2 , 3 ... ) ]]>其中,rs為Spearman的相關系數值,n是圖書聚類原始值樣本容量,di=(xi-yi)表示圖書標簽樣本xi和yi兩個標簽的是Minkowski距離;2、Spearman等級相關系數有-1≤rs≤1,rs為正值時,存在正的等級相關,可以按照相關系數值聚成一大類,rs取負值時,存在負的等級相關,書簽相關性差,分別聚為不同的小類,rs=1,表明兩個變量的等級完全相同,存在完全相關,聚為一個小類,rs=-1,表明兩個變量的等級完全相反,存在完全的負相關,聚成不同的大類;3、將Spearman相關系數指標進行熵值求權,步驟如下:將指標數據構成矩陣Z,并對指標進行標準化處理,獲得初始數據矩陣Z=(zij)m×n其中i=1,2,...,n;j=1,2,...,m,將矩陣元素歸一化處理取得標準化矩陣:Q=(qij)m×n;4、計算出圖書標簽特征值:評價矩陣Z中的第j類圖書的信息熵為:其中,分類信息效用價值為該信息熵Ej與1的差值,即:Dj=1-Ej;Step2.2:確定分類圖書的類別名稱,作為更新編碼,結合圖書原始標簽進行圖書特征重組,提取各類別圖書的新的特征詞組,作為聚類圖書信息庫,聚類圖書信息存儲方式為:【類別-名稱-特征】;Step3:建立用戶訪問模型:提取用戶訪問圖書落在聚類圖書信息庫中某類別的頻次,形成用戶閱讀模式標簽,作為用戶特征標簽值;Step3.1:用戶訪問頻次:基于用戶閱讀圖書的書目,整合訪問次數建立用戶訪問圖書類別頻次,其中訪問類A圖書的頻率計為:訪問類A圖書的次數/訪問圖書總次數,類B、類C等圖書的頻率計算公式可類比推出;Step3.2:用戶閱讀模式標簽:提取用戶訪問頻次計算結果,以某用戶訪問各類別圖書的頻率作為用戶閱讀標簽的權重,按照頻率大小進行排序,提取訪問頻率值作為用戶特征標簽,記錄為:【類別-頻率;類別-頻率,……】;Step4:建立匹配關聯度模型:將用戶閱讀模式標簽的類別與提取到的聚類圖書信息庫中的圖書標簽類別信息進行逐次對比,按照訪問類別的頻率大小,依次排列出檢索圖書類比列表,在聚類圖書列表中列舉出圖書的詳細數目信息列表,作為檢索圖書提供給用戶。本專利技術的有益效果是:1、本專利技術專利通過建立圖書信息庫,并通過Spearman相關系數聚類方法得出聚類圖書信息庫,采用用戶訪問圖書頻次信息特征提取等技術,實現了對用戶讀書標簽的準確匹配;并針對智能匹配的結果,實現了對用戶圖書列表的準確檢索。2、本專利技術專利針對圖書檢索現象,提供了閱讀書籍的實時檢索,極大的節省了用戶查詢時常,避免了時間資源的浪費,處理速度快,且能夠精確的滿足用戶訪問需求。讓人們可以更加便捷的閱讀書籍,更加快速的找到自己需要的書籍種類,增加閱讀體驗度。附圖說明圖1是本專利技術基于特征提取的圖書檢索方法總體流程圖。具體實施方式下面結合附圖和具體實施方式,對本專利技術作進一步說明。實施例1:如圖1所示:Step1:建立圖書信息庫:對書庫中圖書信息進行數據采集,提取圖書標簽信息,包括圖書名稱、圖書所述領域及圖書出版信息,并對采集后的圖書進行編碼標識,按照【領域-名稱-出版社-出版日期】的形式進行存儲,如【經管-瘋狂經濟學-南海出版社-2013年9月】。Step2:建立聚類圖書信息庫:Step2.1:書簽聚類:1、首先,整合按照編碼依次存儲的圖書書簽信息,運用Spearman等級相關系數法建立圖書標簽定序信息之間的相關系數,定義該聚類參考系數的計算公式為: r s = 1 - 6 Σd i 2 n ( n 2 - 1 ) ; ( i , s = 1 本文檔來自技高網...
    一種基于特征提取的圖書檢索方法

    【技術保護點】
    一種基于特征提取的圖書檢索方法,其特征在于:首先針對書庫圖書信息進行數據采集,提取圖書標簽信息,進行編碼標識,建立圖書信息庫,存儲圖書標簽特征信息;其次,依據圖書標簽信息元素進行圖書聚類,對聚類后的書籍進行類別編碼作為檢索書籍的原始庫源,并結合圖書原始標簽進行圖書特征重組,提取各類別圖書的新的特征詞組,作為聚類圖書信息庫;然后,提取用戶訪問圖書落在聚類圖書信息庫中某類別的頻次,建立用戶訪問模型,形成用戶閱讀模式標簽,作為用戶特征標簽值;最后,建立匹配關聯度模型,為匹配成功用戶提供檢索圖書列表。

    【技術特征摘要】
    1.一種基于特征提取的圖書檢索方法,其特征在于:首先針對書庫圖書信息進行數據采集,提取圖書標簽信息,進行編碼標識,建立圖書信息庫,存儲圖書標簽特征信息;其次,依據圖書標簽信息元素進行圖書聚類,對聚類后的書籍進行類別編碼作為檢索書籍的原始庫源,并結合圖書原始標簽進行圖書特征重組,提取各類別圖書的新的特征詞組,作為聚類圖書信息庫;然后,提取用戶訪問圖書落在聚類圖書信息庫中某類別的頻次,建立用戶訪問模型,形成用戶閱讀模式標簽,作為用戶特征標簽值;最后,建立匹配關聯度模型,為匹配成功用戶提供檢索圖書列表。2.根據權利要求1所述的基于特征提取的圖書檢索方法,其特征在于具體步驟為:Step1:建立圖書信息庫:對書庫中圖書信息進行數據采集,提取圖書標簽信息,包括圖書名稱、圖書所述領域及圖書出版信息,并對采集后的圖書進行編碼標識,按照【領域-名稱-出版社-出版日期】的形式進行存儲,所有圖書標簽特征信息均按照編碼依次放在圖書信息中;Step2:建立聚類圖書信息庫:依據圖書標簽信息元素進行圖書聚類,對聚類后的書籍進行類別編碼作為檢索書籍的原始庫源,并結合圖書原始標簽進行圖書特征重組,提取各類別圖書的新的特征詞組,作為聚類圖書信息庫:Step2.1:書簽聚類:1、首先,整合按照編碼依次存儲的圖書書簽信息,運用Spearman等級相關系數法建立圖書標簽定序信息之間的相關系數,定義該聚類參考系數的計算公式為: r s = 1 - 6 Σd i 2 n ( n 2 - 1 ) ; ( i , s = 1 , 2 , ...

    【專利技術屬性】
    技術研發人員:龍華劉永召
    申請(專利權)人:昆明理工大學
    類型:發明
    國別省市:云南;53

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 人妻无码一区二区三区AV| 无码 免费 国产在线观看91| 色综合久久中文字幕无码| 秋霞无码一区二区| 亚洲AV日韩AV无码污污网站| 无码国内精品久久人妻| 天堂一区人妻无码| 无码夫の前で人妻を侵犯| 久久久国产精品无码免费专区| 国产精品99无码一区二区| 无码专区一va亚洲v专区在线| 无码人妻丰满熟妇区免费| 无码人妻AⅤ一区二区三区水密桃 无码欧精品亚洲日韩一区夜夜嗨 无码免费又爽又高潮喷水的视频 无码毛片一区二区三区中文字幕 无码毛片一区二区三区视频免费播放 | 在线看片无码永久免费视频 | 亚洲AV无码AV吞精久久| 办公室丝袜激情无码播放| 中文字幕无码视频手机免费看| 中文字幕无码人妻AAA片| 亚洲精品无码国产片| 国产在线无码不卡影视影院| 黄A无码片内射无码视频| 久久精品无码av| 国产爆乳无码视频在线观看3| 亚洲中久无码不卡永久在线观看| 国产精品无码久久av不卡| 精品亚洲A∨无码一区二区三区| 国产在线观看无码免费视频| 国产乱子伦精品无码专区| 性色av无码免费一区二区三区 | 自慰无码一区二区三区| 亚洲AⅤ无码一区二区三区在线| 无码午夜人妻一区二区三区不卡视频 | 成人无码AV一区二区| 精品无码久久久久久久久久| 国产免费av片在线无码免费看| 国产av激情无码久久| 精品一区二区无码AV| 波多野结衣AV无码久久一区 | 亚洲中文字幕无码av| 久久精品亚洲AV久久久无码| 日韩少妇无码一区二区三区 |