【技術實現步驟摘要】
本專利技術涉及一種基于特征提取的圖書檢索方法,屬于網絡通信
技術介紹
隨著圖書數量的劇增,以及相關部門對于閱讀書籍行為的推廣,較多的人開始重新開啟書籍知識的閱讀體驗。但是由于書籍種類繁雜,數目眾多,且均無序的陳列在藏書處或圖書庫,無形中增高了人們查閱書籍的難度,影響人們的閱讀體驗度。如何在快節奏的生活中,讓人們更加便捷的閱讀書籍,更加快速的找到自己需要的書籍種類是現下圖書檢索的核心問題。而常見圖書檢索方法常常采用書籍區域分庫陳列,圖書管理員定期分類整理,書店售貨員人工講解等方式來進行圖書檢索,不僅效率角度而且不利于讀者挑選,時間成本和人力投入都較大,不能滿足用戶的閱讀需求。
技術實現思路
本專利技術要解決的技術問題是提出一種基于特征提取的圖書檢索方法,用以解決上述問題。本專利技術的技術方案是:一種基于特征提取的圖書檢索方法,首先針對書庫圖書信息進行數據采集,提取圖書標簽信息,進行編碼標識,建立圖書信息庫,存儲圖書標簽特征信息;其次,依據圖書標簽信息元素進行圖書聚類,對聚類后的書籍進行類別編碼作為檢索書籍的原始庫源,并結合圖書原始標簽進行圖書特征重組,提取各類別圖書的新的特征詞組,作為聚類圖書信息庫;然后,提取用戶訪問圖書落在聚類圖書信息庫中某類別的頻次,建立用戶訪問模型,形成用戶閱讀模式標簽,作為用戶特征標簽值;最后,建立匹配關聯度模型,為匹配成功用戶提供檢索圖書列表。具體步驟為:Step1:建立圖書信息庫:對書庫中圖書信息進行數據采集,提取圖書標簽信息,包括圖書名稱、圖書所述領域及圖書出版信息,并對采集后的圖書進行編碼標識,按照【領域-名稱-出版 ...
【技術保護點】
一種基于特征提取的圖書檢索方法,其特征在于:首先針對書庫圖書信息進行數據采集,提取圖書標簽信息,進行編碼標識,建立圖書信息庫,存儲圖書標簽特征信息;其次,依據圖書標簽信息元素進行圖書聚類,對聚類后的書籍進行類別編碼作為檢索書籍的原始庫源,并結合圖書原始標簽進行圖書特征重組,提取各類別圖書的新的特征詞組,作為聚類圖書信息庫;然后,提取用戶訪問圖書落在聚類圖書信息庫中某類別的頻次,建立用戶訪問模型,形成用戶閱讀模式標簽,作為用戶特征標簽值;最后,建立匹配關聯度模型,為匹配成功用戶提供檢索圖書列表。
【技術特征摘要】
1.一種基于特征提取的圖書檢索方法,其特征在于:首先針對書庫圖書信息進行數據采集,提取圖書標簽信息,進行編碼標識,建立圖書信息庫,存儲圖書標簽特征信息;其次,依據圖書標簽信息元素進行圖書聚類,對聚類后的書籍進行類別編碼作為檢索書籍的原始庫源,并結合圖書原始標簽進行圖書特征重組,提取各類別圖書的新的特征詞組,作為聚類圖書信息庫;然后,提取用戶訪問圖書落在聚類圖書信息庫中某類別的頻次,建立用戶訪問模型,形成用戶閱讀模式標簽,作為用戶特征標簽值;最后,建立匹配關聯度模型,為匹配成功用戶提供檢索圖書列表。2.根據權利要求1所述的基于特征提取的圖書檢索方法,其特征在于具體步驟為:Step1:建立圖書信息庫:對書庫中圖書信息進行數據采集,提取圖書標簽信息,包括圖書名稱、圖書所述領域及圖書出版信息,并對采集后的圖書進行編碼標識,按照【領域-名稱-出版社-出版日期】的形式進行存儲,所有圖書標簽特征信息均按照編碼依次放在圖書信息中;Step2:建立聚類圖書信息庫:依據圖書標簽信息元素進行圖書聚類,對聚類后的書籍進行類別編碼作為檢索書籍的原始庫源,并結合圖書原始標簽進行圖書特征重組,提取各類別圖書的新的特征詞組,作為聚類圖書信息庫:Step2.1:書簽聚類:1、首先,整合按照編碼依次存儲的圖書書簽信息,運用Spearman等級相關系數法建立圖書標簽定序信息之間的相關系數,定義該聚類參考系數的計算公式為: r s = 1 - 6 Σd i 2 n ( n 2 - 1 ) ; ( i , s = 1 , 2 , ...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。