【技術(shù)實(shí)現(xiàn)步驟摘要】
基于維度標(biāo)簽的搜索結(jié)果多維度導(dǎo)航方法
本專利技術(shù)涉及數(shù)據(jù)挖掘領(lǐng)域,尤其涉及基于維度標(biāo)簽的搜索結(jié)果多維度導(dǎo)航方法。
技術(shù)介紹
搜索引擎一般采用基于相關(guān)度排序的方式來呈現(xiàn)搜索結(jié)果。隨著數(shù)據(jù)量的劇增,其弊端日益突出:如,搜索結(jié)果排序不太準(zhǔn)確;用戶需花費(fèi)較多時間來獲取想要的信息;某些關(guān)于搜索結(jié)果的統(tǒng)計信息無法獲取。例如,使用現(xiàn)有搜索引擎,用戶難以獲取計算機(jī)領(lǐng)域論文分布最集中的子領(lǐng)域,同時獲取該子領(lǐng)域內(nèi)的論文在時間、地點(diǎn)和作者三方面上的具體分布情況,而該需求在實(shí)際應(yīng)用中十分重要?,F(xiàn)有搜索引擎在準(zhǔn)確度上進(jìn)行了大量改進(jìn),利用優(yōu)先級和相關(guān)性對搜索結(jié)果進(jìn)行排序,使用戶感興趣的搜索結(jié)果優(yōu)先呈現(xiàn)。例如,公開號為101305364的專利文獻(xiàn)公開了用于呈現(xiàn)搜索結(jié)果的系統(tǒng)和方法??梢曰谝粋€或多個標(biāo)準(zhǔn)混合搜索結(jié)果和/或區(qū)分搜索結(jié)果的優(yōu)先級??梢曰谟脩魴n案數(shù)據(jù)、優(yōu)選廣告商/商戶排序或其組合來混合搜索結(jié)果或區(qū)分搜索結(jié)果的優(yōu)先級。搜索結(jié)果可以與廣播和/或流式內(nèi)容同時在顯示設(shè)備上呈現(xiàn)給觀看者。搜索結(jié)果可以被“推”到客戶端一方設(shè)備,并與相關(guān)的廣播內(nèi)容一起呈現(xiàn)?;蛘?,搜索結(jié)果可以是基于一個或多個用戶提供的搜索標(biāo)準(zhǔn)的。在展示方式上也進(jìn)行了拓展。例如,公開號為103092958A的專利文獻(xiàn)公開了一種搜索結(jié)果展示方法和裝置,所述方法包括:獲取用戶的搜索請求;根據(jù)所述搜索請求在存儲有多種視頻來源的數(shù)據(jù)庫中進(jìn)行查詢,以得到初步搜索結(jié)果;根據(jù)所述初步搜索結(jié)果,計算出各視頻來源對應(yīng)的搜索結(jié)果列表,分別對各搜索結(jié)果列表進(jìn)行統(tǒng)計,生成多個包含視頻來源名稱及所述視頻來源名稱對應(yīng)的搜索結(jié)果總數(shù)的搜索分類展示按鈕;在 ...
【技術(shù)保護(hù)點(diǎn)】
一種基于維度標(biāo)簽的搜索結(jié)果多維度導(dǎo)航方法,其特征在于,包括如下步驟:步驟1,讀取所有文檔的維度信息,初始化文檔概要集,并將當(dāng)前結(jié)果集以及臨時結(jié)果集設(shè)置為所有文檔;步驟2,根據(jù)文檔概要集以及當(dāng)前結(jié)果集構(gòu)建維度層次樹及分頁形式的文檔列表,并顯示維度層次樹、文檔列表中的指定頁面以及分頁信息;步驟3,等待用戶指令,并在接收到用戶指令后,判斷來自用戶的操作指令的類型并進(jìn)行相應(yīng)操作:若為過濾或?yàn)g覽,進(jìn)入步驟4;若為查詢,則根據(jù)查詢中的條件,由搜索引擎進(jìn)行搜索并返回帶有維度標(biāo)簽的搜索結(jié)果集,并用帶有維度標(biāo)簽的搜索結(jié)果集替換當(dāng)前結(jié)果集,返回步驟2;若為翻頁,則得到用戶輸入的頁碼號K,進(jìn)入步驟6;步驟4,利用操作指令生成操作請求,再根據(jù)操作請求更新臨時結(jié)果集,并對維度層次樹進(jìn)行相應(yīng)的處理,接著根據(jù)操作類型進(jìn)入對應(yīng)的后續(xù)步驟:若為過濾,則依據(jù)臨時結(jié)果集更新維度層次樹上各個節(jié)點(diǎn)的節(jié)點(diǎn)統(tǒng)計量,利用臨時結(jié)果集替換當(dāng)前結(jié)果集,并進(jìn)入步驟5;若為瀏覽,則直接進(jìn)入步驟5;步驟5,根據(jù)臨時結(jié)果集中有效文檔的個數(shù)更新文檔列表的分頁信息,將頁碼號K設(shè)為預(yù)設(shè)的指定頁面,并進(jìn)入步驟6;步驟6,將臨時結(jié)果集中的有效文檔按分頁信息 ...
【技術(shù)特征摘要】
2014.05.12 CN 201410198185.11.一種基于維度標(biāo)簽的搜索結(jié)果多維度導(dǎo)航方法,其特征在于,包括如下步驟:步驟1,讀取所有文檔的維度信息,初始化文檔概要集,并將當(dāng)前結(jié)果集以及臨時結(jié)果集設(shè)置為所有文檔;步驟1中所有文檔為預(yù)存的文檔,其中每個文檔的維度信息包括維度ID以及對應(yīng)的維度值,且每個文檔根據(jù)內(nèi)容提取出文檔概要,從而形成文檔概要集;步驟2,根據(jù)文檔概要集以及當(dāng)前結(jié)果集構(gòu)建維度層次樹及分頁形式的文檔列表,并顯示維度層次樹、文檔列表中的指定頁面以及分頁信息;步驟2中,創(chuàng)建維度層次樹的步驟如下:步驟2-1,創(chuàng)建維度層次樹的樹根節(jié)點(diǎn),其中,樹根節(jié)點(diǎn)的節(jié)點(diǎn)統(tǒng)計量為零,孩子節(jié)點(diǎn)為空,樹根節(jié)點(diǎn)對應(yīng)的實(shí)體為根實(shí)體;步驟2-2,判斷當(dāng)前結(jié)果集中是否存在未訪問的文檔概要:是,則根據(jù)當(dāng)前結(jié)果集從文檔概要集中取出一個未訪問的文檔概要,進(jìn)入步驟2-3;否則維度層次樹創(chuàng)建結(jié)束;步驟2-3,判斷文檔概要中是否存在未訪問的維度值集合:是,則取出一個未訪問的維度值集合,進(jìn)入步驟2-4;否則,返回步驟2-2;步驟2-4,判斷維度值集合中是否存在未訪問的維度值:是,取出一個未訪問的維度值,進(jìn)入步驟2-5;否則,返回步驟2-3;步驟2-5,對于當(dāng)前維度值集合中的維度值,判斷維度層次樹中是否存在從樹根到該維度值所在節(jié)點(diǎn)的路徑:是,進(jìn)入步驟2-7;否則,進(jìn)入步驟2-6;步驟2-6,在維度層次樹中創(chuàng)建路徑中所有缺失的節(jié)點(diǎn),對于每個新節(jié)點(diǎn),節(jié)點(diǎn)統(tǒng)計量為零,對應(yīng)的孩子節(jié)點(diǎn)集為空,維度值設(shè)為該節(jié)點(diǎn)對應(yīng)的維度值,進(jìn)入步驟2-7;步驟2-7,將路徑上所有節(jié)點(diǎn)的節(jié)點(diǎn)統(tǒng)計量加1,對于路徑中未指定孩子節(jié)點(diǎn)的節(jié)點(diǎn),將其直接后繼節(jié)點(diǎn)設(shè)為其孩子節(jié)點(diǎn),其中路徑上最后一個節(jié)點(diǎn)的孩子節(jié)點(diǎn)為空,接著返回步驟2-4;步驟3,等待用戶指令,并在接收到用戶指令后,判斷來自用戶的操作指令的類型并進(jìn)行相應(yīng)操作:若為過濾或?yàn)g覽,進(jìn)入步驟4;若為查詢,則根據(jù)查詢中的條件,由搜索引擎進(jìn)行搜索并返回帶有維度標(biāo)簽的搜索結(jié)果集,并用帶有維度標(biāo)簽的搜索結(jié)果集替換當(dāng)前結(jié)果集,返回步驟2;若為翻頁,則得到用戶輸入的頁碼K,進(jìn)入步驟6;步驟4,利用操作指令生成操作請求,再根據(jù)操作請求更新臨時結(jié)果集,并對維度層次樹進(jìn)行相應(yīng)的處理,接著根據(jù)操作類型進(jìn)入對應(yīng)的后續(xù)步驟:若為過濾,則依據(jù)臨時結(jié)果集更新維度層次樹上各個節(jié)點(diǎn)的節(jié)點(diǎn)統(tǒng)計量,利用臨時結(jié)果集替換當(dāng)前結(jié)果集,并進(jìn)入步驟5;若為瀏覽,則直接進(jìn)入步驟5;步驟5,根據(jù)臨時結(jié)果集中有效文檔的個數(shù)更新文檔列表的分頁信息,將頁碼K設(shè)為預(yù)設(shè)的指定頁面,并進(jìn)入步驟6;步驟6,將臨時結(jié)果集中的有效文檔按分頁信息劃分,獲取對應(yīng)第K頁的文檔概要,并將每個文檔概要構(gòu)建成一條列表項,將N個列表項用于更新文檔列表...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:陳嶺,錢坤,
申請(專利權(quán))人:浙江大學(xué),
類型:發(fā)明
國別省市:浙江;33
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。