• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>
    當(dāng)前位置: 首頁 > 專利查詢>浙江大學(xué)專利>正文

    基于維度標(biāo)簽的搜索結(jié)果多維度導(dǎo)航方法技術(shù)

    技術(shù)編號:10910913 閱讀:123 留言:0更新日期:2015-01-14 18:11
    本發(fā)明專利技術(shù)公開了一種基于維度標(biāo)簽的搜索結(jié)果多維度導(dǎo)航方法,利用文檔的維度信息生成維度層次樹。本發(fā)明專利技術(shù)要求文檔帶有多個不同維度標(biāo)簽(如概念、時間、地點(diǎn)、人物),且各維度應(yīng)具有層次結(jié)構(gòu);以“過濾”或“瀏覽”模式通過維度層次樹與用戶交互;并通過維度層次樹與文檔列表向用戶呈現(xiàn)交互結(jié)果中文檔在各維度上的分布與概要。本發(fā)明專利技術(shù)可在維度上按層展開結(jié)果集、查看分布信息和文檔概要,幫助、并加快用戶從海量結(jié)果中獲取所需知識的速度,在知識發(fā)現(xiàn)、結(jié)果分析呈現(xiàn)以及數(shù)據(jù)挖掘領(lǐng)域有著廣闊的前景。

    【技術(shù)實(shí)現(xiàn)步驟摘要】
    基于維度標(biāo)簽的搜索結(jié)果多維度導(dǎo)航方法
    本專利技術(shù)涉及數(shù)據(jù)挖掘領(lǐng)域,尤其涉及基于維度標(biāo)簽的搜索結(jié)果多維度導(dǎo)航方法。
    技術(shù)介紹
    搜索引擎一般采用基于相關(guān)度排序的方式來呈現(xiàn)搜索結(jié)果。隨著數(shù)據(jù)量的劇增,其弊端日益突出:如,搜索結(jié)果排序不太準(zhǔn)確;用戶需花費(fèi)較多時間來獲取想要的信息;某些關(guān)于搜索結(jié)果的統(tǒng)計信息無法獲取。例如,使用現(xiàn)有搜索引擎,用戶難以獲取計算機(jī)領(lǐng)域論文分布最集中的子領(lǐng)域,同時獲取該子領(lǐng)域內(nèi)的論文在時間、地點(diǎn)和作者三方面上的具體分布情況,而該需求在實(shí)際應(yīng)用中十分重要?,F(xiàn)有搜索引擎在準(zhǔn)確度上進(jìn)行了大量改進(jìn),利用優(yōu)先級和相關(guān)性對搜索結(jié)果進(jìn)行排序,使用戶感興趣的搜索結(jié)果優(yōu)先呈現(xiàn)。例如,公開號為101305364的專利文獻(xiàn)公開了用于呈現(xiàn)搜索結(jié)果的系統(tǒng)和方法??梢曰谝粋€或多個標(biāo)準(zhǔn)混合搜索結(jié)果和/或區(qū)分搜索結(jié)果的優(yōu)先級??梢曰谟脩魴n案數(shù)據(jù)、優(yōu)選廣告商/商戶排序或其組合來混合搜索結(jié)果或區(qū)分搜索結(jié)果的優(yōu)先級。搜索結(jié)果可以與廣播和/或流式內(nèi)容同時在顯示設(shè)備上呈現(xiàn)給觀看者。搜索結(jié)果可以被“推”到客戶端一方設(shè)備,并與相關(guān)的廣播內(nèi)容一起呈現(xiàn)?;蛘?,搜索結(jié)果可以是基于一個或多個用戶提供的搜索標(biāo)準(zhǔn)的。在展示方式上也進(jìn)行了拓展。例如,公開號為103092958A的專利文獻(xiàn)公開了一種搜索結(jié)果展示方法和裝置,所述方法包括:獲取用戶的搜索請求;根據(jù)所述搜索請求在存儲有多種視頻來源的數(shù)據(jù)庫中進(jìn)行查詢,以得到初步搜索結(jié)果;根據(jù)所述初步搜索結(jié)果,計算出各視頻來源對應(yīng)的搜索結(jié)果列表,分別對各搜索結(jié)果列表進(jìn)行統(tǒng)計,生成多個包含視頻來源名稱及所述視頻來源名稱對應(yīng)的搜索結(jié)果總數(shù)的搜索分類展示按鈕;在視頻結(jié)果展示界面展示所述多個搜索分類展示按鈕及所有視頻來源的搜索結(jié)果列表,或者展示所述多個搜索分類展示按鈕及第一視頻來源對應(yīng)的搜索結(jié)果列表。該專利文獻(xiàn)實(shí)現(xiàn)了對直播、回放、VOD、互聯(lián)網(wǎng)視頻和UGC等不同內(nèi)容來源視頻搜索結(jié)果的統(tǒng)一展現(xiàn),可生成并顯示更方便于用戶使用的數(shù)據(jù)。搜索引擎一般假設(shè)文檔除文本信息外是沒有其他屬性的,而隨著數(shù)據(jù)資源質(zhì)量的提升和文本處理技術(shù)的發(fā)展,可以從文檔中抽取屬性,即為文檔添加標(biāo)簽。標(biāo)簽按其語義,可歸屬于不同的維度(如概念、時間、地點(diǎn)、人物等),維度一般具有層次結(jié)構(gòu)(如“國家-省-地區(qū)”為地點(diǎn)維度的層次結(jié)構(gòu))。文檔本身帶有多個不同的維度標(biāo)簽為設(shè)計新的搜索結(jié)果呈現(xiàn)方法提供了空間。當(dāng)前,對新搜索結(jié)果呈現(xiàn)方法的研究已有所發(fā)展,但效果不是很理想。采取聚類或基于特征向量聚類的方法,需要大量的計算,且在特征向量維度較大時,聚類效果會變差;采取相關(guān)度或帶有優(yōu)先權(quán)的相關(guān)度排序的方法,仍屬于單維度呈現(xiàn)方法,無法提供多維度的呈現(xiàn)功能;采取折疊方式分層展示的方法,以不同直徑的同心圓展示當(dāng)前數(shù)據(jù)節(jié)點(diǎn)及其下層孩子節(jié)點(diǎn),視覺上比較直觀,但無法查看同一層次上數(shù)據(jù)的分布情況,缺乏宏觀性。此外,上述方法均只提供一種查看模式,與用戶的交互能力偏弱。
    技術(shù)實(shí)現(xiàn)思路
    本專利技術(shù)要解決的問題是提供一種交互性強(qiáng)、可智能導(dǎo)航的結(jié)果集呈現(xiàn)方法,搜索得到的數(shù)據(jù)集是帶有多種維度標(biāo)簽的文檔集。一種基于維度標(biāo)簽的搜索結(jié)果多維度導(dǎo)航方法,包括如下步驟:步驟1,讀取所有文檔的維度信息,初始化文檔概要集,并將當(dāng)前結(jié)果集以及臨時結(jié)果集設(shè)置為所有文檔;步驟2,根據(jù)文檔概要集以及當(dāng)前結(jié)果集構(gòu)建維度層次樹及分頁形式的文檔列表,并顯示維度層次樹、文檔列表中的指定頁面以及分頁信息;步驟3,等待用戶指令,并在接收到用戶指令后,判斷來自用戶的操作指令的類型并進(jìn)行相應(yīng)操作:若為過濾或?yàn)g覽,進(jìn)入步驟4;若為查詢,則根據(jù)查詢中的條件,由搜索引擎進(jìn)行搜索并返回帶有維度標(biāo)簽的搜索結(jié)果集,并用帶有維度標(biāo)簽的搜索結(jié)果集替換當(dāng)前結(jié)果集,返回步驟2;若為翻頁,則得到用戶輸入的頁碼K,進(jìn)入步驟6;步驟4,利用操作指令生成操作請求,再根據(jù)操作請求更新臨時結(jié)果集,并對維度層次樹進(jìn)行相應(yīng)的處理,接著根據(jù)操作類型進(jìn)入對應(yīng)的后續(xù)步驟:若為過濾,則依據(jù)臨時結(jié)果集更新維度層次樹上各個節(jié)點(diǎn)的節(jié)點(diǎn)統(tǒng)計量,利用臨時結(jié)果集替換當(dāng)前結(jié)果集,并進(jìn)入步驟5;若為瀏覽,則直接進(jìn)入步驟5;步驟5,根據(jù)臨時結(jié)果集中有效文檔的個數(shù)更新文檔列表的分頁信息,將頁碼K設(shè)為預(yù)設(shè)的指定頁面,并進(jìn)入步驟6;步驟6,將臨時結(jié)果集中的有效文檔按分頁信息劃分,獲取對應(yīng)第K頁的文檔概要,并將每個文檔概要構(gòu)建成一條列表項,將N個列表項用于更新文檔列表中顯示窗口的內(nèi)容,返回步驟3,其中N為預(yù)設(shè)值。本專利技術(shù)要求文檔具有維度信息,通過讀取文檔的維度信息來生成維度層次樹。文檔列表以分頁形式顯示臨時結(jié)果集中有效文檔,其包含顯示窗口和分頁信息。文檔列表將其數(shù)據(jù)源(臨時結(jié)果集中有效文檔組成的集合)按順序分組,每組N個文檔概要,每組又稱作“一頁”。每次顯示窗口中的內(nèi)容為文檔列表的數(shù)據(jù)源中第K頁的N個文檔概要所構(gòu)建的N個列表項。查詢的操作條件為若干關(guān)鍵詞。在步驟5中,更新文檔列表的分頁信息方法為,先統(tǒng)計有效文檔的總數(shù),依據(jù)每頁文檔個數(shù),確定總頁數(shù)。其中,步驟1中所有文檔為預(yù)存的文檔,其中每個文檔的維度信息包括維度ID以及對應(yīng)的維度值,且每個文檔可根據(jù)內(nèi)容提取出文檔概要,從而形成文檔概要集。步驟2中,文檔列表中的指定頁面為文檔列表的首頁。由于文檔通常數(shù)量較大,如果一次性構(gòu)建全部列表頁面耗時較長,因此在初次顯示時僅在顯示窗口中顯示由首頁文檔概要構(gòu)建成的列表項,其他頁面根據(jù)用戶所選擇的頁面再進(jìn)行構(gòu)建,并在顯示窗口中顯示出來。在步驟1中得到的文檔概要集表示為Dall={d1,d2,…,dm},其中在文檔概要集Dall中的ID為i的文檔概要di表示為在文檔概要di中維度ID為j的維度值集合w為的元素個數(shù)。在文檔概要集中,每個文檔概要具有多個維度值,這些維度值從文檔概要中提取得到。在步驟2中,創(chuàng)建維度層次樹的步驟如下:步驟2-1,創(chuàng)建維度層次樹的樹根節(jié)點(diǎn),其中,樹根節(jié)點(diǎn)的節(jié)點(diǎn)統(tǒng)計量為零,孩子節(jié)點(diǎn)為空,樹根節(jié)點(diǎn)對應(yīng)的實(shí)體為根實(shí)體;步驟2-2,判斷當(dāng)前結(jié)果集中是否存在未訪問的文檔概要:是,則根據(jù)當(dāng)前結(jié)果集從文檔概要集中取出一個未訪問的文檔概要,進(jìn)入步驟2-3;否則維度層次樹創(chuàng)建結(jié)束;步驟2-3,判斷文檔概要中是否存在未訪問的維度值集合:是,則取出一個未訪問的維度值集合,進(jìn)入步驟2-4;否則,返回步驟2-2;步驟2-4,判斷維度值集合中是否存在未訪問的維度值:是,取出一個未訪問的維度值,進(jìn)入步驟2-5;否則,返回步驟2-3;步驟2-5,對于當(dāng)前維度值集合中的維度值,判斷維度層次樹中是否存在從樹根到該維度值所在節(jié)點(diǎn)的路徑:是,進(jìn)入步驟2-7;否則,進(jìn)入步驟2-6;步驟2-6,在維度層次樹中創(chuàng)建路徑中所有缺失的節(jié)點(diǎn),對于每個新節(jié)點(diǎn),節(jié)點(diǎn)統(tǒng)計量為零,對應(yīng)的孩子節(jié)點(diǎn)集為空,維度值設(shè)為該節(jié)點(diǎn)對應(yīng)的維度值,進(jìn)入步驟2-7;步驟2-7,將路徑上所有節(jié)點(diǎn)的節(jié)點(diǎn)統(tǒng)計量加1,對于路徑中未指定孩子節(jié)點(diǎn)的節(jié)點(diǎn),將其直接后繼節(jié)點(diǎn)設(shè)為其孩子節(jié)點(diǎn),其中路徑上最后一個節(jié)點(diǎn)的孩子節(jié)點(diǎn)為空,接著返回步驟2-4。根實(shí)體是以所有維度層次樹的樹根所代表的實(shí)體為孩子實(shí)體的一個虛構(gòu)實(shí)體。該實(shí)體是一個抽象實(shí)體,不具有實(shí)際含義。當(dāng)前結(jié)果集中每個文檔添加兩個屬性,一個是文檔ID,另外一個是用以標(biāo)記當(dāng)前文檔是否有效的dirty。通過以上方法建立的維度層次樹,使得各個文檔概本文檔來自技高網(wǎng)
    ...
    基于維度標(biāo)簽的搜索結(jié)果多維度導(dǎo)航方法

    【技術(shù)保護(hù)點(diǎn)】
    一種基于維度標(biāo)簽的搜索結(jié)果多維度導(dǎo)航方法,其特征在于,包括如下步驟:步驟1,讀取所有文檔的維度信息,初始化文檔概要集,并將當(dāng)前結(jié)果集以及臨時結(jié)果集設(shè)置為所有文檔;步驟2,根據(jù)文檔概要集以及當(dāng)前結(jié)果集構(gòu)建維度層次樹及分頁形式的文檔列表,并顯示維度層次樹、文檔列表中的指定頁面以及分頁信息;步驟3,等待用戶指令,并在接收到用戶指令后,判斷來自用戶的操作指令的類型并進(jìn)行相應(yīng)操作:若為過濾或?yàn)g覽,進(jìn)入步驟4;若為查詢,則根據(jù)查詢中的條件,由搜索引擎進(jìn)行搜索并返回帶有維度標(biāo)簽的搜索結(jié)果集,并用帶有維度標(biāo)簽的搜索結(jié)果集替換當(dāng)前結(jié)果集,返回步驟2;若為翻頁,則得到用戶輸入的頁碼號K,進(jìn)入步驟6;步驟4,利用操作指令生成操作請求,再根據(jù)操作請求更新臨時結(jié)果集,并對維度層次樹進(jìn)行相應(yīng)的處理,接著根據(jù)操作類型進(jìn)入對應(yīng)的后續(xù)步驟:若為過濾,則依據(jù)臨時結(jié)果集更新維度層次樹上各個節(jié)點(diǎn)的節(jié)點(diǎn)統(tǒng)計量,利用臨時結(jié)果集替換當(dāng)前結(jié)果集,并進(jìn)入步驟5;若為瀏覽,則直接進(jìn)入步驟5;步驟5,根據(jù)臨時結(jié)果集中有效文檔的個數(shù)更新文檔列表的分頁信息,將頁碼號K設(shè)為預(yù)設(shè)的指定頁面,并進(jìn)入步驟6;步驟6,將臨時結(jié)果集中的有效文檔按分頁信息劃分,獲取對應(yīng)第K頁的文檔概要,并將每個文檔概要構(gòu)建成一條列表項,將N個列表項用于更新文檔列表中顯示窗口的內(nèi)容,返回步驟3,其中N為預(yù)設(shè)值。...

    【技術(shù)特征摘要】
    2014.05.12 CN 201410198185.11.一種基于維度標(biāo)簽的搜索結(jié)果多維度導(dǎo)航方法,其特征在于,包括如下步驟:步驟1,讀取所有文檔的維度信息,初始化文檔概要集,并將當(dāng)前結(jié)果集以及臨時結(jié)果集設(shè)置為所有文檔;步驟1中所有文檔為預(yù)存的文檔,其中每個文檔的維度信息包括維度ID以及對應(yīng)的維度值,且每個文檔根據(jù)內(nèi)容提取出文檔概要,從而形成文檔概要集;步驟2,根據(jù)文檔概要集以及當(dāng)前結(jié)果集構(gòu)建維度層次樹及分頁形式的文檔列表,并顯示維度層次樹、文檔列表中的指定頁面以及分頁信息;步驟2中,創(chuàng)建維度層次樹的步驟如下:步驟2-1,創(chuàng)建維度層次樹的樹根節(jié)點(diǎn),其中,樹根節(jié)點(diǎn)的節(jié)點(diǎn)統(tǒng)計量為零,孩子節(jié)點(diǎn)為空,樹根節(jié)點(diǎn)對應(yīng)的實(shí)體為根實(shí)體;步驟2-2,判斷當(dāng)前結(jié)果集中是否存在未訪問的文檔概要:是,則根據(jù)當(dāng)前結(jié)果集從文檔概要集中取出一個未訪問的文檔概要,進(jìn)入步驟2-3;否則維度層次樹創(chuàng)建結(jié)束;步驟2-3,判斷文檔概要中是否存在未訪問的維度值集合:是,則取出一個未訪問的維度值集合,進(jìn)入步驟2-4;否則,返回步驟2-2;步驟2-4,判斷維度值集合中是否存在未訪問的維度值:是,取出一個未訪問的維度值,進(jìn)入步驟2-5;否則,返回步驟2-3;步驟2-5,對于當(dāng)前維度值集合中的維度值,判斷維度層次樹中是否存在從樹根到該維度值所在節(jié)點(diǎn)的路徑:是,進(jìn)入步驟2-7;否則,進(jìn)入步驟2-6;步驟2-6,在維度層次樹中創(chuàng)建路徑中所有缺失的節(jié)點(diǎn),對于每個新節(jié)點(diǎn),節(jié)點(diǎn)統(tǒng)計量為零,對應(yīng)的孩子節(jié)點(diǎn)集為空,維度值設(shè)為該節(jié)點(diǎn)對應(yīng)的維度值,進(jìn)入步驟2-7;步驟2-7,將路徑上所有節(jié)點(diǎn)的節(jié)點(diǎn)統(tǒng)計量加1,對于路徑中未指定孩子節(jié)點(diǎn)的節(jié)點(diǎn),將其直接后繼節(jié)點(diǎn)設(shè)為其孩子節(jié)點(diǎn),其中路徑上最后一個節(jié)點(diǎn)的孩子節(jié)點(diǎn)為空,接著返回步驟2-4;步驟3,等待用戶指令,并在接收到用戶指令后,判斷來自用戶的操作指令的類型并進(jìn)行相應(yīng)操作:若為過濾或?yàn)g覽,進(jìn)入步驟4;若為查詢,則根據(jù)查詢中的條件,由搜索引擎進(jìn)行搜索并返回帶有維度標(biāo)簽的搜索結(jié)果集,并用帶有維度標(biāo)簽的搜索結(jié)果集替換當(dāng)前結(jié)果集,返回步驟2;若為翻頁,則得到用戶輸入的頁碼K,進(jìn)入步驟6;步驟4,利用操作指令生成操作請求,再根據(jù)操作請求更新臨時結(jié)果集,并對維度層次樹進(jìn)行相應(yīng)的處理,接著根據(jù)操作類型進(jìn)入對應(yīng)的后續(xù)步驟:若為過濾,則依據(jù)臨時結(jié)果集更新維度層次樹上各個節(jié)點(diǎn)的節(jié)點(diǎn)統(tǒng)計量,利用臨時結(jié)果集替換當(dāng)前結(jié)果集,并進(jìn)入步驟5;若為瀏覽,則直接進(jìn)入步驟5;步驟5,根據(jù)臨時結(jié)果集中有效文檔的個數(shù)更新文檔列表的分頁信息,將頁碼K設(shè)為預(yù)設(shè)的指定頁面,并進(jìn)入步驟6;步驟6,將臨時結(jié)果集中的有效文檔按分頁信息劃分,獲取對應(yīng)第K頁的文檔概要,并將每個文檔概要構(gòu)建成一條列表項,將N個列表項用于更新文檔列表...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:陳嶺,錢坤
    申請(專利權(quán))人:浙江大學(xué)
    類型:發(fā)明
    國別省市:浙江;33

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 四虎成人精品国产永久免费无码 | 无码高潮少妇毛多水多水免费| 中文字幕丰满乱子伦无码专区| 亚洲国产成人无码av在线播放| 国产成人无码aa精品一区 | 久久精品aⅴ无码中文字字幕| 中文字幕日产无码| 国产成人无码av| 成人毛片无码一区二区| 亚洲大尺度无码专区尤物| 国产精品爆乳奶水无码视频| 日韩免费无码一区二区三区| 中文无码成人免费视频在线观看| 亚洲大尺度无码无码专线一区| 亚洲AV无码成人精品区在线观看| 亚洲毛片av日韩av无码| 无码天堂亚洲国产AV| 亚洲av无码一区二区三区人妖 | 日韩丰满少妇无码内射| 亚洲Av无码乱码在线播放| 亚洲a∨无码一区二区| 亚洲日韩精品无码AV海量| 无码精品黑人一区二区三区| 97无码人妻福利免费公开在线视频| 无码天堂va亚洲va在线va| 无码人妻啪啪一区二区| 中文午夜人妻无码看片| 中文字幕乱偷无码av先锋蜜桃 | 亚洲精品无码高潮喷水在线| 中文字幕无码av激情不卡久久| 国产高清不卡无码视频| 亚洲精品无码久久久久AV麻豆| yy111111少妇影院无码| 免费无码又爽又刺激网站| 国产丰满乱子伦无码专区| 国产精品无码一区二区三区电影| 国内精品人妻无码久久久影院导航 | 水蜜桃av无码一区二区| 日韩精品真人荷官无码| 18精品久久久无码午夜福利| 精品亚洲AV无码一区二区|