本發(fā)明專利技術(shù)公布了一種基于客戶端實時聚合的元搜索引擎系統(tǒng),包括客戶端軟件和服務(wù)器端系統(tǒng)兩部分,其特點在于,將元搜索引擎服務(wù)器上運行的聚合搜索任務(wù)轉(zhuǎn)移到客戶端軟件上完成,從而減少對搜索服務(wù)器的壓力,減少對搜索服務(wù)器數(shù)量和網(wǎng)絡(luò)帶寬的需求,節(jié)約成本。本發(fā)明專利技術(shù)的客戶端軟件的形式和編程語言不受限制,可以是:瀏覽器的插件、ActiveX控件、Applet,腳本或者存于獨立的可執(zhí)行軟件中,它直接將用戶的搜索請求發(fā)送到第三方源搜索引擎系統(tǒng)實時檢索數(shù)據(jù),并將返回的結(jié)果在客戶端進(jìn)行聚合處理:包括緩存、去重、排序,最后將聚合后的結(jié)果展現(xiàn)給用戶。服務(wù)器端主要完成對客戶端軟件的參數(shù)設(shè)置、下載、版本更新。
【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)涉及互聯(lián)網(wǎng)搜索引擎技術(shù),具體設(shè)計一種基于客戶端實時聚合的元搜索引擎系統(tǒng)。
技術(shù)介紹
觀察百度和谷歌搜索引擎返回的搜索結(jié)果,會發(fā)現(xiàn)前200條搜索結(jié)果中,大概有 40%左右的鏈接是相同的,各自還有60%左右的數(shù)據(jù)沒有進(jìn)入對方前200的排名。也就是說,如果使用百度搜索引擎,只查看前200條的話,看不到大約120條左右谷歌認(rèn)為應(yīng)進(jìn)入前200名的搜索結(jié)果。如果兩個搜索引擎都看的話,又有80條左右的數(shù)據(jù)重復(fù)看了,這樣既浪費了用戶的時間,而且使用起來需要在兩個搜索引擎之間切換,不太方便。元搜索引擎系統(tǒng)可以將多個搜索引擎的結(jié)果進(jìn)行整合去重,可有效解決上述問題。目前的元搜索引擎系統(tǒng)都是將聚合搜索任務(wù)放在服務(wù)器端完成,客戶端只是通過瀏覽器發(fā)送請求和顯示搜索結(jié)果。通常有兩種方式,一是用戶通過瀏覽器將請求發(fā)送給元搜索引擎服務(wù)器,服務(wù)器實時將請求轉(zhuǎn)發(fā)到多個第三方源搜索引擎系統(tǒng)進(jìn)行搜索,并將它們返回的搜索結(jié)果在元搜索引擎服務(wù)器上進(jìn)行匯集、篩選、刪并等優(yōu)化處理后,再返回給客戶端的瀏覽器顯示。這種方式的弊端是當(dāng)大量客戶端同時訪問的話,如果服務(wù)器端的處理能力不夠,客戶端的響應(yīng)速度會變得很慢。另一種方式就是元搜索引擎服務(wù)器端事先整合好第三方源搜索引擎系統(tǒng)的數(shù)據(jù),當(dāng)收到客戶端的請求時,直接從整合的數(shù)據(jù)中檢索出結(jié)果,返回給客戶端。這種方式仍然需要消耗大量服務(wù)器和硬盤資源,同時很難和第三方源搜索引擎系統(tǒng)的數(shù)據(jù)同步。基于上述原因,雖然現(xiàn)在國內(nèi)外有不少元搜索引擎系統(tǒng),要么響應(yīng)速度慢,要么返回的結(jié)果太少,滿足不了用戶的需要。
技術(shù)實現(xiàn)思路
本專利技術(shù)設(shè)計了一種基于客戶端實時聚合的元搜索引擎系統(tǒng),其核心模塊主要由客戶端軟件和服務(wù)器端系統(tǒng)兩部分組成,和傳統(tǒng)元搜索引擎系統(tǒng)的最大不同是,客戶端軟件直接將用戶請求發(fā)送到第三方源搜索引擎系統(tǒng)進(jìn)行搜索,并將它們返回的搜索結(jié)果在客戶端上進(jìn)行去重整合,最后將整合后的結(jié)果呈現(xiàn)給用戶。服務(wù)器端僅需完成對客戶端軟件的參數(shù)設(shè)置、下載和版本更新。附圖說明圖1為傳統(tǒng)元搜索引擎系統(tǒng)的結(jié)構(gòu)示意圖,圖中數(shù)字含義如下1 客戶端接收用戶輸入的關(guān)鍵詞,向元搜索引擎服務(wù)器發(fā)送搜索請求2 元搜索引擎服務(wù)器將搜索請求轉(zhuǎn)發(fā)給多個第三方源搜索引擎系統(tǒng)3 第三方源搜索引擎系統(tǒng)返回搜索結(jié)果4 元搜索引擎服務(wù)器把結(jié)果去重整合后返回給客戶端圖2為基于客戶端實時聚合的元搜索引擎系統(tǒng)的結(jié)構(gòu)示意圖,圖中數(shù)字含義如下1 客戶端訪問元搜索引擎服務(wù)器2 元搜索引擎服務(wù)器返回搜索頁面3:客戶端客戶端接收用戶輸入的關(guān)鍵詞,直接將搜索請求轉(zhuǎn)發(fā)給多個第三方源搜索引擎系統(tǒng)4 第三方源搜索引擎系統(tǒng)返回搜索結(jié)果,客戶端去重整合引顯示圖3為基于客戶端實時聚合的元搜索引擎系統(tǒng)的實現(xiàn)示意圖。具體實施例方式本專利技術(shù)中的服務(wù)器端是個網(wǎng)站,當(dāng)用戶訪問網(wǎng)站時,返回搜索頁面給客戶端,這點和通常的搜索引擎網(wǎng)站一樣。搜索頁面界面很簡單,主要是提供一個文本框給用戶輸入搜索關(guān)鍵詞和一個搜索提交按鈕。搜索頁面加載時,會檢測客戶端軟件是否已安裝,是否有新版本,如果沒有安裝或有新版本,就從服務(wù)器下載最新的客戶端軟件,進(jìn)行安裝或升級。本專利技術(shù)的客戶端軟件的形式和編程語言不受限制,可以是瀏覽器的插件、 ActiveX控件、Applet,腳本或者存于獨立的可執(zhí)行軟件中。雖然他們的表現(xiàn)形式可以不同, 但實現(xiàn)的基本功能都和附圖3描述的一樣。如果客戶端軟件是獨立的可執(zhí)行軟件,則啟動方式不是訪問網(wǎng)站,而是直接運行即可。服務(wù)器端通過設(shè)置參數(shù)告訴客戶端從哪些第三方源搜索引擎系統(tǒng)獲取搜索數(shù)據(jù), 實現(xiàn)的方式有兩種一是直接將這些參數(shù)做成隱含字段附在搜索頁面,或者做成多選按鈕讓用戶選擇;二是客戶端發(fā)新請求,服務(wù)器返回參數(shù)。服務(wù)器端通過后臺管理軟件設(shè)置這些參數(shù)。客戶端軟件在接收用戶輸入的搜索詞后,采用多線程方式直接將搜索請求發(fā)給多個第三方源搜索引擎系統(tǒng),進(jìn)行并行搜索。客戶端軟件接收第三方源搜索引擎系統(tǒng)返回的結(jié)果,去除重復(fù)部分,保存到緩沖區(qū)中。客戶端軟件采用分頁的方式,把緩沖區(qū)中的搜索結(jié)果呈現(xiàn)給用戶。客戶端軟件進(jìn)一步可以預(yù)先多獲取一些搜索數(shù)據(jù)放到緩沖區(qū)中,以提高用戶搜索速度。比如用戶正在看第1頁內(nèi)容的同時,客戶端軟件在后臺可下載第2頁甚至更多的內(nèi)容到緩沖區(qū),等用戶看第2頁時,搜索結(jié)果馬上就可從緩沖區(qū)獲得。客戶端軟件是獨自完成自己的搜索任務(wù),互相之間沒有影響。基于客戶端實時聚合的元搜索引擎系統(tǒng),能和傳統(tǒng)的全文搜索引擎系統(tǒng)相結(jié)合, 組合成一個混合搜索引擎系統(tǒng)。搜索時的數(shù)據(jù)來源包括本身的全文搜索引擎系統(tǒng)、其它第三方搜索引擎系統(tǒng),在客戶端將結(jié)果聚合后呈現(xiàn)給用戶。本專利技術(shù)的核心思想是將傳統(tǒng)搜索引擎系統(tǒng)服務(wù)器端的搜索任務(wù)轉(zhuǎn)移到客戶端完成,從而可大大減少服務(wù)器的數(shù)量和網(wǎng)絡(luò)帶寬的需求,降低成本。一般大型搜索引擎網(wǎng)站的服務(wù)器數(shù)量是成千上萬臺,使用本專利技術(shù)的方案,服務(wù)器的數(shù)量可減少到幾十甚至幾臺,因為原來服務(wù)器承擔(dān)的主要搜索任務(wù)改由更多的客戶端的計算機(jī)承擔(dān)了,服務(wù)器主要提供搜索入口界面和客戶端軟件的下載更新。而且通過預(yù)取緩存技術(shù),用戶的搜索體驗速度還要更快。權(quán)利要求1.一種基于客戶端實時聚合的元搜索引擎系統(tǒng),其特征在于包括客戶端軟件直接將用戶的搜索請求發(fā)送到第三方源搜索引擎系統(tǒng)實時檢索數(shù)據(jù),并將返回的結(jié)果在客戶端進(jìn)行去重、排序、顯示;服務(wù)器端完成對客戶端軟件的參數(shù)設(shè)置、下載、版本更新;第三方源搜索引擎系統(tǒng)用于提供原始搜索數(shù)據(jù),是客戶端軟件整合的數(shù)據(jù)來源。2.根據(jù)權(quán)利要求1所述的基于客戶端實時聚合的元搜索引擎系統(tǒng),其特征是客戶端軟件以多線程方式訪問第三方源搜索引擎系統(tǒng),來提高搜索速度。3.根據(jù)權(quán)利要求1所述的基于客戶端實時聚合的元搜索引擎系統(tǒng),其特征是客戶端軟件根據(jù)搜索關(guān)鍵詞預(yù)先取得搜索結(jié)果保存到緩存區(qū)中,當(dāng)請求顯示這些數(shù)據(jù)時,可立即從緩存區(qū)取得數(shù)據(jù)進(jìn)行顯示。4.根據(jù)權(quán)利要求1所述的基于客戶端實時聚合的元搜索引擎系統(tǒng),其特征是客戶端軟件的形式和編程語言不受限制,可以是瀏覽器的插件、ActiveX控件、Applet,腳本或者存于獨立的可執(zhí)行軟件中。5.基于客戶端實時聚合的元搜索引擎系統(tǒng),其特征是能檢測客戶端軟件是否安裝,是否需要升級。6.基于客戶端實時聚合的元搜索引擎系統(tǒng),其特征是能和傳統(tǒng)的全文搜索引擎系統(tǒng)相結(jié)合,組合成一個混合搜索引擎系統(tǒng)。搜索時的數(shù)據(jù)來源包括本身的全文搜索引擎系統(tǒng)、其它第三方搜索引擎系統(tǒng),在客戶端將結(jié)果聚合后呈現(xiàn)給用戶。全文摘要本專利技術(shù)公布了一種基于客戶端實時聚合的元搜索引擎系統(tǒng),包括客戶端軟件和服務(wù)器端系統(tǒng)兩部分,其特點在于,將元搜索引擎服務(wù)器上運行的聚合搜索任務(wù)轉(zhuǎn)移到客戶端軟件上完成,從而減少對搜索服務(wù)器的壓力,減少對搜索服務(wù)器數(shù)量和網(wǎng)絡(luò)帶寬的需求,節(jié)約成本。本專利技術(shù)的客戶端軟件的形式和編程語言不受限制,可以是瀏覽器的插件、ActiveX控件、Applet,腳本或者存于獨立的可執(zhí)行軟件中,它直接將用戶的搜索請求發(fā)送到第三方源搜索引擎系統(tǒng)實時檢索數(shù)據(jù),并將返回的結(jié)果在客戶端進(jìn)行聚合處理包括緩存、去重、排序,最后將聚合后的結(jié)果展現(xiàn)給用戶。服務(wù)器端主要完成對客戶端軟件的參數(shù)設(shè)置、下載、版本更新。文檔編號G06F17/30GK102393858SQ201110370069公開日2012年3月28日 申請日期2011年11月21日 優(yōu)先權(quán)日2011年本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點】
【技術(shù)特征摘要】
...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:陳洪,
申請(專利權(quán))人:陳洪,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。