System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及信息,特別涉及一種基于余弦相似度的請(qǐng)求域名校正方法及系統(tǒng)。
技術(shù)介紹
1、dns服務(wù)在實(shí)際應(yīng)用中,很重要的一項(xiàng)作用是作為互聯(lián)網(wǎng)中的尋址。使用可讀性更好的字符形式的域名,再借助a或aaaa這樣的資源記錄完成域名到ip地址的映射,進(jìn)而達(dá)成對(duì)難以記憶的ip地址的替換。
2、但隨著不斷被添加使用的域名,簡(jiǎn)短的域名資源很快已經(jīng)耗盡,大量被使用的域名會(huì)是在一定可接受范圍內(nèi),相對(duì)較長(zhǎng)的域名。這就帶來了在輸入域名過程中可能出現(xiàn)的拼寫錯(cuò)誤,導(dǎo)致應(yīng)用程序發(fā)起dns查詢時(shí)請(qǐng)求的域名并非發(fā)起者期望的域名。在出現(xiàn)這種情況時(shí),由于實(shí)際發(fā)出的域名可能不存在,對(duì)應(yīng)得到的結(jié)果就會(huì)出現(xiàn)nxdomain,給發(fā)起者帶來困惑。此外,請(qǐng)求發(fā)起者發(fā)現(xiàn)這種拼寫錯(cuò)誤并進(jìn)行糾正后,還需要額外發(fā)起一次正確域名的請(qǐng)求,可能存在一定的額外延遲,并消耗一定的額外dns服務(wù)器帶寬資源。
技術(shù)實(shí)現(xiàn)思路
1、基于此,本申請(qǐng)實(shí)施例提供了一種基于余弦相似度的請(qǐng)求域名校正方法及系統(tǒng),本方法通過將相似域名進(jìn)行關(guān)聯(lián),實(shí)現(xiàn)在服務(wù)器端發(fā)現(xiàn)可能的潛在拼寫錯(cuò)誤,并在一次應(yīng)答結(jié)果中將可能的原本請(qǐng)求結(jié)果一并返回,減少此類情況下可能出現(xiàn)的負(fù)面影響。
2、第一方面,提供了一種基于余弦相似度的請(qǐng)求域名校正方法,該方法包括:
3、在服務(wù)器端建立域名文本庫(kù),域名文本庫(kù)用于存儲(chǔ)曾經(jīng)請(qǐng)求過且對(duì)應(yīng)的域名存在的文本;
4、當(dāng)客戶端發(fā)送dns查詢請(qǐng)求時(shí),服務(wù)器首先檢查請(qǐng)求的域名是否存在。如果請(qǐng)求的域名不存在,即返回nxdoma
5、對(duì)于選取的鏈表中的每個(gè)域名,執(zhí)行余弦相似度匹配;
6、一旦找到相似度達(dá)到預(yù)設(shè)閾值的域名,服務(wù)器將這些相似域名的記錄填充到dns應(yīng)答的附加段中返回給客戶端;
7、客戶端在收到dns應(yīng)答后,如果發(fā)現(xiàn)是nxdomain結(jié)果,會(huì)檢查應(yīng)答中是否包含similar記錄,如果存在,客戶端利用similar記錄來干預(yù)緩存策略,將附加段中的記錄緩存下來,并通過應(yīng)用程序反饋給用戶可能存在的拼寫錯(cuò)誤提示。
8、可選地,在服務(wù)器端建立域名文本庫(kù),具體包括:
9、文本在存儲(chǔ)前需要統(tǒng)一轉(zhuǎn)換為小寫,并以鏈表的形式組織,鏈表的長(zhǎng)度可以設(shè)置一個(gè)上限,當(dāng)達(dá)到這個(gè)上限時(shí),根據(jù)請(qǐng)求的熱度替換掉那些請(qǐng)求熱度較低的域名數(shù)據(jù)。
10、可選地,在服務(wù)器端建立域名文本庫(kù),還包括:
11、將不同長(zhǎng)度的域名文本分別存儲(chǔ)在不同的鏈表中,不同的鏈表通過一個(gè)數(shù)組來組織,數(shù)組的索引值對(duì)應(yīng)鏈表中域名文本的長(zhǎng)度減1。
12、可選地,對(duì)于選取的鏈表中的每個(gè)域名,執(zhí)行余弦相似度匹配,包括:
13、首先需要對(duì)域名進(jìn)行分詞,具體按照每個(gè)字符進(jìn)行劃分;
14、將兩個(gè)域名的所有字符去重后放入字典數(shù)據(jù)結(jié)構(gòu)中,并為每個(gè)字符分配一個(gè)唯一的值;
15、根據(jù)字典中的值,將域名文本轉(zhuǎn)換為整數(shù)數(shù)組,并計(jì)算出兩個(gè)文本的獨(dú)熱編碼作為詞頻向量;
16、根據(jù)詞頻向量計(jì)算兩個(gè)向量夾角的余弦值,得出相似度。
17、可選地,一旦找到相似度達(dá)到預(yù)設(shè)閾值的域名,服務(wù)器將這些相似域名的記錄填充到dns應(yīng)答的附加段中返回給客戶端,還包括:
18、服務(wù)器定義一個(gè)協(xié)議擴(kuò)展用的偽資源記錄類型,名為similar。
19、可選地,客戶端利用similar記錄來干預(yù)緩存策略,將附加段中的記錄緩存下來之后,還包括
20、當(dāng)用戶重新提交拼寫正確的域名時(shí),客戶端直接使用本地緩存的記錄,避免額外的網(wǎng)絡(luò)請(qǐng)求和延遲。
21、第二方面,提供了一種基于余弦相似度的請(qǐng)求域名校正系統(tǒng),該系統(tǒng)包括:
22、建立模塊,用于在服務(wù)器端建立域名文本庫(kù),域名文本庫(kù)用于存儲(chǔ)曾經(jīng)請(qǐng)求過且對(duì)應(yīng)的域名存在的文本;
23、檢查模塊,用于當(dāng)客戶端發(fā)送dns查詢請(qǐng)求時(shí),服務(wù)器首先檢查請(qǐng)求的域名是否存在。如果請(qǐng)求的域名不存在,即返回nxdomain結(jié)果,服務(wù)器則進(jìn)入相似域名匹配流程;
24、匹配模塊,用于對(duì)于選取的鏈表中的每個(gè)域名,執(zhí)行余弦相似度匹配;
25、返回模塊,用于一旦找到相似度達(dá)到預(yù)設(shè)閾值的域名,服務(wù)器將這些相似域名的記錄填充到dns應(yīng)答的附加段中返回給客戶端;
26、客戶端模塊,客戶端在收到dns應(yīng)答后,如果發(fā)現(xiàn)是nxdomain結(jié)果,會(huì)檢查應(yīng)答中是否包含similar記錄,如果存在,客戶端利用similar記錄來干預(yù)緩存策略,將附加段中的記錄緩存下來,并通過應(yīng)用程序反饋給用戶可能存在的拼寫錯(cuò)誤提示。
27、第三方面,提供了一種電子設(shè)備,包括存儲(chǔ)器和處理器,存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,處理器執(zhí)行計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述第一方面任一所述的請(qǐng)求域名校正方法。
28、第四方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述第一方面任一所述的請(qǐng)求域名校正方法。
29、第五方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序/指令,計(jì)算機(jī)程序/指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述第一方面任一所述的請(qǐng)求域名校正方法。
30、本申請(qǐng)實(shí)施例提供的技術(shù)方案帶來的有益效果至少包括:
31、(1)通過在dns查詢中實(shí)現(xiàn)拼寫錯(cuò)誤的自動(dòng)糾正,減少了用戶因域名拼寫錯(cuò)誤而遇到的問題,從而提高了用戶在使用互聯(lián)網(wǎng)服務(wù)時(shí)的體驗(yàn)。
32、(2)通過在一次dns查詢中返回可能正確的相似域名,減少了因拼寫錯(cuò)誤導(dǎo)致的額外dns查詢,從而節(jié)省了dns服務(wù)器的帶寬資源,并減少了網(wǎng)絡(luò)延遲,提高了網(wǎng)絡(luò)效率。
33、(3)允許客戶端根據(jù)服務(wù)器返回的相似域名記錄智能調(diào)整緩存策略,使得即使在拼寫錯(cuò)誤的情況下,用戶也能快速訪問正確的域名,提升了訪問速度和系統(tǒng)的響應(yīng)能力。
本文檔來自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種基于余弦相似度的請(qǐng)求域名校正方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的請(qǐng)求域名校正方法,其特征在于,在服務(wù)器端建立域名文本庫(kù),具體包括:
3.根據(jù)權(quán)利要求1所述的請(qǐng)求域名校正方法,其特征在于,在服務(wù)器端建立域名文本庫(kù),還包括:
4.根據(jù)權(quán)利要求1所述的請(qǐng)求域名校正方法,其特征在于,對(duì)于選取的鏈表中的每個(gè)域名,執(zhí)行余弦相似度匹配,包括:
5.根據(jù)權(quán)利要求1所述的請(qǐng)求域名校正方法,其特征在于,一旦找到相似度達(dá)到預(yù)設(shè)閾值的域名,服務(wù)器將這些相似域名的記錄填充到DNS應(yīng)答的附加段中返回給客戶端,還包括:
6.根據(jù)權(quán)利要求1所述的請(qǐng)求域名校正方法,其特征在于,客戶端利用similar記錄來干預(yù)緩存策略,將附加段中的記錄緩存下來之后,還包括
7.一種基于余弦相似度的請(qǐng)求域名校正系統(tǒng),其特征在于,所述系統(tǒng)包括:
8.一種電子設(shè)備,其特征在于,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至6任一所述方法的步驟。
9.一種計(jì)算機(jī)
10.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序/指令,其特征在于,該計(jì)算機(jī)程序/指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至6中任一項(xiàng)所述方法的步驟。
...【技術(shù)特征摘要】
1.一種基于余弦相似度的請(qǐng)求域名校正方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的請(qǐng)求域名校正方法,其特征在于,在服務(wù)器端建立域名文本庫(kù),具體包括:
3.根據(jù)權(quán)利要求1所述的請(qǐng)求域名校正方法,其特征在于,在服務(wù)器端建立域名文本庫(kù),還包括:
4.根據(jù)權(quán)利要求1所述的請(qǐng)求域名校正方法,其特征在于,對(duì)于選取的鏈表中的每個(gè)域名,執(zhí)行余弦相似度匹配,包括:
5.根據(jù)權(quán)利要求1所述的請(qǐng)求域名校正方法,其特征在于,一旦找到相似度達(dá)到預(yù)設(shè)閾值的域名,服務(wù)器將這些相似域名的記錄填充到dns應(yīng)答的附加段中返回給客戶端,還包括:
6.根據(jù)權(quán)利要求1所述的請(qǐng)求域名校正方法,其...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:陳超,蔣超,朱睿爽,邢志杰,毛偉,
申請(qǐng)(專利權(quán))人:互聯(lián)網(wǎng)域名系統(tǒng)北京市工程研究中心有限公司,
類型:發(fā)明
國(guó)別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。