System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及數(shù)據(jù)處理,具體涉及一種農(nóng)業(yè)知識(shí)圖譜數(shù)據(jù)擴(kuò)展和修正方法和系統(tǒng)。
技術(shù)介紹
1、在農(nóng)業(yè)信息化快速發(fā)展的今天,農(nóng)業(yè)知識(shí)圖譜作為農(nóng)業(yè)知識(shí)管理和服務(wù)的重要載體,其構(gòu)建與更新對(duì)于提升農(nóng)業(yè)生產(chǎn)效率、促進(jìn)農(nóng)業(yè)科技創(chuàng)新具有重要意義。然而,農(nóng)業(yè)知識(shí)圖譜的運(yùn)行維護(hù),尤其是擴(kuò)展與修正,面臨著諸多技術(shù)挑戰(zhàn)和實(shí)踐難題。
2、傳統(tǒng)的農(nóng)業(yè)知識(shí)圖譜數(shù)據(jù)擴(kuò)展方法,大多依賴于人工篩選和手動(dòng)添加,這一過(guò)程不僅效率低下,而且易受主觀因素影響,導(dǎo)致數(shù)據(jù)擴(kuò)展的全面性和準(zhǔn)確性難以保障,隨著農(nóng)業(yè)領(lǐng)域新知識(shí)的不斷涌現(xiàn),出現(xiàn)了一些自動(dòng)化擴(kuò)展方法,但是這些方法往往缺乏精細(xì)的篩選機(jī)制,容易導(dǎo)致擴(kuò)展數(shù)據(jù)的冗余和不相關(guān)性,進(jìn)而影響知識(shí)圖譜的整體質(zhì)量和應(yīng)用價(jià)值,如何快速、準(zhǔn)確地將這些新知識(shí)整合到現(xiàn)有知識(shí)圖譜中,成為亟待解決的關(guān)鍵問(wèn)題;同時(shí),農(nóng)業(yè)知識(shí)圖譜中的待擴(kuò)展類別排序?qū)τ谟脩魴z索和使用知識(shí)具有重要影響,傳統(tǒng)的排序方法可能因缺乏科學(xué)的依據(jù)和動(dòng)態(tài)的調(diào)整機(jī)制,導(dǎo)致類別排序混亂,用戶難以快速定位所需信息,降低了知識(shí)圖譜的實(shí)用性和用戶體驗(yàn)。
技術(shù)實(shí)現(xiàn)思路
1、針對(duì)現(xiàn)有技術(shù)中的缺陷,本專利技術(shù)提供一種農(nóng)業(yè)知識(shí)圖譜數(shù)據(jù)擴(kuò)展和修正方法和系統(tǒng)。
2、一種農(nóng)業(yè)知識(shí)圖譜數(shù)據(jù)擴(kuò)展和修正方法,包括:基于農(nóng)業(yè)知識(shí)圖譜獲取多個(gè)不同的待擴(kuò)展類別并提取待擴(kuò)展類別對(duì)應(yīng)的類別詞,并獲取新增數(shù)據(jù)集,所述新增數(shù)據(jù)集中包括文本數(shù)據(jù);基于詞頻計(jì)算模型和新增數(shù)據(jù)集獲取各個(gè)類別詞對(duì)應(yīng)的詞頻指標(biāo),并按從大到小的順序?qū)⒍鄠€(gè)詞頻指標(biāo)進(jìn)行排序并獲取詞頻序列;基于
3、可選的,根據(jù)判斷結(jié)果獲取擴(kuò)展策略包括:若待處理詞頻指標(biāo)小于第二閾值,則獲取詞頻序列中待處理詞頻指標(biāo)之前的全部詞頻指標(biāo),并根據(jù)獲取到的詞頻指標(biāo)對(duì)應(yīng)的類別詞找到其對(duì)應(yīng)的待擴(kuò)展類別,并將新增數(shù)據(jù)集依次加入到獲取的待擴(kuò)展類別中。
4、可選的,根據(jù)判斷結(jié)果獲取擴(kuò)展策略還包括:若待處理詞頻指標(biāo)不小于第二閾值,則按詞頻序列的順序篩選出第二個(gè)大于第一閾值的下降程度指標(biāo)并將該下降程度指標(biāo)對(duì)應(yīng)的相鄰詞頻指標(biāo)作為兩個(gè)新的待處理詞頻指標(biāo),并繼續(xù)判斷新的待處理詞頻指標(biāo)是否小于第二閾值。
5、可選的,基于詞頻計(jì)算模型和新增數(shù)據(jù)集獲取各個(gè)類別詞對(duì)應(yīng)的詞頻指標(biāo)表示為:;其中,為第i個(gè)類別詞對(duì)應(yīng)的詞頻指標(biāo),為第i個(gè)類別詞在新增數(shù)據(jù)集的文本數(shù)據(jù)中的出現(xiàn)次數(shù),為新增數(shù)據(jù)集的文本數(shù)據(jù)的總詞數(shù)。
6、可選的,基于波動(dòng)計(jì)算模型和詞頻序列獲取詞頻序列中相鄰詞頻指標(biāo)的下降程度指標(biāo)包括:獲取詞頻序列中的第i個(gè)詞頻指標(biāo)和第i+1個(gè)詞頻指標(biāo);根據(jù)第i個(gè)詞頻指標(biāo)和第i+1個(gè)詞頻指標(biāo)獲取下降值;根據(jù)下降值和第i個(gè)詞頻指標(biāo)獲取下降程度指標(biāo)。
7、可選的,根據(jù)下降值和第i個(gè)詞頻指標(biāo)獲取下降程度指標(biāo)包括:;其中,為第i個(gè)詞頻指標(biāo)和第i+1個(gè)詞頻指標(biāo)的下降程度指標(biāo),為第i個(gè)詞頻指標(biāo),為第i+1個(gè)詞頻指標(biāo)。
8、可選的,并根據(jù)待擴(kuò)展類別下新增數(shù)據(jù)集的詞頻指標(biāo)大小修正新增數(shù)據(jù)集所處的位置包括:基于農(nóng)業(yè)知識(shí)圖譜獲取當(dāng)前待擴(kuò)展類別的位置范圍與詞頻指標(biāo)之間的關(guān)聯(lián)關(guān)系;根據(jù)關(guān)聯(lián)關(guān)系和新增數(shù)據(jù)集的詞頻指標(biāo)獲取新增數(shù)據(jù)集在當(dāng)前待擴(kuò)展類別的待修正位置范圍,并根據(jù)待修正位置范圍修正新增數(shù)據(jù)集所處的位置。
9、可選的,系統(tǒng)包括:獲取模塊,用于基于農(nóng)業(yè)知識(shí)圖譜獲取多個(gè)不同的待擴(kuò)展類別并提取待擴(kuò)展類別對(duì)應(yīng)的類別詞,并獲取新增數(shù)據(jù)集,所述新增數(shù)據(jù)集中包括文本數(shù)據(jù);計(jì)算模塊,用于基于詞頻計(jì)算模型和新增數(shù)據(jù)集獲取各個(gè)類別詞對(duì)應(yīng)的詞頻指標(biāo),并按從大到小的順序?qū)⒍鄠€(gè)詞頻指標(biāo)進(jìn)行排序并獲取詞頻序列;計(jì)算與判斷模塊,用于基于波動(dòng)計(jì)算模型和詞頻序列獲取詞頻序列中相鄰詞頻指標(biāo)的下降程度指標(biāo),并判斷是否存在大于第一閾值的下降程度指標(biāo);第一判斷執(zhí)行模塊,用于當(dāng)不存在大于第一閾值的下降程度指標(biāo)時(shí),將新增數(shù)據(jù)集依次加入多個(gè)不同的待擴(kuò)展類別中,并根據(jù)待擴(kuò)展類別下新增數(shù)據(jù)集的詞頻指標(biāo)大小修正新增數(shù)據(jù)集所處的位置;第二判斷執(zhí)行模塊,用于當(dāng)存在大于第一閾值的下降程度指標(biāo)時(shí),則按詞頻序列的順序篩選出第一個(gè)大于第一閾值的下降程度指標(biāo)并將該下降程度指標(biāo)對(duì)應(yīng)的相鄰詞頻指標(biāo)作為兩個(gè)待處理詞頻指標(biāo);第三判斷執(zhí)行模塊,用于判斷待處理詞頻指標(biāo)是否小于第二閾值,并根據(jù)判斷結(jié)果獲取擴(kuò)展策略,并根據(jù)待擴(kuò)展類別下新增數(shù)據(jù)集的詞頻指標(biāo)大小修正新增數(shù)據(jù)集所處的位置。
10、可選的,第三判斷執(zhí)行模塊還用于:若待處理詞頻指標(biāo)小于第二閾值,則獲取詞頻序列中待處理詞頻指標(biāo)之前的全部詞頻指標(biāo),并根據(jù)獲取到的詞頻指標(biāo)對(duì)應(yīng)的類別詞找到其對(duì)應(yīng)的待擴(kuò)展類別,并將新增數(shù)據(jù)集依次加入到獲取的待擴(kuò)展類別中。
11、可選的,第三判斷執(zhí)行模塊還用于:若待處理詞頻指標(biāo)不小于第二閾值,則按詞頻序列的順序篩選出第二個(gè)大于第一閾值的下降程度指標(biāo)并將該下降程度指標(biāo)對(duì)應(yīng)的相鄰詞頻指標(biāo)作為兩個(gè)新的待處理詞頻指標(biāo),并繼續(xù)判斷新的待處理詞頻指標(biāo)是否小于第二閾值。
12、本專利技術(shù)的有益效果體現(xiàn)在:
13、整個(gè)農(nóng)業(yè)知識(shí)圖譜數(shù)據(jù)擴(kuò)展和修正方法中,首先基于新增數(shù)據(jù)集計(jì)算各類別詞的詞頻指標(biāo),并排序形成詞頻序列,然后通過(guò)波動(dòng)計(jì)算模型識(shí)別出詞頻序列中的顯著波動(dòng)點(diǎn),據(jù)此篩選出待處理詞頻指標(biāo);進(jìn)一步的,利用第二閾值進(jìn)一步細(xì)分待處理詞頻指標(biāo)的重要性,從而制定出更加合理的擴(kuò)展策略,提高了數(shù)據(jù)擴(kuò)展的全面性和準(zhǔn)確性,避免了冗余和不相關(guān)數(shù)據(jù)的引入,使得新增數(shù)據(jù)集能夠更快速地被整合到知識(shí)圖譜中的相關(guān)類別中,同時(shí)保證了這些類別按照與新增數(shù)據(jù)集的關(guān)聯(lián)度進(jìn)行有序排列,從而提升了農(nóng)業(yè)生產(chǎn)效率,促進(jìn)了農(nóng)業(yè)科技創(chuàng)新,為農(nóng)業(yè)知識(shí)管理和服務(wù)提供了強(qiáng)有力的支持。
本文檔來(lái)自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種農(nóng)業(yè)知識(shí)圖譜數(shù)據(jù)擴(kuò)展和修正方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的農(nóng)業(yè)知識(shí)圖譜數(shù)據(jù)擴(kuò)展和修正方法,其特征在于,所述根據(jù)判斷結(jié)果獲取擴(kuò)展策略包括:
3.根據(jù)權(quán)利要求2所述的農(nóng)業(yè)知識(shí)圖譜數(shù)據(jù)擴(kuò)展和修正方法,其特征在于,所述根據(jù)判斷結(jié)果獲取擴(kuò)展策略還包括:
4.根據(jù)權(quán)利要求1所述的農(nóng)業(yè)知識(shí)圖譜數(shù)據(jù)擴(kuò)展和修正方法,其特征在于,所述基于詞頻計(jì)算模型和新增數(shù)據(jù)集獲取各個(gè)類別詞對(duì)應(yīng)的詞頻指標(biāo)表示為:
5.根據(jù)權(quán)利要求4所述的農(nóng)業(yè)知識(shí)圖譜數(shù)據(jù)擴(kuò)展和修正方法,其特征在于,所述基于波動(dòng)計(jì)算模型和詞頻序列獲取詞頻序列中相鄰詞頻指標(biāo)的下降程度指標(biāo)包括:
6.根據(jù)權(quán)利要求5所述的農(nóng)業(yè)知識(shí)圖譜數(shù)據(jù)擴(kuò)展和修正方法,其特征在于,所述根據(jù)下降值和第i個(gè)詞頻指標(biāo)獲取下降程度指標(biāo)包括:
7.根據(jù)權(quán)利要求1所述的農(nóng)業(yè)知識(shí)圖譜數(shù)據(jù)擴(kuò)展和修正方法,其特征在于,所述并根據(jù)待擴(kuò)展類別下新增數(shù)據(jù)集的詞頻指標(biāo)大小修正新增數(shù)據(jù)集所處的位置包括:
8.一種農(nóng)業(yè)知識(shí)圖譜數(shù)據(jù)擴(kuò)展和修正系統(tǒng),其特征在于,所述系統(tǒng)包括:
9.根據(jù)
10.根據(jù)權(quán)利要求9所述的農(nóng)業(yè)知識(shí)圖譜數(shù)據(jù)擴(kuò)展和修正系統(tǒng),其特征在于,所述第三判斷執(zhí)行模塊還用于:
...【技術(shù)特征摘要】
1.一種農(nóng)業(yè)知識(shí)圖譜數(shù)據(jù)擴(kuò)展和修正方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的農(nóng)業(yè)知識(shí)圖譜數(shù)據(jù)擴(kuò)展和修正方法,其特征在于,所述根據(jù)判斷結(jié)果獲取擴(kuò)展策略包括:
3.根據(jù)權(quán)利要求2所述的農(nóng)業(yè)知識(shí)圖譜數(shù)據(jù)擴(kuò)展和修正方法,其特征在于,所述根據(jù)判斷結(jié)果獲取擴(kuò)展策略還包括:
4.根據(jù)權(quán)利要求1所述的農(nóng)業(yè)知識(shí)圖譜數(shù)據(jù)擴(kuò)展和修正方法,其特征在于,所述基于詞頻計(jì)算模型和新增數(shù)據(jù)集獲取各個(gè)類別詞對(duì)應(yīng)的詞頻指標(biāo)表示為:
5.根據(jù)權(quán)利要求4所述的農(nóng)業(yè)知識(shí)圖譜數(shù)據(jù)擴(kuò)展和修正方法,其特征在于,所述基于波動(dòng)計(jì)算模型和詞頻序列獲取詞頻序列中相鄰詞頻指標(biāo)的下降程度指標(biāo)包括...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:唐江云,何鵬,盛屏,胡亮,曹艷,古樂(lè),
申請(qǐng)(專利權(quán))人:四川省農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息與農(nóng)村經(jīng)濟(jì)研究所,
類型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。