System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)屬于標(biāo)準(zhǔn)文件數(shù)據(jù)處理的,具體涉及一種建設(shè)工程檢測(cè)機(jī)構(gòu)標(biāo)準(zhǔn)文件庫(kù)動(dòng)態(tài)更新維護(hù)方法、系統(tǒng)、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。
技術(shù)介紹
1、為確保建設(shè)工程檢測(cè)工作的真實(shí)可靠與規(guī)范統(tǒng)一,檢測(cè)機(jī)構(gòu)在從事檢測(cè)活動(dòng)中應(yīng)嚴(yán)格執(zhí)行檢測(cè)標(biāo)準(zhǔn)文件的要求、參數(shù)和步驟等,形成受控的標(biāo)準(zhǔn)文件庫(kù)管理體系。建設(shè)工程檢測(cè)標(biāo)準(zhǔn)文件是一類檢驗(yàn)機(jī)構(gòu)為社會(huì)出具工程質(zhì)量檢測(cè)數(shù)據(jù)或檢測(cè)結(jié)論的依據(jù),執(zhí)行現(xiàn)行的工程檢測(cè)標(biāo)準(zhǔn)才能保證檢驗(yàn)檢測(cè)工作的準(zhǔn)確性、有效性和公正性,降低檢驗(yàn)檢測(cè)過(guò)程中的風(fēng)險(xiǎn),及時(shí)了解即將發(fā)布的檢測(cè)標(biāo)準(zhǔn)也可以使檢測(cè)機(jī)構(gòu)與檢測(cè)人員及時(shí)調(diào)整檢測(cè)計(jì)劃與檢測(cè)方法、更換檢測(cè)設(shè)備。因此,檢測(cè)機(jī)構(gòu)需定期查新建設(shè)工程檢測(cè)標(biāo)準(zhǔn)文件,以替換廢除的標(biāo)準(zhǔn)和提示即將實(shí)施的標(biāo)準(zhǔn)。然而,工程檢測(cè)所涉及的標(biāo)準(zhǔn)通常有上千本,涉及建筑材料檢測(cè)、鋼結(jié)構(gòu)檢測(cè)、地基基礎(chǔ)檢測(cè)、公路檢測(cè)、橋梁檢測(cè)等領(lǐng)域,若采用傳統(tǒng)的人工標(biāo)準(zhǔn)查新方法,查新時(shí)間長(zhǎng),工作量大,產(chǎn)生大量重復(fù)機(jī)械工作的人工成本。
2、從事建設(shè)工程檢測(cè)活動(dòng)除了需要保證參考的標(biāo)準(zhǔn)現(xiàn)行有效,還應(yīng)熟悉受檢樣品所有涉及的檢測(cè)依據(jù)標(biāo)準(zhǔn)及其所有對(duì)應(yīng)檢測(cè)參數(shù)。目前,檢測(cè)機(jī)構(gòu)對(duì)建設(shè)工程檢測(cè)標(biāo)準(zhǔn)的受控管理,僅停留在文件歸檔。建設(shè)工程檢測(cè)標(biāo)準(zhǔn)文件涉及的種類有檢測(cè)方法標(biāo)準(zhǔn)、產(chǎn)品標(biāo)準(zhǔn)、驗(yàn)收標(biāo)準(zhǔn)、儀器標(biāo)準(zhǔn)等,即使是技術(shù)經(jīng)驗(yàn)豐富的檢測(cè)人員,面對(duì)種類繁多的檢測(cè)標(biāo)準(zhǔn),在目前的管理水平下,檢測(cè)人員仍需要人工從發(fā)布標(biāo)準(zhǔn)文件的網(wǎng)站檢索并進(jìn)行人工查新確認(rèn),花費(fèi)時(shí)間較長(zhǎng)。在現(xiàn)有檢測(cè)標(biāo)準(zhǔn)體系下,受檢樣品種類、技術(shù)參數(shù)、檢測(cè)方法、設(shè)備儀器之間具有較強(qiáng)的關(guān)聯(lián)性,海量標(biāo)準(zhǔn)內(nèi)容包含的信息尚
技術(shù)實(shí)現(xiàn)思路
1、為了克服現(xiàn)有技術(shù)存在的一個(gè)或多個(gè)缺陷與不足,本專利技術(shù)的第一目的在于提供一種建設(shè)工程檢測(cè)機(jī)構(gòu)標(biāo)準(zhǔn)文件庫(kù)動(dòng)態(tài)更新維護(hù)方法,第二目的在于提供一種建設(shè)工程檢測(cè)機(jī)構(gòu)標(biāo)準(zhǔn)文件庫(kù)動(dòng)態(tài)更新維護(hù)系統(tǒng),第三目的在于提供一種計(jì)算機(jī)設(shè)備,第四目的在于提供一種存儲(chǔ)介質(zhì),能夠提供實(shí)時(shí)、準(zhǔn)確、批量的標(biāo)準(zhǔn)文件查新,具有較高的查新準(zhǔn)確率和維護(hù)管理效率。
2、本專利技術(shù)的第一目的采用以下技術(shù)方案:
3、一種建設(shè)工程檢測(cè)機(jī)構(gòu)標(biāo)準(zhǔn)文件庫(kù)動(dòng)態(tài)更新維護(hù)方法,包括步驟如下:
4、從標(biāo)準(zhǔn)文件庫(kù)中生成待查新標(biāo)準(zhǔn)文件的清單,將清單中每個(gè)標(biāo)準(zhǔn)文件的標(biāo)準(zhǔn)編號(hào),均設(shè)定為url形式的字符串;
5、將標(biāo)準(zhǔn)查詢網(wǎng)站的檢索頁(yè)面的網(wǎng)址字符串,與清單中每個(gè)標(biāo)準(zhǔn)編號(hào)的url形式字符串分別相加得到檢索詞字符串,由全部檢索詞字符串組成相應(yīng)標(biāo)準(zhǔn)查詢網(wǎng)站的檢索詞列表;
6、使用檢索詞列表對(duì)相應(yīng)標(biāo)準(zhǔn)查詢網(wǎng)站進(jìn)行爬蟲(chóng),獲取全部檢索詞字符串對(duì)應(yīng)的檢索結(jié)果頁(yè)面的解析樹(shù);
7、遍歷解析樹(shù),獲取與清單中的標(biāo)準(zhǔn)文件信息不同的檢索結(jié)果的標(biāo)準(zhǔn)文件信息,更新查新日志;
8、遍歷全部標(biāo)準(zhǔn)查詢網(wǎng)站,合并查新日志更新標(biāo)準(zhǔn)文件信息后,獲取需要更新的標(biāo)準(zhǔn)文件到標(biāo)準(zhǔn)文件庫(kù)中,對(duì)標(biāo)準(zhǔn)文件進(jìn)行動(dòng)態(tài)分類維護(hù)。
9、第一種優(yōu)選的技術(shù)方案為,遍歷解析樹(shù),獲取與清單中的標(biāo)準(zhǔn)文件信息不同的檢索結(jié)果的標(biāo)準(zhǔn)文件信息,更新查新日志,步驟包括:
10、遍歷解析樹(shù)中的標(biāo)簽,查找標(biāo)準(zhǔn)文件信息所在元素的標(biāo)簽;
11、在解析樹(shù)所有帶有標(biāo)簽的元素中,獲取標(biāo)簽內(nèi)容為現(xiàn)行、廢止、作廢其中一種的元素,查找相應(yīng)元素的上一級(jí)父元素,得到與標(biāo)準(zhǔn)文件的標(biāo)準(zhǔn)編號(hào)相同的父元素;
12、將清單中的標(biāo)準(zhǔn)文件信息,與標(biāo)準(zhǔn)編號(hào)相同的父元素進(jìn)行標(biāo)準(zhǔn)文件信息比對(duì),將不一致的標(biāo)準(zhǔn)文件信息存儲(chǔ)至差異列表變量中;
13、根據(jù)差異列表變量替換相應(yīng)標(biāo)準(zhǔn)文件原有的信息,更新查新日志。
14、第二種優(yōu)選的技術(shù)方案為,遍歷解析樹(shù),獲取與清單中的標(biāo)準(zhǔn)文件信息不同的檢索結(jié)果的標(biāo)準(zhǔn)文件信息,更新查新日志,步驟包括:
15、遍歷解析樹(shù)中的標(biāo)簽,查找標(biāo)準(zhǔn)文件信息所在元素的標(biāo)簽;
16、在解析樹(shù)所有帶有標(biāo)簽的元素中,獲取標(biāo)簽內(nèi)容為即將實(shí)施的元素,從其對(duì)應(yīng)的父元素中獲取對(duì)應(yīng)的標(biāo)準(zhǔn)編號(hào)字符串;
17、將標(biāo)準(zhǔn)編號(hào)字符串減去父元素中標(biāo)準(zhǔn)編號(hào)的年份信息得到相應(yīng)的字符串,在相應(yīng)的字符串與檢索詞列表中的檢索詞字符串相同時(shí),從中獲取該相應(yīng)字符串對(duì)應(yīng)父元素的標(biāo)準(zhǔn)文件信息;
18、將清單中的標(biāo)準(zhǔn)文件信息,與從相應(yīng)的父元素中獲取的標(biāo)準(zhǔn)文件信息比對(duì),將不一致的標(biāo)準(zhǔn)文件信息存儲(chǔ)至差異列表變量中;
19、根據(jù)差異列表變量替換相應(yīng)標(biāo)準(zhǔn)文件原有的信息,更新查新日志。
20、第一種或第二種技術(shù)方案的更優(yōu)選技術(shù)方案為,根據(jù)差異列表變量替換相應(yīng)標(biāo)準(zhǔn)文件原有的信息,步驟包括:
21、若清單中的標(biāo)準(zhǔn)文件信息的標(biāo)準(zhǔn)名稱、標(biāo)準(zhǔn)編號(hào)的格式書(shū)寫有誤,則用查新后的標(biāo)準(zhǔn)文件信息替換標(biāo)準(zhǔn)文件庫(kù)中原有的標(biāo)準(zhǔn)文件信息;
22、若清單中的標(biāo)準(zhǔn)文件信息的標(biāo)準(zhǔn)年份不同,則用查新后的標(biāo)準(zhǔn)文件信息替換標(biāo)準(zhǔn)文件庫(kù)中原有的標(biāo)準(zhǔn)文件信息;
23、若差異列表變量中無(wú)現(xiàn)行的標(biāo)準(zhǔn)文件信息,則刪除標(biāo)準(zhǔn)文件庫(kù)中原有的標(biāo)準(zhǔn)文件信息及標(biāo)準(zhǔn)文件。
24、第三種優(yōu)選的技術(shù)方案為,使用檢索詞列表對(duì)相應(yīng)標(biāo)準(zhǔn)查詢網(wǎng)站進(jìn)行爬蟲(chóng)時(shí),若標(biāo)準(zhǔn)查詢網(wǎng)站存在通過(guò)與服務(wù)器進(jìn)行交互獲取數(shù)據(jù)并進(jìn)行渲染形成動(dòng)態(tài)頁(yè)面導(dǎo)致無(wú)法直接爬取的情況,則在爬蟲(chóng)時(shí)采用通過(guò)模擬瀏覽器的行為,執(zhí)行javascript代碼并解析javascript動(dòng)態(tài)加載數(shù)據(jù)的方式,來(lái)獲取檢索結(jié)果頁(yè)面的解析樹(shù)。
25、第四種優(yōu)選的技術(shù)方案為,對(duì)標(biāo)準(zhǔn)文件進(jìn)行動(dòng)態(tài)分類維護(hù),步驟包括:
26、將標(biāo)準(zhǔn)文件庫(kù)里全部的標(biāo)準(zhǔn)文件通過(guò)圖像識(shí)別批量轉(zhuǎn)換為純文本格式文件;
27、建立停用詞表用于錄入無(wú)意義詞語(yǔ)的字符串;
28、將全部純文本文件中的文本內(nèi)容進(jìn)行分詞處理并標(biāo)注詞性,形成list格式矩陣;
29、將list格式矩陣進(jìn)行數(shù)據(jù)清洗,通過(guò)停用詞表排除無(wú)意義詞語(yǔ)的字符串后,只提取詞性為名詞且字?jǐn)?shù)大于一的詞語(yǔ),重復(fù)不少于三次數(shù)據(jù)清洗后形成名詞集合;
30、遍歷名詞集合里的所有詞語(yǔ),分別統(tǒng)計(jì)相應(yīng)名詞的詞頻、逆文檔頻率,然后根據(jù)詞頻、逆文檔頻率計(jì)算相應(yīng)名詞的頻率增強(qiáng)指數(shù);
31、將相應(yīng)名詞的頻率增強(qiáng)指數(shù)的數(shù)值按從大到小排序,取不少于前十個(gè)名詞作為關(guān)鍵詞集合,用全部關(guān)鍵詞、關(guān)鍵詞對(duì)應(yīng)的頻率增強(qiáng)指數(shù)組成關(guān)鍵詞矩陣;
32、建立圖關(guān)系網(wǎng)絡(luò)模型,在圖關(guān)系網(wǎng)絡(luò)模型中節(jié)點(diǎn)的數(shù)量與當(dāng)前標(biāo)準(zhǔn)文件庫(kù)中標(biāo)準(zhǔn)文件的數(shù)量保持一致,各節(jié)點(diǎn)間存在關(guān)系權(quán)重;
33、遍歷圖關(guān)系網(wǎng)絡(luò)模型中的全部節(jié)點(diǎn),判斷每個(gè)節(jié)點(diǎn)對(duì)應(yīng)的標(biāo)準(zhǔn)文件中是否存在關(guān)鍵詞,與另一個(gè)節(jié)點(diǎn)對(duì)應(yīng)的標(biāo)準(zhǔn)文件中的關(guān)鍵詞相同,當(dāng)存在相同的關(guān)鍵詞時(shí),將兩個(gè)標(biāo)準(zhǔn)文件在該關(guān)鍵詞上各自的頻本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種建設(shè)工程檢測(cè)機(jī)構(gòu)標(biāo)準(zhǔn)文件庫(kù)動(dòng)態(tài)更新維護(hù)方法,其特征在于,包括步驟如下:
2.根據(jù)權(quán)利要求1所述建設(shè)工程檢測(cè)機(jī)構(gòu)標(biāo)準(zhǔn)文件庫(kù)動(dòng)態(tài)更新維護(hù)方法,其特征在于,所述遍歷解析樹(shù),獲取與清單中的標(biāo)準(zhǔn)文件信息不同的檢索結(jié)果的標(biāo)準(zhǔn)文件信息,更新查新日志,步驟包括:
3.根據(jù)權(quán)利要求1所述建設(shè)工程檢測(cè)機(jī)構(gòu)標(biāo)準(zhǔn)文件庫(kù)動(dòng)態(tài)更新維護(hù)方法,其特征在于,所述遍歷解析樹(shù),獲取與清單中的標(biāo)準(zhǔn)文件信息不同的檢索結(jié)果的標(biāo)準(zhǔn)文件信息,更新查新日志,步驟包括:
4.根據(jù)權(quán)利要求2或3所述建設(shè)工程檢測(cè)機(jī)構(gòu)標(biāo)準(zhǔn)文件庫(kù)動(dòng)態(tài)更新維護(hù)方法,其特征在于,所述根據(jù)差異列表變量替換相應(yīng)標(biāo)準(zhǔn)文件原有的信息,步驟包括:
5.根據(jù)權(quán)利要求1所述建設(shè)工程檢測(cè)機(jī)構(gòu)標(biāo)準(zhǔn)文件庫(kù)動(dòng)態(tài)更新維護(hù)方法,其特征在于,所述使用檢索詞列表對(duì)相應(yīng)標(biāo)準(zhǔn)查詢網(wǎng)站進(jìn)行爬蟲(chóng)時(shí),若標(biāo)準(zhǔn)查詢網(wǎng)站存在通過(guò)與服務(wù)器進(jìn)行交互獲取數(shù)據(jù)并進(jìn)行渲染形成動(dòng)態(tài)頁(yè)面導(dǎo)致無(wú)法直接爬取的情況,則在爬蟲(chóng)時(shí)采用通過(guò)模擬瀏覽器的行為,執(zhí)行JavaScript代碼并解析JavaScript動(dòng)態(tài)加載數(shù)據(jù)的方式,來(lái)獲取檢索結(jié)果頁(yè)面的解析樹(shù)。
6
7.根據(jù)權(quán)利要求1所述建設(shè)工程檢測(cè)機(jī)構(gòu)標(biāo)準(zhǔn)文件庫(kù)動(dòng)態(tài)更新維護(hù)方法,其特征在于,所述對(duì)標(biāo)準(zhǔn)文件進(jìn)行動(dòng)態(tài)分類維護(hù)后,還有步驟包括:
8.一種根據(jù)權(quán)利要求1-7任一項(xiàng)所述建設(shè)工程檢測(cè)機(jī)構(gòu)標(biāo)準(zhǔn)文件庫(kù)動(dòng)態(tài)更新維護(hù)方法的建設(shè)工程檢測(cè)機(jī)構(gòu)標(biāo)準(zhǔn)文件庫(kù)動(dòng)態(tài)更新維護(hù)系統(tǒng),其特征在于,包括查新準(zhǔn)備模塊、標(biāo)準(zhǔn)文件庫(kù)、爬蟲(chóng)模塊、維護(hù)模塊;
9.一種計(jì)算機(jī)設(shè)備,其特征在于,包括處理器、存儲(chǔ)器、存儲(chǔ)在所述存儲(chǔ)器上并可被所述處理器執(zhí)行的計(jì)算機(jī)程序;所述計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí),實(shí)現(xiàn)權(quán)利要求1-7中任一項(xiàng)所述的建設(shè)工程檢測(cè)機(jī)構(gòu)標(biāo)準(zhǔn)文件庫(kù)動(dòng)態(tài)更新維護(hù)方法。
10.一種存儲(chǔ)介質(zhì),其特征在于,為存儲(chǔ)有計(jì)算機(jī)程序的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)程序被計(jì)算機(jī)執(zhí)行時(shí),實(shí)現(xiàn)權(quán)利要求1-7任一項(xiàng)所述的建設(shè)工程檢測(cè)機(jī)構(gòu)標(biāo)準(zhǔn)文件庫(kù)動(dòng)態(tài)更新維護(hù)方法。
...【技術(shù)特征摘要】
1.一種建設(shè)工程檢測(cè)機(jī)構(gòu)標(biāo)準(zhǔn)文件庫(kù)動(dòng)態(tài)更新維護(hù)方法,其特征在于,包括步驟如下:
2.根據(jù)權(quán)利要求1所述建設(shè)工程檢測(cè)機(jī)構(gòu)標(biāo)準(zhǔn)文件庫(kù)動(dòng)態(tài)更新維護(hù)方法,其特征在于,所述遍歷解析樹(shù),獲取與清單中的標(biāo)準(zhǔn)文件信息不同的檢索結(jié)果的標(biāo)準(zhǔn)文件信息,更新查新日志,步驟包括:
3.根據(jù)權(quán)利要求1所述建設(shè)工程檢測(cè)機(jī)構(gòu)標(biāo)準(zhǔn)文件庫(kù)動(dòng)態(tài)更新維護(hù)方法,其特征在于,所述遍歷解析樹(shù),獲取與清單中的標(biāo)準(zhǔn)文件信息不同的檢索結(jié)果的標(biāo)準(zhǔn)文件信息,更新查新日志,步驟包括:
4.根據(jù)權(quán)利要求2或3所述建設(shè)工程檢測(cè)機(jī)構(gòu)標(biāo)準(zhǔn)文件庫(kù)動(dòng)態(tài)更新維護(hù)方法,其特征在于,所述根據(jù)差異列表變量替換相應(yīng)標(biāo)準(zhǔn)文件原有的信息,步驟包括:
5.根據(jù)權(quán)利要求1所述建設(shè)工程檢測(cè)機(jī)構(gòu)標(biāo)準(zhǔn)文件庫(kù)動(dòng)態(tài)更新維護(hù)方法,其特征在于,所述使用檢索詞列表對(duì)相應(yīng)標(biāo)準(zhǔn)查詢網(wǎng)站進(jìn)行爬蟲(chóng)時(shí),若標(biāo)準(zhǔn)查詢網(wǎng)站存在通過(guò)與服務(wù)器進(jìn)行交互獲取數(shù)據(jù)并進(jìn)行渲染形成動(dòng)態(tài)頁(yè)面導(dǎo)致無(wú)法直接爬取的情況,則在爬蟲(chóng)時(shí)采用通過(guò)模擬瀏覽器的行為,執(zhí)行javascript代碼并解析javascript動(dòng)態(tài)加...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:劉偉杰,黃啟云,焦帥,要東明,吳紅細(xì),陳沛聰,肖靜文,王剛,周妙程,
申請(qǐng)(專利權(quán))人:廣東省有色工業(yè)建筑質(zhì)量檢測(cè)站有限公司,
類型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。