System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于建筑規范命名實體識別,涉及面向檢查信息自動提取的施工質量檢查規范智能解析方法,是一種基于深度學習(deep?learning,dl)與自然語言處理(natural?language?processing,nlp)的施工質量檢查規范智能解析方法。
技術介紹
1、施工質量對于工程項目而言至關重要,其影響不僅局限于項目本身的適用性,還會對社會經濟發展、政府公信力、人員財產安全等多個方面產生深遠影響。在建設工程中,任何質量問題的出現,都會對項目的進度計劃產生重大影響,消耗大量的人力、物力和財力。施工過程中的質量檢查是確保工程質量、安全性和合規性的重要環節,它貫穿于建筑施工的各個階段,從初期的基礎施工到最終的竣工驗收,質量檢查工作的優劣直接影響著建筑物的整體性能和使用壽命。
2、一個工程建設項目通常涉及多個專業領域,每個領域都有其對應的施工質量驗收規范,并且施工質量檢查規范涵蓋了從國標到地方標準,再到團體標準的各個層級,具有高度的復雜性和多樣性。由于工程所處的地域和工程類型的不同,工程建設項目施工過程中進行施工質量檢查的要求可能有著顯著的差異,這對于從業者而言,尤其是經驗不足的人員,對標準規范的查閱與檢索將變得非常困難。標準規范復雜且內容繁多,人工查閱不僅耗時耗力,還容易出現疏漏和誤判。一旦檢查不及時,后續施工任務可能會掩蓋前序施工中的質量問題,導致更嚴重的后果。
3、近年來,隨著深度學習與nlp的不斷發展,為復雜文本專利技術檔的解析提供了強有力的工具,極大地提升了從大量文本數據中提取有價值信息的能力
技術實現思路
1、本專利技術提出了一種基于自然語言處理技術的面向施工質量檢查信息自動提取的施工質量檢查規范智能解析方法,并基于roberta-wwm-bilstm-crf模型,實現了施工質量檢查點信息的解析與自動提取。該方法能夠適應不同規范的解析與質量檢查點提取,為施工質量管理的智能化提供了強有力的技術支持和方法論指導。
2、本專利技術的技術方案如下:
3、面向檢查信息自動提取的施工質量檢查規范智能解析方法,包括以下步驟:
4、(1)施工質量檢查規范的結構化提取
5、首先需要對質量檢查規范文件進行預處理,將施工質量檢查規范中前言、總則、術語、基本規定以及附表部分進行去除,只保留有文件的正文部分,并對相應的水印、頁眉頁腳等內容進行剔除。在預處理過程結束之后,按照現行施工質量檢查規范的行文結構,以正則表達式為工具設計規范結構化提取算法。所述的規范文本結構化提取算法如下:
6、將預處理好的施工質量檢查規范進行輸入,對文本內容進行逐行遍歷。首先對一級標題進行匹配,一級標題指的是施工質量檢查規范當中大章節的名字,即某個特定的分項工程;當匹配到一級標題后,繼續向下逐行遍歷,找到相鄰的下一個一級標題,完成兩個一級標題間規范內容的截取,若一級標題為最后一節則截取規范剩余部分內容,完成后將各個一級標題內容進行輸出。
7、然后在截取的部分逐行遍歷匹配二級標題,二級標題代表分項工程中進一步細分的內容,或者進行質量檢查時應當予以區分的主控項目或者一般項目。匹配到二級標題后,逐行遍歷,找到下一個二級標題,完成兩個二級標題間規范內容的截取,若二級標題為該部分最后一節,則將剩余部分內容截取,將各個二級標題內容進行輸出,篩掉二級標題中不涉及具體的質量檢查點內容的一般規定部分。
8、最后在二級標題截取到的內容中,進行逐行遍歷,匹配三級標題及其對應的檢查數量、檢查方法的等規范內容,三級標題中涵蓋著在施工過程中進行質量檢查的詳細內容。完成后依次將匹配到的內容進行輸出,并不斷循環進行上述過程,直至完成整本規范條文的結構化處理,將相應的文本信息儲存在excel文件當中,方便研究的后續工作。
9、(2)構建質量檢查信息的標注體系
10、施工質量檢查規范中的檢查點提取方面,尚沒有可以直接使用的語料庫。因此,本專利技術構建一個適用于施工質量檢查的命名實體識別(ner)任務的標注體系,確定了八種命名實體的標簽類型,分別是:類型、材質、檢查主體、檢查子項、活動、屬性、位置、時態,并通過這八種標簽的組合來對施工質量檢查點信息予以限定與細化。進一步將質量檢查點的信息劃分為四個類別:檢查點限定條件、檢查點核心信息、檢查點細化信息以及其他相關信息,其中“檢查點限定條件”包含類型、材質兩種標簽,“檢查點核心信息”包含檢查主體標簽,“檢查點細化信息”包含檢查子項、活動、屬性三種標簽,“其他相關信息”包含位置與時態兩種標簽。
11、“檢查主體”:檢查主體是施工質量檢查的信息核心,依據相關規范和標準對特定建筑構件或系統進行檢查和驗收的具體項目。在施工過程中檢查主體既涵蓋比如承重墻、梁、柱、樓板等建筑構件,又包括防水系統、通風系統等功能性系統等內容,是確保施工質量符合要求的關鍵信息節點。
12、“類型”:在施工過程中,不同的建筑構件或系統有各自的質量要求,類型標簽用于描述檢查主體的功能、用途或外觀形式,以便區分不同形式或用途的檢查主體。例如,在“監測與控制節能工程使用的設備、材料應進行進場驗收”中,“監測與控制節能工程使用的”描述了檢查主體“設備、材料”的用途,因此可以歸類為“類型”實體。
13、“材質”:材質標簽用于標識檢查主體或其組成部分的材料構成,涉及建筑構件或系統所用的具體材料。檢查點構件所采用的材質直接影響施工質量檢查的標準與方法,不同的材料有不同的施工要求和檢查標準,明確檢查點材質有助于整個施工質量檢查過程。
14、“檢查子項”:檢查子項標簽是檢查主體下的細分檢查項目,用于描述對主體的具體質量要求或細化內容。檢查子項是對檢查主體的進一步分解,用于細化規范中對主體的檢查內容。
15、“屬性”:屬性標簽描述檢查主體應具備的某些物理或功能特征,用以衡量主體在某一方面的質量水平是否達標。比如,鋼筋的“屈服強度”、“抗彎性能”等。通過屬性標簽來幫助定義和量化檢查對象的具體要求,確保建筑構件或系統的功能性和安全性符合相應的標準。
16、“活動”:活動標簽表示施工過程中與檢查主體相關的具體施工動作或操作流程,用于標識與質量檢查相關的施工行為。不同施工活動會引發不同的檢查要求,能夠幫助檢查人員明確需要檢查的施工行為。比如鋼筋的安裝、混凝土的澆筑等。
17、“時態”:時態標簽用于描述在施工過程中需要進行檢查的時間節點,如“鋼筋進場后”、“混凝土澆筑前”等內容,以及檢查主體本文檔來自技高網...
【技術保護點】
1.面向檢查信息自動提取的施工質量檢查規范智能解析方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的面向檢查信息自動提取的施工質量檢查規范智能解析方法,其特征在于,步驟(2)中,八種標簽具體如下:
【技術特征摘要】
1.面向檢查信息自動提取的施工質量檢查規范智能解析方法,其特征在于,包括以下步驟:
2.根據權利...
【專利技術屬性】
技術研發人員:何軍,姜韶華,蕭白,劉吉龍,魏飛,侯建飛,高振,劉悅,王超,
申請(專利權)人:天津津港建設有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。