System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及數據處理領域,具體涉及圖紙信息解析領域。
技術介紹
1、一些管道圖紙不僅包括管道線路等圖形信息,還包括諸如材料信息等文字信息,不同設計院具有不同風格或格式的圖紙。
2、目前市面上存在基于光學字符識別(optical?character?recognition,ocr)的自動識別圖紙的方法,能夠一鍵導出識別結果,但存在大體量圖紙識別速度慢、識別精度不足的問題。
3、如何實現圖紙信息的自動化解析和準確識別是亟待解決的問題。
技術實現思路
1、本專利技術的一個目的是提供一種工程管道圖紙解析讀取優化方法,能夠高效準確地實現不同管道軸測圖紙的解析。
2、為實現上述目的的工程管道圖紙解析讀取優化方法包括如下步驟:
3、s1.提供不同樣式的圖紙作為版式標注樣本,提取各圖紙中的各表格特征并作為最小識別單元,使用神經網絡算法將所述最小識別單元進行訓練,生成單元模板數據庫集;
4、s2.使用神經網絡算法提取待識別圖紙的各表格特征,并與所述單元模板數據庫集內的最小識別單元進行最適度匹配;
5、s3.將匹配度最高的最小識別單元進行組合,形成與所述待識別圖紙匹配度最高的圖紙識別模板;
6、s4.依據所述圖紙識別模板,對所述待識別圖紙進行解析和文字識別,獲得信息。
7、在一個或多個實施例中,在s1中,對所述版式標注樣本的處理包括如下步驟:進行表格裁剪,人工篩選出不存在交叉的合格表格特征;對不同類型的表
8、在一個或多個實施例中,對于無線框的表格,人工判斷無線框的表格的行數、列數、頭行和數據行,并進行標注和提取。
9、在一個或多個實施例中,所述表格特征包括表格位置、表格類型和表格格式的一種或幾種。
10、在一個或多個實施例中,在s1和s2中,使用卷積神經網絡方法和循環神經網絡算法進行訓練和特征提取。
11、在一個或多個實施例中,在s2中,最適度匹配包括如下步驟:提取所述待識別圖紙的表格特征;全連接層判斷表格類型,并進行表格區域定位;使用損失函數衡量關于表格特征和所述單元模板數據庫集內的最小識別單元兩個特征向量的相似程度;通過反向傳播算法不斷調整濾波器和其他參數,最小化損失函數,實現從輸入圖像到特征向量的最佳映射。
12、在一個或多個實施例中,所述圖紙包括軸測圖、轉換圖、流程圖。
13、在一個或多個實施例中,在s3中,所形成與所述待識別圖紙匹配度最高的圖紙識別模板為版式標注樣本內的版式或新版式,當為新版式時,將每次獲得的所述圖紙識別模板加入所述單元模板數據庫集中。
14、由于因版面復雜、類型眾多的原因,圖紙識別時表格沒有邏輯,上述工程管道圖紙解析讀取優化方法通過將不同樣式的圖紙的表格特征作為最小識別單元進行提取,一步步簡化圖紙上的表格,以表格作為單元,提高了識別精度;對于不同待識別圖紙,該方法通過算法不斷擴充圖紙表格特征的單元模板數據庫集、提取和最適度匹配,根據最小識別單元的匹配以及表格特征的組合,靈活地組合出最適合的圖紙識別模板,提高了對不同樣式圖紙的適配度。
本文檔來自技高網...【技術保護點】
1.工程管道圖紙解析讀取優化方法,其特征在于,包括如下步驟:
2.如權利要求1所述的方法,其特征在于,在S1中,對所述版式標注樣本的處理包括如下步驟:
3.如權利要求2所述的方法,其特征在于,對于無線框的表格,人工判斷無線框的表格的行數、列數、頭行和數據行,并進行標注和提取。
4.如權利要求1所述的方法,其特征在于,所述表格特征包括表格位置、表格類型和表格格式的一種或幾種。
5.如權利要求1所述的方法,其特征在于,在S1和S2中,使用卷積神經網絡方法和循環神經網絡算法進行訓練和特征提取。
6.如權利要求1所述的方法,其特征在于,在S2中,最適度匹配包括如下步驟:
7.如權利要求1所述的方法,其特征在于,所述圖紙包括軸測圖、轉換圖、流程圖。
8.如權利要求1所述的方法,其特征在于,在S3中,所形成與所述待識別圖紙匹配度最高的圖紙識別模板為版式標注樣本內的版式或新版式,當為新版式時,將每次獲得的所述圖紙識別模板加入所述單元模板數據庫集中。
【技術特征摘要】
1.工程管道圖紙解析讀取優化方法,其特征在于,包括如下步驟:
2.如權利要求1所述的方法,其特征在于,在s1中,對所述版式標注樣本的處理包括如下步驟:
3.如權利要求2所述的方法,其特征在于,對于無線框的表格,人工判斷無線框的表格的行數、列數、頭行和數據行,并進行標注和提取。
4.如權利要求1所述的方法,其特征在于,所述表格特征包括表格位置、表格類型和表格格式的一種或幾種。
5.如權利要求1所述的方法,其特征在于,...
【專利技術屬性】
技術研發人員:董春龍,曹萬友,張洪濤,華德帥,崔羚,王樹昂,韓華瑤,
申請(專利權)人:中國核工業第五建設有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。