System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及工程圖紙識別領域,特別是針對cad工程矢量圖紙數據集構建提出了一種cad圖紙圖元級語義標注方法、裝置及計算機可讀存儲介質。
技術介紹
1、建立工程圖紙的語義標注數據集十分重要,是工程圖紙自動識別、自動審圖的技術基礎。cad圖紙屬于矢量圖,是一種基于數學方程和幾何特性的圖形,其由一系列基本的幾何對象組成,如線段、圓弧等,其基本組成單位稱為圖元,具有無限放大而不失真的特性。圖元級語義標注即對圖紙中每一個圖元賦予語義標簽,使計算機能夠區分圖紙中不同的圖元的含義,從而能夠區分圖紙中的構件、墻體等圖案。
2、在工程矢量圖紙的標注技術方面,當下主要的標注方法是基于圖像標注的映射,即先將矢量圖視作一般圖像,采用圖像標注方法進行標注,進一步將標注內容反向映射到矢量圖的各個圖元中。圖像標注常見方法包括錨框標注、多邊形標注、關鍵點標注、立方體標注等。其主要原理是通過矩形、多邊形、關鍵點等幾何元素,對圖像中的對象或區域進行劃分。
3、但是當前方法存在諸多缺點。矢量圖中諸多元素有邊界重合現象,基于圖像的標注方法,無法在重合邊界部位區分不同的實體或區域。此外,工程圖紙中信息量大,元素類別豐富,單張圖紙包含大量構件,標注工作量巨大。
4、因此,提出了一種cad圖紙圖元級語義標注方案,用于推進工程矢量圖紙的語義標注數據集建立。
技術實現思路
1、為克服上述現有技術存在的不足,本專利技術之目的在于提供一種cad圖紙圖元級語義標注方法裝置及計算機可讀存儲,利用工程圖
2、為達上述目的,本專利技術提出一種cad圖紙圖元級語義標注方法,包括如下步驟:
3、獲取圖紙dwg文件,預處理所述圖紙,形成預處理后圖紙;
4、對所述預處理后圖紙中的所有構件實例以圖塊形式分組,得到分組后圖紙;
5、利用圖層信息和語義信息,建立圖層語義對應表;
6、根據所述分組后圖紙和所述圖層語義對應表的對應關系形成標注文件;
7、讀取所述標注文件,篩選所有實例,針對每個實例進行語義查找,得到實例的語義類別,根據所述實例的語義類別進行圖元反向標注,生成圖元的語義類別標注結果。
8、優選地,所述讀取所述標注文件,包括如下步驟:
9、對于標注文件中的圖紙文件,讀取圖紙中每一個圖元的形狀、位置、長度、圖層、圖塊嵌套關系;
10、對于標注文件中的圖層語義對應表,讀取所述圖層語義對應表的對應字典,并將所述字典自動匹配至相應的圖紙,其中,所述圖層語義對應表以字典形式存儲。
11、優選地,所述篩選所有實例,包括如下步驟:
12、根據對所有構件實例以圖塊形式的分組,獲取每一張圖紙的所有圖塊;
13、篩選所有簡單圖塊,每一個所述簡單圖塊對應一個實例,其中,所述簡單圖塊為不包含子圖塊的圖塊。
14、優選地,所述針對每個實例進行語義查找,得到實例的語義類別,包括如下步驟:
15、針對每一個實例,查找到所述實例內部的圖元,獲取所述圖元所在圖層;
16、根據所述圖層語義對應表獲取所述圖元所在圖層所對應的語義信息;
17、若所述圖元所在圖層僅對應一種語義信息,獲取所述圖元所在圖層對應的語義信息;
18、若所述圖元所在圖層對應多種語義信息,通過自動比對的方式,獲取所述實例的語義標注;
19、其中,所述自動比對的方式包括利用圖像余弦相似度來判斷實例和模板庫中模版的差異,比對選取最接近的模版,根據模版的語義類別確定實例的語義類別。
20、優選地,所述利用圖像余弦相似度來判斷實例和模板庫中模版的差異,比對選取最接近的模版,根據模版的語義類別確定實例的語義類別,包括如下步驟:
21、將實例渲染為小幅圖像 x,從模板庫中取出語義標注對應的實例模版圖像 y;
22、將所述小幅圖像 x和所述實例模版圖像 y分別通過神經網絡 f轉化為一個向量,計算余弦相似度,其中,所述余弦相似度的計算公式如下:
23、;
24、選取與所述實例相似度高的模板,根據所述模板的語義類別作為所述實例的語義類別。
25、優選地,所述根據所述實例的語義類別進行圖元反向標注,生成圖元的語義類別標注結果,包括如下步驟:
26、根據所述實例的語義類別,將實例的所有圖元的語義信息標注為實例的語義信息;
27、為圖元添加語義信息標注和實例信息標注,對于無法被區分到具體實例的圖元,不賦予實例信息;
28、其中,所述語義信息標注包括但不限于編號、文字形式,所述實例信息標注包括但不限于編號形式;
29、經過標注后,再次遍歷檢查所有圖元,若存在圖元沒有語義信息標注或實例信息標注,則賦予所述圖元語義信息為“其他”,且不賦予實例信息標注。
30、優選地,所述方法還包括如下步驟:
31、根據所述圖元的語義類別標注結果,生成cad矢量圖紙標注數據集;
32、其中,數據集以svg形式輸出,每一個圖元一一等比例映射到svg圖元。
33、優選地,所述對所述預處理后圖紙中的所有構件實例以圖塊形式分組,得到分組后圖紙,包括如下步驟:
34、對于無法被區分到具體實例的圖元,將所述圖元作為一個整體實例放置于單獨的圖層中;
35、對于同一實例內部圖元圖層不統一,調整圖元所在圖層,使所述圖元所在圖層與實例所在圖層保證統一。
36、為達上述目的,本專利技術還公開了一種cad圖紙圖元級語義標注裝置,包括:
37、初始圖紙獲取模塊,用于獲取圖紙dwg文件,預處理所述圖紙,形成預處理后圖紙;
38、圖紙預處理模塊,用于對所述預處理后圖紙中的所有構件實例以圖塊形式分組,得到分組后圖紙;
39、實例分塊模塊,用于利用圖層信息和語義信息,建立圖層語義對應表;
40、圖層對應表建立模塊,用于根據所述分組后圖紙和所述圖層語義對應表的對應關系形成標注文件;
41、自動獲取圖元級標注模塊,用于讀取所述標注文件,篩選所有實例,針對每個實例進行語義查找,得到實例的語義類別,根據所述實例的語義類別進行圖元反向標注,生成圖元的語義類別標注結果。
42、為達上述目的,本專利技術還公開了一種計算機可讀存儲介質,所述存儲介質存儲有計算機程序,所述計算機程序用于執行上述任意一種cad圖紙圖元級語義標注方法。
43、與現有技術相比,本專利技術實施例的有益效果包括但不限于:
44、在較本文檔來自技高網...
【技術保護點】
1.一種CAD圖紙圖元級語義標注方法,包括如下步驟:
2.如權利要求1所述的一種CAD圖紙圖元級語義標注方法,其特征在于:所述讀取所述標注文件,包括如下步驟:
3.如權利要求1所述的一種CAD圖紙圖元級語義標注方法,其特征在于,所述篩選所有實例,包括如下步驟:
4.如權利要求1所述的一種CAD圖紙圖元級語義標注方法,其特征在于,所述針對每個實例進行語義查找,得到實例的語義類別,包括如下步驟:
5.如權利要求4所述的一種CAD圖紙圖元級語義標注方法,其特征在于,所述利用圖像余弦相似度來判斷實例和模板庫中模版的差異,比對選取余弦相似度最高的模版,根據模版的語義類別確定實例的語義類別,包括如下步驟:
6.如權利要求5所述的一種CAD圖紙圖元級語義標注方法,其特征在于,所述根據所述實例的語義類別進行圖元反向標注,生成圖元的語義類別標注結果,包括如下步驟:
7.如權利要求1所述的一種CAD圖紙圖元級語義標注方法,其特征在于,所述方法還包括如下步驟:
8.如權利要求1所述的一種CAD圖紙圖元級語義標注方法,其
9.一種CAD圖紙圖元級語義標注裝置,包括:
10.一種計算機可讀存儲介質,所述存儲介質存儲有計算機程序,所述計算機程序用于執行如權利要求1-8任一項所述的一種CAD圖紙圖元級語義標注方法。
...【技術特征摘要】
1.一種cad圖紙圖元級語義標注方法,包括如下步驟:
2.如權利要求1所述的一種cad圖紙圖元級語義標注方法,其特征在于:所述讀取所述標注文件,包括如下步驟:
3.如權利要求1所述的一種cad圖紙圖元級語義標注方法,其特征在于,所述篩選所有實例,包括如下步驟:
4.如權利要求1所述的一種cad圖紙圖元級語義標注方法,其特征在于,所述針對每個實例進行語義查找,得到實例的語義類別,包括如下步驟:
5.如權利要求4所述的一種cad圖紙圖元級語義標注方法,其特征在于,所述利用圖像余弦相似度來判斷實例和模板庫中模版的差異,比對選取余弦相似度最高的模版,根據模版的語義類別確定實例的語義類別,包括如下步驟:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。