本發明專利技術公開了一種隨機森林結合激光誘導擊穿光譜對鋼材牌號快速識別的方法,其首先使用LIBS系統對不同牌號的鋼材樣品進行檢測并獲取數據矩陣,然后使用隨進森林算法建立分類模型,在建模過程中,使用了多個弱分類器組合的強分類器——組合分類器,當待測樣品數據輸入模型后,通過多棵分類樹組成隨機森林,然后用隨機森林對測試集進行判別與分類,通過分類器的最終投票確定待測數據類別。該方法通過組合分類器,提高了分類準確度,減少了無用類別信息對預測過程的影響,降低了計算成本。
【技術實現步驟摘要】
【專利摘要】本專利技術公開了一種隨機森林結合激光誘導擊穿光譜對鋼材牌號快速識別的方法,其首先使用LIBS系統對不同牌號的鋼材樣品進行檢測并獲取數據矩陣,然后使用隨進森林算法建立分類模型,在建模過程中,使用了多個弱分類器組合的強分類器——組合分類器,當待測樣品數據輸入模型后,通過多棵分類樹組成隨機森林,然后用隨機森林對測試集進行判別與分類,通過分類器的最終投票確定待測數據類別。該方法通過組合分類器,提高了分類準確度,減少了無用類別信息對預測過程的影響,降低了計算成本。【專利說明】
本專利技術涉及一種隨機森林結合激光誘導擊穿光譜對鋼材牌號的識別方法,具體來說是基于激光誘導擊穿光譜通過隨機森林對鋼材牌號進行識別,屬于光譜分析
。
技術介紹
鋼鐵工業是我國最重要的基礎工業,是國家經濟水平和綜合國力的重要標志。鋼材作為基礎行業的重要原材料,有著極大的需求量。鋼材的牌號和種類比較繁多,比如:合金鋼、碳素鋼和錳鋼等。不同牌號和種類鋼材的成分用途千差萬別,但其外形和規格尺寸比較相似,難以識別,因此有必要建立一種便捷的鋼材牌號識別方法,它是鋼鐵行業實現質量控制與監督的重要手段。通常通過人為的感官和經驗對鋼材牌號進行識別,但這種方法存在一定的主觀性,很難實現不同牌號鋼材的現場快速識別。在煉鋼企業、鋼材市場、鋼材檢測站等囤積大量鋼材的地方,由于鋼材種類繁多,人為識別工作量比較大,難免出現混淆,從而造成經濟損失。此外,由于生產工藝和原材料的差異,相同牌號鋼材其成分、性能也會存在差異。傳統分析方法都需要復雜的樣品處理而且耗時,無法實現鋼材的快速、在線檢測。此時就需要一種能夠快速準確識別鋼材種類和成分信息的現場檢測技術。激光誘導擊穿光譜(laser-1nducedbreakdown spectroscopy, LIBS)是一種新興的原子發射光譜技術。該技術以激光作為激發源來誘導產生激光誘導等離子體。LIBS利用高功率激光脈沖聚焦到目標上,并在分析材料表面形成高強度激光光斑(等離子體),在等離子體激發過程中產生元素的特征譜線,通過分光系統和檢測系統進行特征譜線分析,就可以對樣品中的元素進行定性和定量分析。根據不同種類物質光譜之間的差異性,借助化學計量學方法則能夠實現物質分類與識別。LIBS技術具有分析快捷、多元素同時分析以及無需樣品預處理等優勢,因而在鋼鐵行業的實時、在線、現場分析等方面具有很大的應用潛力。隨機森林(Random Forest, RF)是一種基于遞歸分類樹的有監督學習方法。它是以決策樹為基本分類器的一個集成學習模型,它包含多個有Bagging集成學習技術訓練得到的決策樹,當輸入待分類的樣本時,最終的分類結果由單個決策樹的輸出結果投票決定。它克服了決策樹過擬合問題,對噪聲和異常值有較好的容忍性,對高維數據分類問題具有良好的可擴展性和并行性。此外,隨機森林是由數據驅動的一種非參數分類方法,只需通過對給定樣本的學習訓練分類規則,并不需要分類的先驗知識。
技術實現思路
本專利技術的目的是提供一種隨機森林算法結合激光誘導擊穿光譜實現對多種鋼材牌號的快速準確識別的方法,可以克服過擬合現象,具有快速、高分類精度的優點。本專利技術實現過程如下:,包括以下步驟: (1)利用激光誘導擊穿光譜系統對不同牌號的鋼材樣品分別在不同的測量位點進行光譜數據采集; (2)從每種牌號樣品的光譜數據中隨機挑選占其數據總量2/3的光譜數據作為訓練集,其余光譜數據作為測試集; 如圖2所示, (3)使用訓練集數據通過bagging抽樣結合OOB(Out-Of-Bag)估計的方法對決策樹棵數ntree和隨機抽取特征數mtry進行尋優; (4)確定最優參數后利用訓練集數據建立隨機森林模型,在隨機森林建模中,所構建的每一顆決策樹都為二叉樹;構建一棵樹時在樹的每個節點從每個樣本總共M個特征中挑選mtry個特征,其中mtry〈M,并根據不純度最小原則從mtry個特征中選擇一個進行分支生長;這棵樹充分生長,并且使每個節點的不純度達到最小,且不剪枝;最后得到的所有決策樹組合在一起構成隨機森林; (5)樣本的最終預測類別通過模型中所有決策樹的分類結果投票得出。上述步驟(3)中,在參數可能取值范圍內利用bagging抽樣從訓練集中獲取子訓練集并建立模型,然后用未被抽樣的袋外數據來估計模型的預測準確度,當預測準確度最高時對應的參數為最優參數。更具體地說,使用訓練集數據對決策樹棵數ntree和隨機抽取特征數mtry進行尋優,通常ntree取值范圍為100-800, mtry取值范圍為0.S-Jm - 2.54m ,其中#是樣本特征總數,在ntree和mtry可能取值范圍內利用bagging抽樣從訓練集中獲取子訓練集并建立模型,然后用未被抽樣的袋外數據來估計模型的預測準確度,當預測準確度最高時對應的參數為最優參數。上述步驟(5 )中,模型的每一個決策樹給出一個預測類別,對所有決策樹的預測類別進行統計,得票數最高的類別為最終預測類別。本專利技術的優點與積極效果:本專利技術將隨機森林算法結合LIBS光譜識別鋼材牌號,隨機森林算法對異常值和噪聲具有很好的容忍度,能夠克服光譜數據中由于元素互干擾以及環境噪音等干擾因素,有效提高預測準確度,而且可以有效避免過擬合現象,并具有較強的泛化能力。【專利附圖】【附圖說明】圖1是隨機森林原理示意圖; 圖2是隨機森林建模流程圖; 圖3是本專利技術中激光誘導擊穿光譜系統結構圖; 圖4是一系列不同牌號圓鋼的LIBS光譜圖。【具體實施方式】本專利技術隨機森林算法結合激光誘導擊穿光譜識別鋼材牌號的方法,包括以下步驟: (1)利用激光誘導擊穿光譜系統對不同牌號的鋼材樣品分別在不同的測量位點進行光譜數據采集; (2)從每種牌號樣品的光譜數據中隨機挑選占其數據總量2/3的光譜數據作為訓練集,其余光譜數據作為測試集; (3)如圖1所示,使用訓練集數據對決策樹棵數ntree和隨機抽取特征數mtry進行尋優,通常ntree取值范圍為100-800,mtry取值范圍為0.5.',?7 _ 2.5#,其中I是樣本特征總數,在ntree和mtry可能取值范圍內利用bagging抽樣從訓練集中獲取子訓練集并建立模型,然后用未被抽樣的袋外數據來估計模型的預測準確度,當預測準確度最高時對應的參數為最優參數; (4)確定最優參數后利用訓練集數據建立隨機森林模型,如圖2所示,在隨機森林建模中,所構建的每一顆決策樹都為二叉樹;構建一棵樹時在樹的每個節點從每個樣本總共M個特征中挑選mtry個特征,其中mtry〈M,并根據不純度最小原則從mtry個特征中選擇一個進行分支生長;這棵樹充分生長,并且使每個節點的不純度達到最小,且不剪枝;最后得到的所有決策樹組合在一起構成隨機森林; (5)樣本的最終預測類別通過如下投票方法得出:模型的每一個決策樹給出一個預測類別,對所有決策樹的預測類別進行統計,得票數最高的類別為最終預測類別。實施例1 以下以對九種不同牌號圓鋼樣品的建模分類為例,結合附圖和實例來進一步說明本專利技術的操作流程,但本專利技術不限于此例。如圖3所示,本實例使用的LIBS系統包括雙波長調Q單脈沖Nd = YAG激光器,光路系統,可移動樣品臺,中階梯光譜儀(ARYELL本文檔來自技高網...
【技術保護點】
一種隨機森林算法結合激光誘導擊穿光譜識別鋼材牌號的方法,?其特征在于包括以下步驟:(1)利用激光誘導擊穿光譜系統對不同牌號的鋼材樣品分別在不同的測量位點進行光譜數據采集;(2)從每種牌號樣品的光譜數據中隨機挑選占其數據總量2/3的光譜數據作為訓練集,其余光譜數據作為測試集;(3)使用訓練集數據通過bagging抽樣結合OOB(Out?Of?Bag)估計的方法對決策樹棵數ntree和隨機抽取特征數mtry進行尋優;(4)確定最優參數后利用訓練集數據建立隨機森林模型,在隨機森林建模中,所構建的每一顆決策樹都為二叉樹;構建一棵樹時在樹的每個節點從每個樣本總共M個特征中挑選mtry個特征,其中mtry
【技術特征摘要】
【專利技術屬性】
技術研發人員:李華,張天龍,王康,湯宏勝,梁龍,孫昆侖,李吉光,盛麗雯,
申請(專利權)人:西北大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。