System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實現(xiàn)步驟摘要】
:本專利技術(shù)涉及復雜裝備數(shù)據(jù)處理,具體的說是一種將具有約束的時間間隔感知時序插補網(wǎng)絡(luò)constrained?interval-aware?temporal?imputation?network,citin應用于復雜工業(yè)裝備數(shù)據(jù)填補、降低后續(xù)數(shù)據(jù)處理過程中神經(jīng)網(wǎng)絡(luò)在填補過程中生成不合理值的可能性,提高工業(yè)設(shè)備數(shù)據(jù)處理準確性和穩(wěn)定性的基于citin的復雜裝備數(shù)據(jù)處理方法。
技術(shù)介紹
0、
技術(shù)介紹
:
1、傳感器對環(huán)境狀況和機器狀態(tài)的準確采集促進了面向復雜裝備的狀態(tài)監(jiān)測和健康管理的實施。通過在設(shè)計過程中加裝大量傳感器,研究人員可以監(jiān)控復雜裝備在使用過程中的狀態(tài),從而為后續(xù)的維修保障工作提供依據(jù)。然而,由于傳感器運行期間可能的故障、人工操作階段的的疏忽、多部門信息共享的條例,導致所獲得的狀態(tài)數(shù)據(jù)可能存在缺失。這種數(shù)據(jù)不完整的問題給后續(xù)的分析工作帶來了困難。
2、處理包含缺失值的數(shù)據(jù)有多種方式,直接刪除包含缺失值的部分數(shù)據(jù)是最簡單且容易操作的,但這并非在所有場景中都適用,尤其是如航空發(fā)動機運行數(shù)據(jù)之類的時間序列數(shù)據(jù)。因為多元時間序列的數(shù)據(jù)特征,表現(xiàn)為時間上的連續(xù)性,以及不同變量之間的相關(guān)性,如果直接刪除一些數(shù)據(jù),那么就可能打斷這種連續(xù)的關(guān)系,導致后續(xù)工作出現(xiàn)較大的偏差。對于航空發(fā)動機數(shù)據(jù)而言,缺少某些航班的全部數(shù)據(jù)可能會導致后續(xù)的異常檢測、故障診斷、壽命預測工作難以展開。因此,填補包含缺失值的數(shù)據(jù)被視為對航空發(fā)動機不完整性能數(shù)據(jù)更好的處理方式。
3、使用統(tǒng)計學方法填補缺失值是在工業(yè)中最為普遍,因其具有較好
4、現(xiàn)有技術(shù)中,基于循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent?neural?network,rnn)的方法普遍被用于填補。這種方法首先采用簡單的統(tǒng)計學方法(如均值填補、前向填充、三次樣條插值法等)初步填補缺失值,然后使用填補后的完整數(shù)據(jù)訓練rnn。當前方法應用于航空發(fā)動機,主要存在兩個問題。首先,當前神經(jīng)網(wǎng)絡(luò)在實際工業(yè)數(shù)據(jù)中效果不穩(wěn)定,有時會出現(xiàn)填補值超出正常數(shù)值范圍的現(xiàn)象,即產(chǎn)生不合理的填補值。雖然可以在填補完成后對不合理值統(tǒng)一處理,但這種處理方式并沒有解決填補時的問題,而是為解決不合理值重新填補了一個特征值。其次,航空發(fā)動機的使用時長在每個航班中不完全相同,且在每個航班中多種不同時長的工況相互累積。對于民航飛機來說,一個完整的飛行過程主要包括起飛、爬升、巡航、下降和降落(takeoff,climb,cruise,descent,landing),在一些特殊情況下還包括復飛、盤旋等待(go-around,holding),地面試車等。在這些狀態(tài)中,多種不同之處導致相鄰的兩個航班數(shù)據(jù)實際的運行時長和性能衰退情況不一致。而傳統(tǒng)填補方法處理等間隔采樣數(shù)據(jù)的情況并不相同。
技術(shù)實現(xiàn)思路
0、
技術(shù)實現(xiàn)思路
:
1、本專利技術(shù)針對現(xiàn)有技術(shù)中存在的缺點和不足,提出了一種能夠有效減少出現(xiàn)不合理值的可能性的基于citin的復雜裝備數(shù)據(jù)處理方法。
2、本專利技術(shù)通過以下措施達到:
3、一種基于citin的復雜裝備數(shù)據(jù)處理方法,其特征在于,包括以下步驟:
4、步驟1:獲取原始數(shù)據(jù);
5、步驟2:數(shù)據(jù)預處理:分割數(shù)據(jù)集,獲得測試集和訓練集,將原始數(shù)據(jù)序列按照訓練集、驗證集和測試集拼接,使用訓練集數(shù)據(jù)為標準,進行標準化和歸一化,弱化特征維度中的數(shù)據(jù)差異,提升神經(jīng)網(wǎng)絡(luò)的填補效果,使用滑動窗口將不等長的數(shù)據(jù)切割到相同長度,便于輸入到神經(jīng)網(wǎng)絡(luò)中;
6、步驟3:建立填補網(wǎng)絡(luò)模型,并進行訓練,所述填補網(wǎng)絡(luò)模型在gru基礎(chǔ)上,引入transformer對時間間隔信息進行處理,并將結(jié)果結(jié)合缺失標記矩陣用于調(diào)整缺失部分的隱狀態(tài)和輸入的權(quán)重,構(gòu)成時間間隔感知時序插補網(wǎng)絡(luò),其次,將分段三次hermite插值多項式pchip引入時間間隔感知時序插補網(wǎng)絡(luò)的訓練過程,約束填補結(jié)果生成范圍;
7、在訓練時,首先將不完整的訓練集輸入兩個時間間隔感知時序插補網(wǎng)絡(luò),用于獲取網(wǎng)絡(luò)輸出的重構(gòu)數(shù)據(jù)和臨時填補數(shù)據(jù),然后將重構(gòu)數(shù)據(jù)與原數(shù)據(jù)的mae作為損失函數(shù)的一部分,將兩個網(wǎng)絡(luò)填補結(jié)果的一致性的mae作為損失函數(shù)的一部分,將兩組填補結(jié)果取平均后,作為訓練階段的臨時填補結(jié)果,隨后將不完整數(shù)據(jù)輸入pchip單元,形成臨時填補數(shù)據(jù),將臨時填補結(jié)果與pchip單元的填補結(jié)果的mse作為損失函數(shù)的一部分,共同優(yōu)化兩個時間間隔感知時序插補網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù);步驟4:填補網(wǎng)絡(luò)的應用:首先將測試數(shù)據(jù)輸入到已經(jīng)訓練完成的兩個時間間隔感知時序插補網(wǎng)絡(luò)中,用于獲取重構(gòu)數(shù)據(jù)和臨時填補數(shù)據(jù),然后對兩個網(wǎng)絡(luò)中的臨時填補結(jié)果取平均,即可作為測試集最終的填補結(jié)果
8、本專利技術(shù)所述填補網(wǎng)絡(luò)模型的輸入包括不完整數(shù)據(jù)x、缺失標記矩陣m、時間間隔矩陣δ和絕對時間s,多元時間序列為不完整數(shù)據(jù),其中t為數(shù)據(jù)在時間維度的長度,d為數(shù)據(jù)的特征維度,缺失標記矩陣m為標記原數(shù)據(jù)x的數(shù)據(jù)缺失的位置,形狀與x相同,對于t時刻第d維的數(shù)據(jù)有
9、
10、δ表示為x的時間間隔矩陣,形狀與x相同,時間間隔矩陣δ對于每個維度都分別計算,對應位置的計算規(guī)則包括三條:首先,第一個時間戳的時間間隔δ1被設(shè)定為0;其次,對于后續(xù)的時間戳t,若該時間戳的前一個時間戳對應維度的樣例序列x存在數(shù)據(jù),則將當前絕對時間與t-1的絕對時間相減作為δ對應的數(shù)值;最后,若該t-1對應位置上x的數(shù)據(jù)為空,在將當前絕對時間與t-1絕對時間相減的基礎(chǔ)上,還要加上前一個時間戳的時間間隔數(shù)值,δ在t時刻第d維的計算表示為
11、其中,st表示在第t時刻的絕對時間;表示t時刻第d維的時間間隔矩陣。
12、本專利技術(shù)中填補網(wǎng)絡(luò)模型的輸入數(shù)據(jù)在手動遮掩后的數(shù)據(jù)被標記為這些數(shù)據(jù)的位置使用指示矩陣i來標記,指示矩陣形狀與原始數(shù)據(jù)相同,在觀測值數(shù)值存在,但在實際使用時被隱藏用于預測的數(shù)據(jù)位置表示為1,在其余位置表示為0,指示矩陣i在t時刻第d維表示為:
13、
14、本專利技術(shù)所述填補網(wǎng)絡(luò)模型包括兩個時間間隔感知時序插補網(wǎng)絡(luò),兩個網(wǎng)絡(luò)一個用于從訓練數(shù)據(jù)的正向捕捉規(guī)律,另一個從反向捕捉規(guī)律,兩個網(wǎng)絡(luò)各自提供一個臨時填補結(jié)果,還設(shè)有pchip單元,用于統(tǒng)計學方法填補結(jié)果的計算,兩個時間間隔感知時序插補網(wǎng)絡(luò)的輸入包括原始數(shù)據(jù)x、時間間隔矩陣δ和缺失標記矩陣m,第一個時間間隔感知時序插補網(wǎng)絡(luò)init1為從首個時間戳開始,依次處理每個時間戳的所有特征直到最后一個,代表在時間維度上正向捕捉數(shù)據(jù)關(guān)系的過程,將經(jīng)過init結(jié)構(gòu)的隱藏層ht輸入到下一層,將每一步中的輸出c1~ct按照時間維度拼接起來,temporary?imputed?data1即表示為
1本文檔來自技高網(wǎng)...
【技術(shù)保護點】
1.一種基于CITIN的復雜裝備數(shù)據(jù)處理方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的基于CITIN的復雜裝備數(shù)據(jù)處理方法,其特征在于,所述填補網(wǎng)絡(luò)模型的輸入包括不完整數(shù)據(jù)X、缺失標記矩陣M、時間間隔矩陣Δ和絕對時間s,多元時間序列為不完整數(shù)據(jù),其中T為數(shù)據(jù)在時間維度的長度,D為數(shù)據(jù)的特征維度,缺失標記矩陣M為標記原數(shù)據(jù)X的數(shù)據(jù)缺失的位置,形狀與X相同,對于t時刻第d維的數(shù)據(jù)有
3.根據(jù)權(quán)利要求1所述的基于CITIN的復雜裝備數(shù)據(jù)處理方法,其特征在于,填補網(wǎng)絡(luò)模型的輸入數(shù)據(jù)在手動遮掩后的數(shù)據(jù)被標記為這些數(shù)據(jù)的位置使用指示矩陣I來標記,指示矩陣形狀與原始數(shù)據(jù)相同,在觀測值數(shù)值存在,但在實際使用時被隱藏用于預測的數(shù)據(jù)位置表示為1,在其余位置表示為0,指示矩陣I在t時刻第d維表示為:
4.根據(jù)權(quán)利要求3所述的基于CITIN的復雜裝備數(shù)據(jù)處理方法,其特征在于,所述填補網(wǎng)絡(luò)模型包括兩個時間間隔感知時序插補網(wǎng)絡(luò),兩個網(wǎng)絡(luò)一個用于從訓練數(shù)據(jù)的正向捕捉規(guī)律,另一個從反向捕捉規(guī)律,兩個網(wǎng)絡(luò)各自提供一個臨時填補結(jié)果,還設(shè)有PCHIP單元,用于統(tǒng)計學方法
5.根據(jù)權(quán)利要求4所述的基于CITIN的復雜裝備數(shù)據(jù)處理方法,其特征在于,時間間隔感知時序插補網(wǎng)絡(luò)對于每一個時刻所有特征維度數(shù)據(jù)的處理方法,除了每一個時間戳的原始輸入,還包含歷史時間戳傳遞的信息,其中Ht-1代表前一個時間戳傳遞的隱藏特征,在處理首個時間戳時,歷史時間戳傳遞的Ht-1被設(shè)置為0,以下為每個時間戳數(shù)據(jù)處理的具體流程:Step①:對上一層的隱變量經(jīng)過一個線性層降維后轉(zhuǎn)換為xh,xh的尺寸與輸入x相同;
6.根據(jù)權(quán)利要求5所述的基于CITIN的復雜裝備數(shù)據(jù)處理方法,其特征在于,Step③中,整體輸入為δ,為每個時間戳的多傳感器數(shù)據(jù)時間間隔向量;輸出為時間衰減因子γx,引入自注意力機制增強網(wǎng)絡(luò)輸入對于時間間隔的感知,提高對GRU的隱變量和輸入權(quán)重之前權(quán)衡能力,所述自注意力機制增強網(wǎng)絡(luò)的左側(cè)為一個基本的線性層,用于生成一個臨時的γ,計算方法為:
7.根據(jù)權(quán)利要求6所述的基于CITIN的復雜裝備數(shù)據(jù)處理方法,其特征在于,Step③中中,在GRU中,隱狀態(tài)Ht-1和輸入Xi得到了更進一步的處理,GRU包含一個重置門Rt和一個更新門Zt,重置門的用途是計算候選隱狀態(tài)更新門的用途是作為權(quán)重,調(diào)整在新生成的Ht中,Ht-1和的權(quán)重,二者的結(jié)構(gòu)都是使用Sigmoid(·)激活函數(shù)的兩個全連接層,表示為
8.根據(jù)權(quán)利要求7所述的基于CITIN的復雜裝備數(shù)據(jù)處理方法,其特征在于,所述PCHIP單元用于對數(shù)據(jù)的平滑插值處理,具體為:在每兩個觀測值時間戳的區(qū)間構(gòu)造一個三次多項式,并使得這些多項式在觀測值上都具有相同的數(shù)值和導數(shù),包括四個步驟:拆分原始輸入以提供不完整序列的數(shù)據(jù);計算數(shù)據(jù)中每個已存在點的導數(shù),確保數(shù)據(jù)點在左右兩側(cè)導數(shù)一致;在每個區(qū)間構(gòu)造三次Hermite多項式,并確保在每個數(shù)值對應的位置都有相同的函數(shù)值和導數(shù)值;使用三次多項式計算任意位置的插值結(jié)果。
...【技術(shù)特征摘要】
1.一種基于citin的復雜裝備數(shù)據(jù)處理方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的基于citin的復雜裝備數(shù)據(jù)處理方法,其特征在于,所述填補網(wǎng)絡(luò)模型的輸入包括不完整數(shù)據(jù)x、缺失標記矩陣m、時間間隔矩陣δ和絕對時間s,多元時間序列為不完整數(shù)據(jù),其中t為數(shù)據(jù)在時間維度的長度,d為數(shù)據(jù)的特征維度,缺失標記矩陣m為標記原數(shù)據(jù)x的數(shù)據(jù)缺失的位置,形狀與x相同,對于t時刻第d維的數(shù)據(jù)有
3.根據(jù)權(quán)利要求1所述的基于citin的復雜裝備數(shù)據(jù)處理方法,其特征在于,填補網(wǎng)絡(luò)模型的輸入數(shù)據(jù)在手動遮掩后的數(shù)據(jù)被標記為這些數(shù)據(jù)的位置使用指示矩陣i來標記,指示矩陣形狀與原始數(shù)據(jù)相同,在觀測值數(shù)值存在,但在實際使用時被隱藏用于預測的數(shù)據(jù)位置表示為1,在其余位置表示為0,指示矩陣i在t時刻第d維表示為:
4.根據(jù)權(quán)利要求3所述的基于citin的復雜裝備數(shù)據(jù)處理方法,其特征在于,所述填補網(wǎng)絡(luò)模型包括兩個時間間隔感知時序插補網(wǎng)絡(luò),兩個網(wǎng)絡(luò)一個用于從訓練數(shù)據(jù)的正向捕捉規(guī)律,另一個從反向捕捉規(guī)律,兩個網(wǎng)絡(luò)各自提供一個臨時填補結(jié)果,還設(shè)有pchip單元,用于統(tǒng)計學方法填補結(jié)果的計算,兩個時間間隔感知時序插補網(wǎng)絡(luò)的輸入包括原始數(shù)據(jù)x、時間間隔矩陣δ和缺失標記矩陣m,第一個時間間隔感知時序插補網(wǎng)絡(luò)init1為從首個時間戳開始,依次處理每個時間戳的所有特征直到最后一個,代表在時間維度上正向捕捉數(shù)據(jù)關(guān)系的過程,將經(jīng)過init結(jié)構(gòu)的隱藏層ht輸入到下一層,將每一步中的輸出c1~ct按照時間維度拼接起來,temporary?imputed?data1即表示為
5.根據(jù)權(quán)利要求4所述的基于citin的復雜裝備數(shù)據(jù)處理方法,其特征在于,時間間隔感知時序插補網(wǎng)絡(luò)對于每一個時...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:鐘詩勝,吳昊澤,趙明航,付旭云,張永健,
申請(專利權(quán))人:哈爾濱工業(yè)大學威海,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。