System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)涉及多標簽學(xué)習(xí)分類,具體而言,涉及一種基于加權(quán)流形消歧和動態(tài)局部標記相關(guān)性的偏多標記分類方法、裝置、設(shè)備及介質(zhì)。
技術(shù)介紹
1、偏多標記學(xué)習(xí)(partial?multi-label?learning,?pml)是多標記學(xué)習(xí)領(lǐng)域中的一個重要分支。在pml問題中,每個訓(xùn)練實例都與一組候選標記相關(guān)聯(lián),但其中只有一部分標記是正確的,其余的則是噪聲標記。這種學(xué)習(xí)場景在現(xiàn)實世界中非常普遍,例如在文本分類、生物信息學(xué)和多媒體內(nèi)容分析等領(lǐng)域,都可能遇到只有部分標簽是正確的情況。
2、傳統(tǒng)的多標記學(xué)習(xí)方法通常假設(shè)所有提供的標簽都是準確的,但在pml問題中,這種假設(shè)往往不成立。因此,pml的目標是從這些含有噪聲的候選標記中識別出正確的標記子集。現(xiàn)有的pml學(xué)習(xí)方法主要依賴于平滑假設(shè),即相關(guān)聯(lián)的標記傾向于同時出現(xiàn)在相似的實例上,從而利用訓(xùn)練實例的特征空間中的拓撲結(jié)構(gòu)和標記相關(guān)性來恢復(fù)出正確的標記分布。
3、然而,現(xiàn)有方法在處理特征與標記之間的負信息時存在局限性,并且基于候選標記集構(gòu)造的標記相關(guān)性容易受到噪聲標記的影響,這會顯著降低模型的預(yù)測性能。此外,大多數(shù)現(xiàn)有工作忽略了特征空間中特征與標記之間的復(fù)雜關(guān)系,以及如何有效地從含有噪聲的標記中學(xué)習(xí)到準確的標記分布。因此,研究者們一直在尋求更有效的pml學(xué)習(xí)方法,以提高在噪聲環(huán)境下的分類性能,并準確地從候選標記集中識別出正確的標記集。
技術(shù)實現(xiàn)思路
1、本專利技術(shù)提供了一種基于加權(quán)流形消歧和動態(tài)局部標記相關(guān)性的偏多標記分類方法
2、第一方面、本專利技術(shù)提供了一種基于加權(quán)流形消歧和動態(tài)局部標記相關(guān)性的偏多標記分類方法,其包含s1至s5。
3、s1、獲取待處理的偏多標記數(shù)據(jù)集,將偏多標記數(shù)據(jù)的候選標記轉(zhuǎn)化為邏輯標記矩陣,然后構(gòu)建特征空間矩陣和標記分布矩陣。并根據(jù)所述特征空間矩陣和標記分布矩陣構(gòu)建損失函數(shù)。
4、s2、計算所述邏輯標記矩陣的語義相似度,然后根據(jù)語義相似度和-近鄰方法尋找訓(xùn)練實例的近鄰樣本,并計算訓(xùn)練實例與其近鄰樣本的相似圖權(quán)重矩陣。
5、s3、根據(jù)所述邏輯標記矩陣計算初始局部標記相關(guān)性矩陣。并根據(jù)所述初始局部標記相關(guān)性矩陣和所述標記分布矩陣,構(gòu)建局部標記相關(guān)性動態(tài)學(xué)習(xí)機制,獲取新的局部標記相關(guān)性矩陣。然后基于訓(xùn)練實例的相似圖權(quán)重矩陣和新的局部標記相關(guān)性矩陣,構(gòu)建流形正則項誘導(dǎo)標記分布矩陣學(xué)習(xí)。
6、s4、根據(jù)所述損失函數(shù)和所述流形正則項構(gòu)建偏多標記分類器的目標函數(shù),進行迭代更新處理,直到所述目標函數(shù)值收斂,或者迭代達到預(yù)設(shè)最大迭代次數(shù),完成標記消歧得到最優(yōu)的模型參數(shù),獲取訓(xùn)練后的偏多標記分類器。
7、s5、獲取待測實例,并輸入所述訓(xùn)練后的偏多標記分類器,以預(yù)測所述待測實例所有可能的類別。
8、在一個可選的實施方式中,步驟s1具體包括步驟s11至步驟s15。
9、s11、獲取待處理的偏多標記數(shù)據(jù)集,記為,其中表示第個訓(xùn)練實例、表示的候選標記集合,為總樣本數(shù)量。
10、s12、對于每一個偏多標記樣本,使用硬閾值方法構(gòu)建的邏輯標記向量:對于任意,如果,則,否則;其中,表示類別的數(shù)量,為第個類別標記,表示的第個候選標記的邏輯值。
11、s13、構(gòu)造所有訓(xùn)練實例的邏輯標記矩陣和特征空間矩陣。其中,表示矩陣的轉(zhuǎn)置、表示實數(shù)集、為總樣本數(shù)量、表示特征空間的維度。
12、s14、根據(jù)所述特征空間矩陣,獲取標記分布矩陣:,式中,表示的標記分布、表示特征映射函數(shù),為模型的權(quán)重矩陣,表示偏移向量。
13、s15、根據(jù)所述特征空間矩陣和所述標記分布矩陣,采用最小二乘回歸模型構(gòu)建損失函數(shù)。損失函數(shù)公式為:
14、
15、其中,表示映射后的特征矩陣、表示維的全1向量、為向量的范數(shù)、為矩陣的frobenius范數(shù)。
16、在一個可選的實施方式中,步驟s2具體包括步驟s21至步驟s25。
17、s21、采用余弦相似性構(gòu)造語義相似度矩陣。,。其中,表示第個實例和第個實例對應(yīng)的相似度、為總樣本數(shù)量、和分別表示第個實例和第個實例對應(yīng)的邏輯標記向量、表示矩陣的轉(zhuǎn)置、為向量的范數(shù)。
18、s22、計算訓(xùn)練實例之間的距離矩陣,。其中,表示第個實例和第個實例之間的距離。
19、s23、構(gòu)造訓(xùn)練實例的加權(quán)距離矩陣,。其中,表示第個實例和第個實例之間的加權(quán)距離。
20、s24、對于每一個訓(xùn)練實例,通過加權(quán)距離選出與其距離最近的個訓(xùn)練實例,構(gòu)成的鄰域。
21、s25、根據(jù)所述鄰域計算訓(xùn)練實例的相似圖權(quán)重矩陣。通過求解以下線性最小二乘問題來構(gòu)建:
22、
23、其中,表示訓(xùn)練實例為的鄰域里的元素。為第個實例和第個實例之間的相似圖權(quán)重。
24、在一個可選的實施方式中,步驟s3具體包括步驟s31至步驟s33。
25、s31、利用邏輯標記矩陣計算初始局部標記相關(guān)性矩陣,,其中,表示第個類和第個類的初始局部標記相關(guān)性、和分別表示第個類和第個類的邏輯向量、表示核大小。
26、s32、基于所述初始局部標記相關(guān)性矩陣和標記分布矩陣進行動態(tài)學(xué)習(xí),獲取新的局部標記相關(guān)性矩陣,。的學(xué)習(xí)公式為:
27、
28、其中,表示第個類和第個類的新的局部標記相關(guān)性、和分別表示第個類和第個類的標記分布向量、表示的轉(zhuǎn)置,表示的對角元素,表示維的全1向量。
29、s33、基于訓(xùn)練實例的相似圖權(quán)重矩陣和新的局部標記相關(guān)性矩陣,構(gòu)建流形正則項誘導(dǎo)標記分布矩陣學(xué)習(xí)。其中,所述流形正則項公式為:
30、
31、其中,,為代換符號用以連接上下兩個公式無實際含義、表示維的單位矩陣、為總樣本數(shù)量、和分別表示第個實例和第個實例的標記分布、為第個實例和第個實例之間的相似圖權(quán)重、為向量的范數(shù)、表示矩陣的轉(zhuǎn)置、表示類別的數(shù)量、表示第個類和第個類的新的局部標記相關(guān)性、和分別表示第個類和第個類的標記分布向量、為新的局部標記相關(guān)性矩陣的拉普拉斯矩陣,為對角矩陣,其對角元素為,表示矩陣的秩。
32、在一個可選的實施方式中,步驟s4具體包括步驟s41至步驟s42。
33、s41、根據(jù)所述損失函數(shù)和所述流形正則項構(gòu)建偏多標記分類器的目標函數(shù)。
34、所述目標函數(shù)公式為:
35、
36、其中,,為代換符號用以連接上下兩個公式無實際含義、表示維的單位矩陣、為相似圖權(quán)重矩陣、、和表示正則參數(shù)、為模型的權(quán)重矩陣、表示偏移向量、為標記分布矩陣、為新的局部標記相關(guān)性矩陣、表示映射后的特征矩陣、表示維的全1向量、為總樣本數(shù)量、表示矩陣的轉(zhuǎn)置、為矩陣的frobenius范數(shù)、表示矩陣的秩、為新的局部標記相關(guān)性矩陣的拉普拉斯矩陣、為對角矩陣、為初始局部標記相關(guān)性矩陣、表示維的全1向量、表示的對角元素。
37、s42、采用交本文檔來自技高網(wǎng)...
【技術(shù)保護點】
1.一種基于加權(quán)流形消歧和動態(tài)局部標記相關(guān)性的偏多標記分類方法,其特征在于,包含:
2.根據(jù)權(quán)利要求1所述的一種基于加權(quán)流形消歧和動態(tài)局部標記相關(guān)性的偏多標記分類方法,其特征在于,獲取待處理的偏多標記數(shù)據(jù)集,將偏多標記數(shù)據(jù)的候選標記轉(zhuǎn)化為邏輯標記矩陣,然后構(gòu)建特征空間矩陣和標記分布矩陣;并根據(jù)所述特征空間矩陣和標記分布矩陣構(gòu)建損失函數(shù),具體包括:
3.根據(jù)權(quán)利要求1所述的一種基于加權(quán)流形消歧和動態(tài)局部標記相關(guān)性的偏多標記分類方法,其特征在于,計算所述邏輯標記矩陣的語義相似度,然后根據(jù)語義相似度和k-近鄰方法尋找訓(xùn)練實例的近鄰樣本,并計算訓(xùn)練實例與其近鄰樣本的相似圖權(quán)重矩陣,具體包括:
4.根據(jù)權(quán)利要求1所述的一種基于加權(quán)流形消歧和動態(tài)局部標記相關(guān)性的偏多標記分類方法,其特征在于,根據(jù)所述邏輯標記矩陣計算初始局部標記相關(guān)性矩陣;并根據(jù)所述初始局部標記相關(guān)性矩陣和所述標記分布矩陣,構(gòu)建局部標記相關(guān)性動態(tài)學(xué)習(xí)機制,獲取新的局部標記相關(guān)性矩陣;然后基于訓(xùn)練實例的相似圖權(quán)重矩陣和新的局部標記相關(guān)性矩陣,構(gòu)建流形正則項誘導(dǎo)標記分布矩陣學(xué)習(xí),具體包括:
>5.根據(jù)權(quán)利要求1所述的一種基于加權(quán)流形消歧和動態(tài)局部標記相關(guān)性的偏多標記分類方法,其特征在于,根據(jù)所述損失函數(shù)和所述流形正則項構(gòu)建偏多標記分類器的目標函數(shù),進行迭代更新處理,直到所述目標函數(shù)值收斂,或者迭代達到預(yù)設(shè)最大迭代次數(shù),完成標記消歧得到最優(yōu)的模型參數(shù),獲取訓(xùn)練后的偏多標記分類器,具體包括:
6.一種基于加權(quán)流形消歧和動態(tài)局部標記相關(guān)性的偏多標記學(xué)習(xí)裝置,其特征在于,包含:
7.一種基于加權(quán)流形消歧和動態(tài)局部標記相關(guān)性的偏多標記學(xué)習(xí)設(shè)備,其特征在于,包括處理器、存儲器,以及存儲在所述存儲器內(nèi)的計算機程序;所述計算機程序能夠被所述處理器執(zhí)行,以實現(xiàn)如權(quán)利要求1至5任意一項所述的一種基于加權(quán)流形消歧和動態(tài)局部標記相關(guān)性的偏多標記分類方法。
8.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)包括存儲的計算機程序,其中,在所述計算機程序運行時控制所述計算機可讀存儲介質(zhì)所在設(shè)備執(zhí)行如權(quán)利要求1至5任意一項所述的一種基于加權(quán)流形消歧和動態(tài)局部標記相關(guān)性的偏多標記分類方法。
...【技術(shù)特征摘要】
1.一種基于加權(quán)流形消歧和動態(tài)局部標記相關(guān)性的偏多標記分類方法,其特征在于,包含:
2.根據(jù)權(quán)利要求1所述的一種基于加權(quán)流形消歧和動態(tài)局部標記相關(guān)性的偏多標記分類方法,其特征在于,獲取待處理的偏多標記數(shù)據(jù)集,將偏多標記數(shù)據(jù)的候選標記轉(zhuǎn)化為邏輯標記矩陣,然后構(gòu)建特征空間矩陣和標記分布矩陣;并根據(jù)所述特征空間矩陣和標記分布矩陣構(gòu)建損失函數(shù),具體包括:
3.根據(jù)權(quán)利要求1所述的一種基于加權(quán)流形消歧和動態(tài)局部標記相關(guān)性的偏多標記分類方法,其特征在于,計算所述邏輯標記矩陣的語義相似度,然后根據(jù)語義相似度和k-近鄰方法尋找訓(xùn)練實例的近鄰樣本,并計算訓(xùn)練實例與其近鄰樣本的相似圖權(quán)重矩陣,具體包括:
4.根據(jù)權(quán)利要求1所述的一種基于加權(quán)流形消歧和動態(tài)局部標記相關(guān)性的偏多標記分類方法,其特征在于,根據(jù)所述邏輯標記矩陣計算初始局部標記相關(guān)性矩陣;并根據(jù)所述初始局部標記相關(guān)性矩陣和所述標記分布矩陣,構(gòu)建局部標記相關(guān)性動態(tài)學(xué)習(xí)機制,獲取新的局部標記相關(guān)性矩陣;然后基于訓(xùn)練實例的相似圖權(quán)重矩陣和新的局部標記相關(guān)性矩陣,構(gòu)建流形正則項誘導(dǎo)標記分...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:孫真真,單書豪,陳旭,
申請(專利權(quán))人:華僑大學(xué),
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。