System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術是有關于一種機器學習技術,且特別是有關于一種半監督式學習(semi-supervised?learning)的優化方法及運算裝置。
技術介紹
1、傳統的半監督式學習技術仰賴一個固定且很高的閾值來產生有效的偽標記。在實際應用上,數據集的數量經常是有限的。此外,采用高閾值會浪費大量的無標記數據,不僅導致初期訓練時間拉長,還可能抑制最終模型的性能。
2、傳統的半監督式學習技術對于所有未標記數據皆是使用相同的閾值。然而,學習任務中的多個類別之間可能存在難易度的差異。對于不同難易度的類別應采用不同的策略。若使用相同的閾值,則將導致較難類別的偽標記數據較少,間接產生數據不平衡的問題,更造成這類別最終無法有效學習。
3、在傳統的機器學習技術中,持續增加訓練數據的數量幫助模型準確度呈線性成長。假設模型的可學習數據量定義為模型的容量大小,訓練數據數量累積到一定數量后,模型準確度的成長會逐漸飽和。即便搜集大量的數據也無法進一步提升模型準確度。
4、此外,傳統的半監督學習技術容易對超參數敏感,需要對于偽標記閾值、數據集特性和數據集大小等參數進行微調,十分耗費運算資源。甚至,挑選到不好的超參數也容易影響模型準確度最終的效果。
技術實現思路
1、本專利技術提供一種半監督式學習的優化方法及運算裝置,可針對不同類別動態地提供合適的閾值,并適當地調整模型的容量。
2、本專利技術實施例的半監督式學習的優化方法可適用于已標記數據集及未標記數據集。已標記數據集中
3、本專利技術的實施例的運算裝置可適用于已標記數據集及未標記數據集。已標記數據集中的一個或多個第一樣本已標記為多個類別中的一者,未標記數據集中的一個或多個第二樣本尚未標記為那些類別中的一者。運算裝置包括(但不僅限于下列步驟)存儲器及處理器。存儲器存儲程序代碼。處理器耦接存儲器。處理器載入程序代碼而執行:通過機器學習模型分別決定已標記數據集的第一預測結果及未標記數據集的第二預測結果;依據已標記數據集中的第一樣本的第一預測結果的第一信心分數決定偽標記閾值;以及依據未標記數據集中的第二樣本的第二預測結果的第二信心分數與偽標記閾值的比較結果更新機器學習模型。
4、基于上述,依據本專利技術實施例的半監督式學習的優化方法及運算裝置,可使用預測已標記的樣本所得的信心分數決定用于判斷偽標記的閾值。借此,可更有效率地使用無標記數據,減少模型初期的訓練時間,且提升識別準確度。
5、為讓本專利技術的上述特征和優點能更明顯易懂,下文特舉實施例,并配合附圖作詳細說明如下。
本文檔來自技高網...【技術保護點】
1.一種半監督式學習的優化方法,適用于已標記數據集及未標記數據集,該已標記數據集中的至少一個第一樣本已標記為多個類別中的一者,該未標記數據集中的至少一個第二樣本尚未標記為所述多個類別中的一者,且該優化方法包括:
2.根據權利要求1所述的半監督式學習的優化方法,其中依據該已標記數據集中的該至少一個第一樣本的該第一預測結果的第一信心分數決定該偽標記閾值的步驟包括:
3.根據權利要求2所述的半監督式學習的優化方法,其中所述多個類別包括第一類別,且自該至少一個第一樣本的該第一預測結果的第一信心分數挑選一者作為該偽標記閾值的步驟包括:
4.根據權利要求3所述的半監督式學習的優化方法,其中自已標記為該第一類別的該至少一個第一樣本的該第一預測結果中對應于該第一類別的該第一信心分數挑選一者作為用于比對該第二樣本中該第一類別的該偽標記閾值的步驟包括:
5.根據權利要求4所述的半監督式學習的優化方法,還包括:
6.根據權利要求1所述的半監督式學習的優化方法,其中依據該未標記數據集中的該至少一個第二樣本的該第二預測結果的第二信心分數與該偽標記
7.根據權利要求6所述的半監督式學習的優化方法,其中允許將其第二信心分數中的該最高分數未小于該偽標記閾值的該第二預測結果用于更新該機器學習模型的步驟包括:
8.根據權利要求7所述的半監督式學習的優化方法,還包括:
9.根據權利要求1所述的半監督式學習的優化方法,還包括:
10.根據權利要求1所述的半監督式學習的優化方法,還包括:
11.一種運算裝置,適用于已標記數據集及未標記數據集,該已標記數據集中的至少一個第一樣本已標記為多個類別中的一者,該未標記數據集中的至少一個第二樣本尚未標記為所述多個類別中的一者,且該運算裝置包括:
12.根據權利要求11所述的運算裝置,其中該處理器還執行:
13.根據權利要求12所述的運算裝置,其中所述多個類別包括第一類別,且該處理器還執行:
14.根據權利要求13所述的運算裝置,其中該處理器還執行:
15.根據權利要求14所述的運算裝置,其中該處理器還執行:
16.根據權利要求11所述的運算裝置,其中該處理器還執行:
17.根據權利要求16所述的運算裝置,其中該處理器還執行:
18.根據權利要求17所述的運算裝置,其中該處理器還執行:
19.根據權利要求11所述的運算裝置,其中該處理器還執行:
20.根據權利要求11所述的運算裝置,其中該處理器還執行:
...【技術特征摘要】
1.一種半監督式學習的優化方法,適用于已標記數據集及未標記數據集,該已標記數據集中的至少一個第一樣本已標記為多個類別中的一者,該未標記數據集中的至少一個第二樣本尚未標記為所述多個類別中的一者,且該優化方法包括:
2.根據權利要求1所述的半監督式學習的優化方法,其中依據該已標記數據集中的該至少一個第一樣本的該第一預測結果的第一信心分數決定該偽標記閾值的步驟包括:
3.根據權利要求2所述的半監督式學習的優化方法,其中所述多個類別包括第一類別,且自該至少一個第一樣本的該第一預測結果的第一信心分數挑選一者作為該偽標記閾值的步驟包括:
4.根據權利要求3所述的半監督式學習的優化方法,其中自已標記為該第一類別的該至少一個第一樣本的該第一預測結果中對應于該第一類別的該第一信心分數挑選一者作為用于比對該第二樣本中該第一類別的該偽標記閾值的步驟包括:
5.根據權利要求4所述的半監督式學習的優化方法,還包括:
6.根據權利要求1所述的半監督式學習的優化方法,其中依據該未標記數據集中的該至少一個第二樣本的該第二預測結果的第二信心分數與該偽標記閾值的該比較結果更新該機器學習模型的步驟包括:
7.根據權利要求6所述的半監督式學習的優化方法,其中允許將其第二信心分數中的該最高分數未小于該偽標記...
【專利技術屬性】
技術研發人員:郭峻因,洪偉庭,
申請(專利權)人:緯創資通股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。