System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
【國外來華專利技術】
本專利技術涉及機器學習(ml)可解釋性(mlx)。本文介紹了一種基于由數據集樣本的特征置換建立的超特征重要性的黑盒ml模型的局部解釋技術。
技術介紹
1、機器學習(ml)和深度學習之所以變得無處不在,主要有兩個原因:它們能夠解決各種不同領域的復雜問題,以及現代計算資源的性能和效率不斷提高。但是,隨著問題的復雜性不斷增加,應用于這些問題的ml模型的復雜性也在不斷增加。
2、深度學習是這一趨勢的一個典型示例。其他ml算法(諸如神經網絡)可能只包含幾層密集連接的神經元,而深度學習算法(諸如卷積神經網絡)可能包含數十到數百層執行非常不同操作的神經元。增加神經模型的深度和層的異質性帶來許多益處。例如,更深入可以增加模型的容量、提高模型的泛化、以及為模型提供過濾掉不重要特征的機會,而包含執行不同操作的層可以大大提高模型的性能。但是,這些優化是以增加復雜性和降低模型操作的人類可解讀性(interpretability)為代價的。
3、與許多其他ml模型相比,解釋和解讀復雜深度學習模型的結果是一項具有挑戰性的任務。例如,決策樹可以基于n個輸入特征執行二元分類。在訓練期間,對類別預測影響最大的特征被插入到樹的根附近,而對類別預測影響較小的特征則位于樹的葉子附近??梢酝ㄟ^測量決策節點到決策樹的根的距離直接確定特征重要性。
4、此類模型通常被稱為本質上可解讀的。但是,隨著模型的復雜性增加(例如,特征數量或決策樹深度增加),解讀對模型推斷的解釋變得越來越具有挑戰性。同樣,即使是相對簡單的幾層神經網絡也可能難以解讀,因
5、ml可解釋性(mlx)是解釋和解讀ml和深度學習模型的處理。mlx大致可以被歸類為局部可解釋性和全局可解釋性:
6、·局部:解釋為什么ml模型做出與給定樣本對應的特定預測,以回答諸如為什么ml模型做出特定預測之類的問題。
7、·全局:理解ml模型作為整體的一般行為,以回答諸如ml模型如何工作或ml模型從訓練數據中學到了什么之類的問題。
8、ml模型接受實例作為輸入,諸如基于各種數據類型的許多特征的特征向量,這些特征分別具有許多或無限數量的可能值。每個特征在巨大的多維問題空間中提供一個維度,其中給定的多特征輸入只是一個點。即使全局解釋可能基于許多輸入實例,但這些實例錯過了大多數多維問題空間,并且這些實例彼此之間有巨大的空間間隙。因此,對于解釋ml模型對特定輸入的特定推斷,該推斷幾乎總是落在ml模型的未知行為的這種空間間隙內,全局解釋的準確性可能低。諸如shapley之類的局部解釋方法需要大量輸入實例和輸出推斷,這些輸入實例和輸出推斷的數量會隨著特征數量的增加而呈指數增長,因為shapley的設計探索了特征之間的關系,這是組合上難以解決的。換句話說,最佳品種的局部解釋器不可擴展,并且可能會因寬特征向量而導致計算不堪重負。
技術實現思路
本文檔來自技高網...【技術保護點】
1.一種計算機實現的方法,包括:
2.如權利要求1所述的方法,還包括基于選自由以下各項組成的組中的至少一項來訪問所述多個原始元組中的原始元組的超特征的值:
3.如權利要求1所述的方法,其中選自由以下各項組成的組中的至少一項:
4.如權利要求1所述的方法,還包括基于所述特定元組生成ML模型的局部解釋。
5.如權利要求4所述的方法,其中所述生成ML模型的局部解釋是基于所述多個超特征中的至少一個超特征的重要性的。
6.如權利要求5所述的方法,其中所述局部解釋包括基于所述多個超特征中的至少兩個超特征的重要性對所述至少兩個超特征的排名。
7.如權利要求1所述的方法,其中選自由以下各項組成的組中的至少一項:
8.如權利要求1所述的方法,其中所述多個超特征中的特定超特征表示選自由以下各項組成的組中的一項:數據庫連接、數據庫表、查詢條件、數據庫語句的結果和數據庫語句的種類。
9.如權利要求1所述的方法,其中所述訓練代理模型包括填充選自由以下各項組成的組中的至少一項:
10.如權利要求1所述
11.一個或多個存儲指令的非暫態計算機可讀介質,所述指令在由一個或多個計算設備執行時,使得執行如權利要求1-10中的任一項中所述的方法。
12.一種系統,包括:
...【技術特征摘要】
【國外來華專利技術】
1.一種計算機實現的方法,包括:
2.如權利要求1所述的方法,還包括基于選自由以下各項組成的組中的至少一項來訪問所述多個原始元組中的原始元組的超特征的值:
3.如權利要求1所述的方法,其中選自由以下各項組成的組中的至少一項:
4.如權利要求1所述的方法,還包括基于所述特定元組生成ml模型的局部解釋。
5.如權利要求4所述的方法,其中所述生成ml模型的局部解釋是基于所述多個超特征中的至少一個超特征的重要性的。
6.如權利要求5所述的方法,其中所述局部解釋包括基于所述多個超特征中的至少兩個超特征的重要性對所述至少兩個超特征的排名。
7.如權...
【專利技術屬性】
技術研發人員:R·卡薩諾娃,N·米洛科維奇,M·卡塞里尼,F·施密特,
申請(專利權)人:甲骨文國際公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。