System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術總體上涉及學習數據,并且在具體實施例中涉及用于生成分類模型的方法。
技術介紹
1、計算機可以使用分類模型來根據一些特性將數據分類或分組。存在數種類型的分類模型。取決于將被分類的數據的類型,每種分類模型類型具有其優點和缺點。
2、特別地,分類模型包括決策樹、神經網絡、基于鄰居的分類模型,諸如k最近鄰(knn)和支持向量機(svm)。
3、此外,微控制器是可編程的集成電路,其可以被用于實現分類模型。
4、然而,微控制器在存儲器和計算功率資源方面具有限制。實際上,微控制器通常具有有限的存儲器存儲容量。微控制器也具有有限的處理速度。
5、這些限制可能會限制它們實現一些分類模型的能力。
6、應當考慮分類模型的尺寸和復雜性以及微控制器上的可用資源,以便確定在微控制器上使用分類模型是否可能和可取。
7、特別地,需要大量數據存儲的分類模型可能超過微控制器的存儲容量。此外,需要大量計算的分類算法可能花費很長時間在微控制器上被執行。
8、因此,一些分類模型不適合被微控制器使用。一般來說,微控制器最適合使用簡單的分類模型。
9、因此,需要提供一種允許在存儲器占用方面以簡單、快速且便宜的方式實現分類的解決方案。
技術實現思路
1、根據一個實施例,提供了一種用于生成分類模型的計算機實現的方法,該方法包括:
2、-獲得至少一組學習數據,每組學習數據與指示的類別相關聯,
3、-標識學
4、-提取針對所有學習數據找到的每個特性的值,
5、-設置來自所提取的值中的針對每個特性的值的范圍,
6、-創建分類表,該分類表具有與研究的特性的數目相對應的多個維度,每個維度具有等于為與該維度相關聯的特性設置的值的范圍的數目的尺寸,分類表的每個單元與每個研究的特性的值的范圍相關聯,
7、-根據每組學習數據根據它們的每個特性的提取的值相對于為每個研究的特性設置的值的范圍的出現次數,向分類表的每個單元分配類別,
8、-生成包括分類表的分類模型。
9、這樣的生成方法允許獲得使用簡單且快速、并且在存儲器中占用相對減少的空間的分類模型。
10、因此,這樣的分類模型可以被計算機系統使用,該計算機系統在存儲器和計算功率方面包括有限的資源。特別地,這樣的分類模型可以被微控制器使用。
11、由于類別被分配給每個研究的特性的值的范圍,因此在避免過度擬合學習數據的同時設置分類模型,以改進其對未被用作學習數據的數據的泛化。與學習數據的數目相關的有限數目的值的范圍也允許避免過度擬合。
12、這樣的分類模型也可以通過考慮新的學習數據而被容易地更新。
13、此外,如果學習數據被分成數個不同大小的組,則可以在將類別分配給分類表的不同單元時對所使用的學習數據的出現次數應用加權。因此,這樣的分類模型生成方法適用于學習數據的不平衡的集合。
14、在一個有利的實現方式中,分類模型還包括每個研究的特性的最小值和最大值。這樣的分類模型可以被存儲在存儲器中的相對減少的空間中。
15、另選地,分類模型可以包括針對每個特性的值的所有范圍。
16、在一些實施例中,被分配給分類表的單元的類別對應于在與分類表的單元相關聯的每個特性的值的范圍內具有學習數據的最大出現次數的該組學習數據的類別。
17、在一個有利的實現方式中,如果如果針對每組學習數據,學習數據在與單元相關聯的每個特性的值的范圍內的出現次數相同并且不為零,則被分配給分類表的單元的類別對應于與被分配給分類表的相鄰的單元的類別相比具有最高概率的類別。
18、在一個有利的實現方式中,如果針對每組學習數據,學習數據在與單元相關聯的每個特性的值的范圍內的出現次數為零,則被分配給分類表的單元的類別對應于未確定的類別或者對應于與被分配給分類表的相鄰的單元的類別相比具有最高概率的類別。
19、在一些實施例中,針對每個特性的值的范圍使用斯特奇斯(sturges)規則被設置。
20、有利地,該方法還包括開發分類計算機程序產品,該分類計算機程序產品包括指令,當程序由計算機執行時,該指令使得計算機實現所生成的分類模型。
21、根據另一實施例,提供了一種計算機程序產品,該計算機程序產品包括指令,當程序由計算機執行時,該指令使得計算機實現如前所述的用于生成分類模型的方法。
22、根據又一實施例,提供了一種計算機系統,該計算機系統包括:
23、-存儲器,其包括計算機程序產品,該計算機程序產品包括指令,當程序由計算機執行時,該指令使得計算機實現如前所述的用于生成分類模型的方法,
24、-處理單元,其被配置為執行計算機程序產品。
25、根據又一實施例,提供了一種計算機實現的分類方法,該分類方法基于通過如先前描述的生成方法獲得的分類模型,該分類方法包括:
26、-獲得將被分類的數據,
27、-針對在分類模型中標識的每個特性,從將被分類的數據中提取值,
28、-從分類模型的分類表確定將被分類的數據的類別,該分類表指示為所提取的值分配的類別。
29、在一個有利的實現方式中,分類模型包括每個研究的特性的最小值和最大值。為將被分類的數據分配的類別然后根據從將被分類的數據中提取的值、每個研究的特性的最小值和最大值以及分類表的每個維度的尺寸在分類表中被找到。
30、根據又一實施例,提供了一種計算機程序產品,該計算機程序產品包括指令,當程序由計算機執行時,該指令使得計算機實現如前所述的分類方法。
31、根據又一實施例,提供了一種計算機系統,該計算機系統包括:
32、-存儲器,其包括計算機程序產品,該計算機程序產品包括指令,當程序由計算機執行時,該指令使得計算機實現如前所述的分類方法,
33、-處理單元,其被配置為執行計算機程序產品。
本文檔來自技高網...【技術保護點】
1.一種用于生成分類模型的方法,所述方法包括:
2.根據權利要求1所述的方法,其中所述分類模型還包括每個研究的特性的最小值和最大值。
3.根據權利要求1所述的方法,其中被分配給所述分類表的單元的所述類別對應于在與所述分類表的所述單元相關聯的每個特性的所述值的所述范圍內具有學習數據的最大出現次數的所述組學習數據的所述類別。
4.根據權利要求1所述的方法,其中如果針對每組學習數據,所述學習數據在與所述單元相關聯的每個特性的所述值的所述范圍內的所述出現次數相同并且不為零,則被分配給所述分類表的單元的所述類別對應于與被分配給所述分類表的相鄰的所述單元的所述類別相比具有最高概率的所述類別。
5.根據權利要求1所述的方法,其中如果針對每組學習數據,所述學習數據在與所述單元相關聯的每個特性的值的所述范圍內的所述出現次數為零,則被分配給所述分類表的單元的所述類別對應于未確定的類別或者對應于與被分配給所述分類表的相鄰的所述單元的所述類別相比具有最高概率的所述類別。
6.根據權利要求1所述的方法,其中針對每個特性的所述值的所述范圍使用斯特奇
7.根據權利要求1所述的方法,還包括:開發分類計算機程序產品,所述分類計算機程序產品包括指令,當所述程序由計算機執行時,所述指令使得所述計算機實現所生成的所述分類模型。
8.一種計算機系統,包括:
9.根據權利要求8所述的計算機系統,其中所述分類模型還包括每個研究的特性的最小值和最大值。
10.根據權利要求8所述的計算機系統,其中被分配給所述分類表的單元的所述類別對應于在與所述分類表的所述單元相關聯的每個特性的所述值的所述范圍內具有學習數據的最大出現次數的所述組學習數據的所述類別。
11.根據權利要求8所述的計算機系統,其中如果針對每組學習數據,所述學習數據在與所述單元相關聯的每個特性的所述值的所述范圍內的所述出現次數相同并且不為零,則被分配給所述分類表的單元的所述類別對應于與被分配給所述分類表的相鄰的所述單元的所述類別相比具有最高概率的所述類別。
12.根據權利要求8所述的計算機系統,其中如果針對每組學習數據,所述學習數據在與所述單元相關聯的每個特性的值的所述范圍內的所述出現次數為零,則被分配給所述分類表的單元的所述類別對應于未確定的類別或者對應于與被分配給所述分類表的相鄰的所述單元的所述類別相比具有最高概率的所述類別。
13.根據權利要求8所述的計算機系統,其中針對每個特性的所述值的所述范圍使用斯特奇斯規則被設置。
14.根據權利要求8所述的計算機系統,還包括開發分類計算機程序產品,所述分類計算機程序產品包括指令,當所述程序由計算機執行時,所述指令使得所述計算機實現所生成的所述分類模型。
15.一種分類方法,所述分類方法包括:
16.根據權利要求15所述的方法,其中所述分類模型包括每個研究的特性的最小值和最大值,并且其中為所述將被分類的數據分配的所述類別根據從所述將被分類的數據中提取的所述值、每個研究的特性的所述最小值和所述最大值以及所述分類表的每個維度的所述尺寸在所述分類表中被找到。
17.根據權利要求15所述的方法,其中所述分類模型還包括每個研究的特性的最小值和最大值。
18.根據權利要求15所述的方法,其中被分配給所述分類表的單元的所述類別對應于在與所述分類表的所述單元相關聯的每個特性的所述值的所述范圍內具有學習數據的最大出現次數的所述組學習數據的所述類別。
19.根據權利要求15所述的方法,其中如果針對每組學習數據,所述學習數據在與所述單元相關聯的每個特性的所述值的所述范圍內的所述出現次數相同并且不為零,則被分配給所述分類表的單元的所述類別對應于與被分配給所述分類表的相鄰的所述單元的所述類別相比具有最高概率的所述類別。
20.根據權利要求15所述的方法,其中如果針對每組學習數據,所述學習數據在與所述單元相關聯的每個特性的值的所述范圍內的所述出現次數為零,則被分配給所述分類表的單元的所述類別對應于未確定的類別或者對應于與被分配給所述分類表的相鄰的所述單元的所述類別相比具有最高概率的所述類別。
...【技術特征摘要】
1.一種用于生成分類模型的方法,所述方法包括:
2.根據權利要求1所述的方法,其中所述分類模型還包括每個研究的特性的最小值和最大值。
3.根據權利要求1所述的方法,其中被分配給所述分類表的單元的所述類別對應于在與所述分類表的所述單元相關聯的每個特性的所述值的所述范圍內具有學習數據的最大出現次數的所述組學習數據的所述類別。
4.根據權利要求1所述的方法,其中如果針對每組學習數據,所述學習數據在與所述單元相關聯的每個特性的所述值的所述范圍內的所述出現次數相同并且不為零,則被分配給所述分類表的單元的所述類別對應于與被分配給所述分類表的相鄰的所述單元的所述類別相比具有最高概率的所述類別。
5.根據權利要求1所述的方法,其中如果針對每組學習數據,所述學習數據在與所述單元相關聯的每個特性的值的所述范圍內的所述出現次數為零,則被分配給所述分類表的單元的所述類別對應于未確定的類別或者對應于與被分配給所述分類表的相鄰的所述單元的所述類別相比具有最高概率的所述類別。
6.根據權利要求1所述的方法,其中針對每個特性的所述值的所述范圍使用斯特奇斯規則被設置。
7.根據權利要求1所述的方法,還包括:開發分類計算機程序產品,所述分類計算機程序產品包括指令,當所述程序由計算機執行時,所述指令使得所述計算機實現所生成的所述分類模型。
8.一種計算機系統,包括:
9.根據權利要求8所述的計算機系統,其中所述分類模型還包括每個研究的特性的最小值和最大值。
10.根據權利要求8所述的計算機系統,其中被分配給所述分類表的單元的所述類別對應于在與所述分類表的所述單元相關聯的每個特性的所述值的所述范圍內具有學習數據的最大出現次數的所述組學習數據的所述類別。
11.根據權利要求8所述的計算機系統,其中如果針對每組學習數據,所述學習數據在與所述單元相關聯的每個特性的所述值的所述范圍內的所述出現次數相同并且不為零,則被分配給所述分類表的單元的所述類別對應于與被分配給所述分類表的相鄰的所述單元的所述類別相比具有最高...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。