System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專(zhuān)利技術(shù)屬于技術(shù)診斷應(yīng)用于以寵物貓為對(duì)象的寵物行業(yè),具體涉及基于xgboost算法的數(shù)據(jù)分析與預(yù)測(cè)方法和裝置。
技術(shù)介紹
1、目前寵物行業(yè)所使用的寵物健康狀況監(jiān)測(cè)技術(shù)主要包括遠(yuǎn)程健康監(jiān)測(cè)、智能項(xiàng)圈和基因測(cè)試等。遠(yuǎn)程健康監(jiān)測(cè)技術(shù)可以通過(guò)無(wú)線(xiàn)傳輸技術(shù)將寵物的健康數(shù)據(jù)實(shí)時(shí)傳輸?shù)綄櫸镏魅说氖謾C(jī)或電腦上,使主人可以隨時(shí)隨地監(jiān)測(cè)寵物的各項(xiàng)生理數(shù)據(jù)和行為數(shù)據(jù)等,實(shí)現(xiàn)寵物健康監(jiān)測(cè)的實(shí)時(shí)性和便捷性,但其無(wú)法對(duì)通過(guò)寵物的生理和行為狀況對(duì)寵物健康狀況進(jìn)行精準(zhǔn)判斷和預(yù)測(cè)并對(duì)應(yīng)對(duì)措施給出建議,智能化和自動(dòng)化程度相對(duì)較低;
2、智能項(xiàng)圈是一種通過(guò)內(nèi)置傳感器及芯片對(duì)寵物的各項(xiàng)數(shù)據(jù)進(jìn)行實(shí)時(shí)監(jiān)測(cè)并通過(guò)藍(lán)牙或wi-fi等無(wú)線(xiàn)傳輸技術(shù)將數(shù)據(jù)傳輸給寵物主人的手機(jī)或電腦的技術(shù),這種技術(shù)可以記錄寵物的行為數(shù)據(jù)并通過(guò)內(nèi)置的智能算法分析寵物的行為模式以提供個(gè)性化的健康建議,但其數(shù)據(jù)處理能力較低且無(wú)法進(jìn)行精確地?cái)?shù)據(jù)預(yù)測(cè),對(duì)寵物健康狀況的把握具有一定的滯后性;
3、基因預(yù)測(cè)是一種通過(guò)檢測(cè)寵物的基因序列預(yù)測(cè)寵物的易患疾病和其對(duì)藥物的敏感性的技術(shù),基因信息作為寵物健康的重要參考指標(biāo),通過(guò)基因測(cè)試可以更加精確地了解寵物的遺傳狀況以及早發(fā)現(xiàn)潛在的健康門(mén)體,但該技術(shù)只能進(jìn)行健康問(wèn)題的預(yù)測(cè)和提供相關(guān)建議,不具有捕捉寵物正常生活中的生理和行為狀況的功能,使得在實(shí)際操作應(yīng)用中須搭配其他技術(shù)才能滿(mǎn)足寵物主人對(duì)寵物健康狀況監(jiān)測(cè)的需求;
4、市面上的貓砂盆品牌如糯雪snow、小佩max等,可以通過(guò)重力感應(yīng)、紅外探測(cè)等技術(shù)實(shí)現(xiàn)排泄物自動(dòng)監(jiān)測(cè)并及時(shí)清理,但對(duì)寵物進(jìn)出的
5、常用的數(shù)據(jù)預(yù)測(cè)類(lèi)算法程序有時(shí)間序列分析、回歸分析等,時(shí)間序列分析是一種用于分析和預(yù)測(cè)基于時(shí)間順序的數(shù)據(jù)的統(tǒng)計(jì)方法,可以依據(jù)歷史數(shù)據(jù)分析數(shù)據(jù)趨勢(shì)、季節(jié)性、周期性、異常值等,但其數(shù)據(jù)依賴(lài)性大、數(shù)據(jù)不規(guī)則且可能造成數(shù)據(jù)缺失或異常;
6、回歸分析是一種在統(tǒng)計(jì)學(xué)中廣泛應(yīng)用的方法,主要用于研究一個(gè)或多個(gè)自變量(也稱(chēng)為解釋變量或預(yù)測(cè)變量)與一個(gè)因變量(也稱(chēng)為響應(yīng)變量或結(jié)果變量)之間的關(guān)系,具有一定的靈活性和適應(yīng)性,但其通常只能分析少量變量之間的相互關(guān)系,對(duì)于處理大量變量間的相互作用關(guān)系,尤其是變量共同因素對(duì)因變量的影響程度時(shí)效果較差,且其要求自變量之間相互獨(dú)立,對(duì)數(shù)據(jù)質(zhì)量要求高,計(jì)算工作量大且十分復(fù)雜。這兩種算法的預(yù)測(cè)精確性、效率與泛化能力也相對(duì)較低。
技術(shù)實(shí)現(xiàn)思路
1、本專(zhuān)利技術(shù)要克服現(xiàn)有技術(shù)的上述缺點(diǎn),提供一種基于梯度提升xgboost模型的寵物健康判別方法和裝置。
2、本專(zhuān)利技術(shù)的第一個(gè)方面涉及一種基于梯度提升xgboost模型的寵物健康判別方法,包括以下步驟:
3、s1.獲取智能寵物貓砂盆的歷史檢測(cè)數(shù)據(jù)記錄,所述歷史檢測(cè)數(shù)據(jù)包括所有樣本貓咪每日的體重、排泄次數(shù)、單次排泄重量、排泄總重量、排泄時(shí)長(zhǎng)和貓咪健康狀況正常或異常的標(biāo)簽數(shù)據(jù);
4、s2.對(duì)所述歷史檢測(cè)數(shù)據(jù)采用十折交叉驗(yàn)證的數(shù)據(jù)集劃分方法進(jìn)行數(shù)據(jù)集的劃分和xgboost模型的驗(yàn)證與訓(xùn)練,并在每次交叉驗(yàn)證中優(yōu)化xgboost模型;
5、s3.根據(jù)所述歷史檢測(cè)數(shù)據(jù)進(jìn)行基于xgboost算法的識(shí)別模型訓(xùn)練,得到對(duì)應(yīng)所述智能寵物貓砂盆的貓咪健康狀況判別模型和對(duì)應(yīng)所述寵物貓砂盆的健康指標(biāo)重要性;
6、s4.監(jiān)控xgboost模型的性能,根據(jù)所述歷史檢測(cè)數(shù)據(jù)和新檢測(cè)數(shù)據(jù)進(jìn)行基于xgboost算法的寵物健康判別模型的增量更新及其模型參數(shù)與特征選擇的持續(xù)優(yōu)化;
7、s5.利用指數(shù)加權(quán)移動(dòng)平均對(duì)所述寵物健康指標(biāo)進(jìn)行平滑處理,得到所述智能寵物貓砂盆的警告閾值,當(dāng)所述智能寵物貓砂盆的實(shí)時(shí)檢測(cè)數(shù)據(jù)超過(guò)所述警告閾值時(shí),對(duì)寵物主人進(jìn)行寵物健康異常警告。
8、優(yōu)選地,步驟s1所述獲取智能寵物貓砂盆的歷史檢測(cè)數(shù)據(jù)記錄,包括:
9、利用貓砂盆四角的壓力傳感器獲取智能寵物貓砂盆的所有檢測(cè)數(shù)據(jù),對(duì)所述監(jiān)測(cè)數(shù)據(jù)中的各項(xiàng)數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,通過(guò)多項(xiàng)式插值填補(bǔ)缺失值、箱線(xiàn)圖分析處理異常值、數(shù)據(jù)標(biāo)準(zhǔn)化處理后,將所述預(yù)處理后的各項(xiàng)數(shù)據(jù)排列為時(shí)間序列,所述檢測(cè)數(shù)據(jù)包括寵物健康數(shù)據(jù)和是否正常的標(biāo)簽數(shù)據(jù)。
10、優(yōu)選地,步驟s2所述的采用十折交叉驗(yàn)證的數(shù)據(jù)集劃分方法劃分?jǐn)?shù)據(jù)集和優(yōu)化xgboost模型,包括:
11、s21.將所述所有樣本貓咪的檢測(cè)數(shù)據(jù)采用分層抽樣的方法劃分為十個(gè)子集,所述分層抽樣可以確保每個(gè)子集中是否正常兩類(lèi)別的分布相似,每一次交叉驗(yàn)證將每一個(gè)所述子集作為xgboost模型的驗(yàn)證集,其余作為訓(xùn)練集,重復(fù)上述步驟十次,確保每一個(gè)所述子集都當(dāng)了一次驗(yàn)證集,進(jìn)行所述十折交叉驗(yàn)證;
12、s22.分別在每一次數(shù)據(jù)集劃分中,訓(xùn)練和檢測(cè)xgboost模型,在每次所述交叉驗(yàn)證中,對(duì)超參數(shù)進(jìn)行調(diào)優(yōu),提高模型的學(xué)習(xí)能力和泛化能力。
13、優(yōu)選地,步驟s3所述的根據(jù)歷史檢測(cè)數(shù)據(jù)進(jìn)行基于算法的寵物健康判別模型訓(xùn)練,包括:
14、s31.將所述貓咪的檢測(cè)數(shù)據(jù)輸入極端梯度提升樹(shù)xgboost模型,模型通過(guò)迭代訓(xùn)練多個(gè)決策樹(shù),每個(gè)所述決策樹(shù)的輸出與之前所述決策樹(shù)的輸出相加,并綜合各個(gè)所述決策樹(shù)的輸出,最終得到對(duì)所述樣本貓咪健康狀況的分類(lèi)結(jié)果;
15、s32.所述xgboost模型在所述健康狀況分類(lèi)問(wèn)題中的softmax損失函數(shù),能將模型的原始輸出轉(zhuǎn)化為概率分布,利用在迭代中為每個(gè)所述健康狀況類(lèi)別訓(xùn)練的專(zhuān)屬?zèng)Q策樹(shù),輸出所述測(cè)試貓咪樣本為每個(gè)類(lèi)別的概率,所述概率最高的類(lèi)別即為最終的貓咪健康狀況;
16、s33.利用所述xgboost算法對(duì)所述歷史檢測(cè)數(shù)據(jù)的所述各項(xiàng)數(shù)據(jù)進(jìn)行重要性指標(biāo)篩選,選取出用作所述警告模型輸入的特征指標(biāo)。
17、優(yōu)選地,步驟s4所述的根據(jù)所述歷史檢測(cè)數(shù)據(jù)和新檢測(cè)數(shù)據(jù)進(jìn)行基于xgboost算法的寵物健康判別模型自更新和持續(xù)優(yōu)化,包括:
18、s41.在模型訓(xùn)練過(guò)程中,使用所述驗(yàn)證集監(jiān)控所述xgboost模型的性能,如準(zhǔn)確率、召回率等指標(biāo),當(dāng)模型性能達(dá)到預(yù)設(shè)的閾值或不再顯著提升時(shí),觸發(fā)模型更新機(jī)制;
19、s42.不斷收集新的寵物健康數(shù)據(jù),包括新病例、新體檢結(jié)果等,在對(duì)新數(shù)據(jù)進(jìn)行預(yù)處理以確保與訓(xùn)練集數(shù)據(jù)格式一致后,將新數(shù)據(jù)添加到所述歷史檢測(cè)訓(xùn)練集中,對(duì)于大規(guī)模數(shù)據(jù)集,所述xgboost模型采用多核cpu和分布式計(jì)算資源,并通過(guò)并行處理和分布式計(jì)算,提高模型的訓(xùn)練速度和效率,利用此數(shù)據(jù)集重新訓(xùn)練所述xgboost模型,實(shí)現(xiàn)模型的增量更新;
20、s43.在所述增量學(xué)習(xí)過(guò)程中,調(diào)節(jié)所述xgboost模型所述超參數(shù),使用交叉驗(yàn)證等技術(shù)調(diào)節(jié)學(xué)習(xí)率、所述決策樹(shù)的深度和節(jié)點(diǎn)數(shù)量、子采樣率、列采樣率等超參數(shù)優(yōu)化模型性能,并在所述目標(biāo)函數(shù)中引入正則化項(xiàng),控制所述xgboos本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種基于梯度提升xgboost模型的寵物健康判別方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于梯度提升xgboost模型的寵物健康判別方法,其特征在于,步驟S1所述獲取智能寵物貓砂盆的歷史檢測(cè)數(shù)據(jù)記錄,包括:
3.根據(jù)權(quán)利要求1所述的一種基于梯度提升xgboost模型的寵物健康判別方法,其特征在于,步驟S2所述的采用十折交叉驗(yàn)證的數(shù)據(jù)集劃分方法劃分?jǐn)?shù)據(jù)集和優(yōu)化xgboost模型,包括:
4.根據(jù)權(quán)利要求1所述的一種基于梯度提升xgboost模型的寵物健康判別方法,其特征在于,步驟S3所述的根據(jù)歷史檢測(cè)數(shù)據(jù)進(jìn)行基于算法的寵物健康判別模型訓(xùn)練,包括:
5.根據(jù)權(quán)利要求1所述的一種基于梯度提升xgboost模型的寵物健康判別方法,其特征在于,步驟S4所述的根據(jù)所述歷史檢測(cè)數(shù)據(jù)和新檢測(cè)數(shù)據(jù)進(jìn)行基于xgboost算法的寵物健康判別模型自更新和持續(xù)優(yōu)化,包括:
6.根據(jù)權(quán)利要求1所述的一種基于梯度提升xgboost模型的寵物健康判別方法,其特征在于,步驟S5所述的智能寵物貓砂盆得出警告閾值并對(duì)寵物主人進(jìn)行寵物
7.一種基于梯度提升xgboost模型的寵物健康判別裝置,其特征在于,包括存儲(chǔ)器和一個(gè)或多個(gè)處理器,所述存儲(chǔ)器中存儲(chǔ)有可執(zhí)行代碼,所述一個(gè)或多個(gè)處理器執(zhí)行所述可執(zhí)行代碼時(shí),用于實(shí)現(xiàn)權(quán)利要求1-6中任一項(xiàng)所述的一種基于梯度提升xgboost模型的寵物健康判別方法。
8.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,其上存儲(chǔ)有程序,該程序被處理器執(zhí)行時(shí),實(shí)現(xiàn)權(quán)利要求1-6中任一項(xiàng)所述的一種基于梯度提升xgboost模型的寵物健康判別方法。
...【技術(shù)特征摘要】
1.一種基于梯度提升xgboost模型的寵物健康判別方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于梯度提升xgboost模型的寵物健康判別方法,其特征在于,步驟s1所述獲取智能寵物貓砂盆的歷史檢測(cè)數(shù)據(jù)記錄,包括:
3.根據(jù)權(quán)利要求1所述的一種基于梯度提升xgboost模型的寵物健康判別方法,其特征在于,步驟s2所述的采用十折交叉驗(yàn)證的數(shù)據(jù)集劃分方法劃分?jǐn)?shù)據(jù)集和優(yōu)化xgboost模型,包括:
4.根據(jù)權(quán)利要求1所述的一種基于梯度提升xgboost模型的寵物健康判別方法,其特征在于,步驟s3所述的根據(jù)歷史檢測(cè)數(shù)據(jù)進(jìn)行基于算法的寵物健康判別模型訓(xùn)練,包括:
5.根據(jù)權(quán)利要求1所述的一種基于梯度提升xgboost模型的寵物健康判別方法,其特征在于,步驟s4所述的根據(jù)...
【專(zhuān)利技術(shù)屬性】
技術(shù)研發(fā)人員:徐文賢,黃心茹,李慧敏,陳鈺瑛,林夢(mèng)嫚,華俞嫣,艾佳,
申請(qǐng)(專(zhuān)利權(quán))人:中國(guó)計(jì)量大學(xué),
類(lèi)型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。