System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)屬于阿爾茨海默病檢測,具體涉及一種跨語種環(huán)境下基于量表的阿爾茨海默病檢測方法。
技術(shù)介紹
1、阿爾茨海默病(alzheimer's?disease,ad)是當(dāng)前全球最常見的神經(jīng)退行性疾病類型之一,尤其在老年群體中高發(fā)。ad的主要特征表現(xiàn)為患者的認(rèn)知功能和日常活動能力的衰退,涉及語言、記憶、注意力以及執(zhí)行功能等多個領(lǐng)域。發(fā)現(xiàn)并識別這些認(rèn)知缺陷具有重要意義,因為及時的干預(yù)與治療可以有效延緩認(rèn)知障礙的惡化進(jìn)程,并有助于保留患者的認(rèn)知功能水平,從而改善生活質(zhì)量。
2、迄今為止,用于研究的公開可用的高質(zhì)量數(shù)據(jù)集較少,尤其是在非英語語種領(lǐng)域。為了應(yīng)對這一挑戰(zhàn),研究人員已經(jīng)探索并應(yīng)用了一系列創(chuàng)新技術(shù)手段,諸如遷移學(xué)習(xí)、自監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)以及數(shù)據(jù)增強(qiáng)方法。根據(jù)臨床醫(yī)學(xué)研究,阿爾茲海默癥在語言上的表現(xiàn)包括語無倫次、實詞減少、虛詞增多等。在過去的ad檢測研究中,大量研究者試圖使用語言預(yù)訓(xùn)練模型捕捉患者語言中的ad特征,但由于絕大多數(shù)語言預(yù)訓(xùn)練模型未在言語異常相關(guān)任務(wù)上進(jìn)行過訓(xùn)練,預(yù)訓(xùn)練模型作為數(shù)據(jù)驅(qū)動的方法,其對ad特征的捕捉能力強(qiáng)烈依賴于ad訓(xùn)練數(shù)據(jù)。而現(xiàn)有的ad數(shù)據(jù)非常稀缺,在小語種上尤為匱乏,導(dǎo)致小語種上的ad檢測發(fā)展非常艱難。近年來,一些研究者開始探索跨語言ad檢測,即在ad數(shù)據(jù)相對較多的英語上訓(xùn)練模型,希望模型在目標(biāo)小語種上有較好表現(xiàn)。在adresso數(shù)據(jù)集上,winterlight?labs等人提出的基于傳統(tǒng)聲學(xué)特征和基于預(yù)訓(xùn)練的嵌入分類方法,準(zhǔn)確率達(dá)到67.61%。raghavendrapappagar等人運(yùn)
技術(shù)實現(xiàn)思路
1、本專利技術(shù)的目的在于提供一種跨語種環(huán)境下基于量表的阿爾茨海默病檢測方法,該方法該方法結(jié)合醫(yī)學(xué)量表規(guī)則以及z分?jǐn)?shù)標(biāo)準(zhǔn),能夠有效對ad進(jìn)行檢測。
2、為實現(xiàn)上述目的,本專利技術(shù)采用的技術(shù)方案是:
3、一種跨語種環(huán)境下基于量表的阿爾茨海默病檢測方法,其特征在于,具體步驟為:
4、s1、搭建一個四層全連接神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)來進(jìn)行數(shù)據(jù)建模和預(yù)測;
5、s2、先采用了interspeech?2020adress挑戰(zhàn)的文本數(shù)據(jù)集(adress20),該數(shù)據(jù)集包括波士頓診斷失語癥檢查的cookie?theft圖片描述的語音錄音和轉(zhuǎn)錄文本;轉(zhuǎn)錄文本使用了chat編碼系統(tǒng)進(jìn)行注釋;接著又采用了adresso挑戰(zhàn)賽中專為通過語音特征檢測阿爾茨海默病而設(shè)計的數(shù)據(jù)集(adresso);最后還采用了icassp?2023信號處理挑戰(zhàn)大賽中的adress-m希臘語數(shù)據(jù)集來驗證跨語言的準(zhǔn)確性;
6、s3、具體方法為:
7、s3-1、數(shù)據(jù)預(yù)處理
8、對文本進(jìn)行處理,其目標(biāo)是自動對連續(xù)的對話文本進(jìn)行有效分割與分類,將文本內(nèi)容拆分為問題句列表、合并的回答句字符串以及單獨(dú)的回答句列表;
9、首先通過正則表達(dá)式對輸入的對話文本進(jìn)行句子級別劃分,確保每個獨(dú)立的句子都被正確識別而不受特定情境(如縮略詞)的影響;隨后,針對每一句分割出的文本,運(yùn)用一系列基于語法規(guī)則和關(guān)鍵詞匹配的策略來區(qū)分問題句與回答句;
10、s3-2、特征提取
11、受到量表規(guī)則的啟發(fā),在對adress20數(shù)據(jù)集中的““cookie?theft”圖片描述任務(wù)進(jìn)行深度分析的過程中,進(jìn)行詞匯特性分析;基于這些詞匯分析,將其轉(zhuǎn)化為七個具有統(tǒng)計學(xué)意義的z-分?jǐn)?shù)指標(biāo),這七個z-分?jǐn)?shù)是衡量患者在此項任務(wù)中表現(xiàn)的關(guān)鍵特征參數(shù);
12、s3-2-1、詞匯特性分析
13、首先對原始文本進(jìn)行分詞,生成詞匯清單并計算總詞匯量;隨后,建立排除詞匯庫,篩選掉扭曲文本原意或降低表達(dá)效率的詞語;
14、在分析內(nèi)容相關(guān)性時,通過原始有關(guān)詞匯表探尋與預(yù)設(shè)主題密切相關(guān)的詞匯集群,并結(jié)合正則表達(dá)式進(jìn)一步驗證與統(tǒng)計解析,揭示了文本與描述內(nèi)容的相關(guān)程度;
15、在結(jié)構(gòu)化詞匯分析環(huán)節(jié),預(yù)設(shè)包含連詞、介詞等關(guān)鍵句法結(jié)構(gòu)單元的集合,并運(yùn)用正則匹配規(guī)則梳理文本詞匯,統(tǒng)計結(jié)構(gòu)性詞匯的使用頻率;
16、在評估文本在描述細(xì)節(jié)和內(nèi)容豐滿度的表現(xiàn),采納詞性標(biāo)注技術(shù),特別重視形容詞和副詞的運(yùn)用;通過統(tǒng)計修飾性詞匯的數(shù)量來量化判斷參與者在描繪細(xì)部時的細(xì)膩程度與詳盡性;
17、最后,在完成了上述各層次的篩選和分類后,將未能納入前述類別范疇的其他詞匯識別為非關(guān)鍵內(nèi)容詞匯;
18、s3-2-2、z-分?jǐn)?shù)計算
19、z分?jǐn)?shù)(也稱為標(biāo)準(zhǔn)分?jǐn)?shù))的通用計算公式如下:
20、
21、在這個公式中:
22、x表示某個具體的觀測值或數(shù)據(jù)點;
23、是整個群體或樣本數(shù)據(jù)的平均數(shù);
24、s是群體或樣本數(shù)據(jù)的標(biāo)準(zhǔn)差,它衡量的是數(shù)據(jù)點圍繞平均數(shù)的分散程度;
25、對于每個不同的語言特征指標(biāo)x,將其視為一個觀測值,并將這個觀測值減去相應(yīng)特征的平均值然后再除以該特征的標(biāo)準(zhǔn)差s,從而得到相應(yīng)的z-分?jǐn)?shù)z;將這些z-分?jǐn)?shù)作為從量表中提取的特征;
26、s3-3、特征分析
27、首先利用shap對七個特征進(jìn)行分析,基于shapley值理論,通過將模型預(yù)測結(jié)果分解為每個特征的貢獻(xiàn);
28、s4、實驗設(shè)計
29、運(yùn)用傳統(tǒng)機(jī)器學(xué)習(xí)模型包括但不限于k近鄰算法(k-nn)以及較新的神經(jīng)網(wǎng)絡(luò)kan來對任務(wù)進(jìn)行預(yù)測;在kan中輸入為7維,輸出為2維,中間有1個包含了16個隱藏單元的隱藏層;網(wǎng)絡(luò)間隔的數(shù)量以及分段多項式的階數(shù)都是3;使用lbfgs作為優(yōu)化器來最小化損失函數(shù);訓(xùn)練過程將執(zhí)行20步,每一步都會對模型的參數(shù)進(jìn)行更新以最小化損失函數(shù);搭建的4-layer?fcnn模型包括四個相互連接的全連接層,每一層后接relu非線性激活函數(shù);網(wǎng)絡(luò)的輸入層接納7個特征變量,經(jīng)過逐層非線性轉(zhuǎn)換后,最終輸出層產(chǎn)生2維預(yù)測結(jié)果;采用學(xué)習(xí)率為0.001的隨機(jī)梯度下降優(yōu)化器,在隨機(jī)梯度下降優(yōu)化器中引入動量項。
30、與現(xiàn)有技術(shù)相比,本專利技術(shù)具有如下有益效果:
<本文檔來自技高網(wǎng)...【技術(shù)保護(hù)點】
1.一種跨語種環(huán)境下基于量表的阿爾茨海默病檢測方法,其特征在于,具體步驟為:
【技術(shù)特征摘要】
1.一種跨語種環(huán)境下基于量表的阿爾茨海...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:朱士虎,王袁誠,
申請(專利權(quán))人:江蘇師范大學(xué),
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。