System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及抑郁癥識別,具體涉及基于深度學習的抑郁癥語音識別方法及系統。
技術介紹
1、抑郁癥是一種常見的精神障礙,表現為持續的悲傷情緒、興趣或愉悅感喪失等癥狀。抑郁癥的診斷通常依賴于臨床醫生的主觀評估,可能導致抑郁癥診斷不準確。深度學習是一種能夠從大量數據中自動學習特征表示的機器學習技術,在抑郁癥識別領域,深度學習用于分析患者的語音、文本、生理信號等多種類型的數據,從而實現對抑郁癥的診斷。
2、現有技術從患者的語音中提取特征,如音調、節奏與音量等,通過神經網絡分析抑郁癥人群與健康人群的差異,從而實現基于患者的語音特征診斷抑郁癥。但是由于老年人與慢性疾病患者等人群會因自身原因產生和抑郁癥患者類似的生理或心理狀態,導致非抑郁癥人群與抑郁癥人群的語音特征相似,從而使抑郁癥診斷的準確率較低。
技術實現思路
1、為了解決非抑郁癥人群與抑郁癥人群的語音特征相似,使抑郁癥診斷的準確率較低的技術問題,本專利技術的目的在于提供一種基于深度學習的抑郁癥語音識別方法及系統,所采用的技術方案具體如下:
2、第一方面,本專利技術一個實施例提供了一種基于深度學習的抑郁癥語音識別方法,該方法包括:
3、獲取訓練個體與待測個體的語音數據,以及每個語音數據的分詞集合與每種語音屬性的特征序列;
4、根據訓練個體的任意兩個語音數據的同種語音屬性的特征序列中元素差異與元素波動程度的差異,對訓練個體的所有語音數據進行聚類,得到訓練個體的語音簇;基于所述語音簇內語音數據個數
5、將每個語音簇內語音數據的分詞集合內分詞構成的集合記為詞簇集合;根據訓練個體的所有語音簇的詞簇集合內同一分詞在其所屬語音簇內的出現次數,以及存在訓練個體的語音簇的詞簇集合內每個分詞的語音簇個數,構建訓練個體的特征分詞集合;
6、結合訓練個體的所有語音屬性的特征語音值和所述特征分詞集合對神經網絡進行訓練,利用訓練好的神經網絡對待測個體進行抑郁癥檢測。
7、進一步地,所述訓練個體的語音簇的獲取方法,包括:
8、對于每個語音數據的每種語音屬性的特征序列,計算特征序列中除第一個元素外的其余元素與其相鄰前一個元素的差值的均值,作為波動集中值;將特征序列中所有元素的均值作為特征集中值;
9、根據訓練個體的任意兩個語音數據的同種語音屬性的所述波動集中值的差異與所述特征集中值的差異,獲取訓練個體的任意兩個語音數據的特征距離;
10、基于所述特征距離對訓練個體的所有語音數據進行聚類,將得到的聚類簇記為語音簇。
11、進一步地,所述獲取訓練個體的任意兩個語音數據的特征距離,包括:
12、將訓練個體的每個語音數據的每種語音屬性的所述波動集中值與所述特征集中值的乘積,作為訓練個體的每個語音數據的每種語音屬性的波動特征值;
13、計算訓練個體的任意兩個語音數據的同種語音屬性的所述波動特征值的差值絕對值的均值,作為訓練個體的任意兩個語音數據的特征距離。
14、進一步地,所述獲取訓練個體的每種語音屬性的特征語音值,包括:
15、將每個語音簇內語音數據的每種語音屬性的特征序列中所有元素的眾數,作為對應語音簇的每種語音屬性的局部特征值;
16、將訓練個體的所有語音簇按照語音簇內語音數據總個數從小到大順序排列,得到簇序列;獲取簇序列中每個語音簇的下標值記為每個語音簇的特征權重;
17、利用所述特征權重對每個語音簇的每種語音屬性的所述局部特征值進行加權,得到每個語音簇的每種語音屬性的加權特征值;計算訓練個體的所有語音簇的每種語音屬性的所述加權特征值的均值作為訓練個體的每種語音屬性的特征語音值。
18、進一步地,所述構建訓練個體的特征分詞集合,包括:
19、根據訓練個體的每個語音簇的詞簇集合內每個分詞在對應語音簇內的出現次數,以及每個語音簇內存在所述詞簇集合內每個分詞的語音數據個數,獲取訓練個體的每個語音簇的詞簇集合內每個分詞的常用度;
20、根據訓練個體的所有語音簇的詞簇集合內同一分詞的所述常用度,以及存在語音簇的詞簇集合內每個分詞的語音簇個數,獲取訓練個體的所有語音簇的詞簇集合內每個分詞的語義特征值;
21、對于訓練個體的所有語音數據的分詞集合內分詞的所述語義特征值,將最大的預設數量個所述語義特征值對應分詞構成的集合作為訓練個體的特征分詞集合。
22、進一步地,所述獲取訓練個體的每個語音簇的詞簇集合內每個分詞的常用度,包括:
23、對于訓練個體的每個語音簇,從語音簇的詞簇集合內任選一個分詞記為示例分詞;
24、從語音簇內語音數據中選取分詞集合內存在示例分詞的語音數據,記為示例存在數據,將語音簇內所有語音數據中示例存在數據的占比,作為示例分詞的第一值;
25、將示例分詞在語音簇內所有語音數據的分詞集合內出現的頻率,記為示例分詞的第二值;
26、根據所述第一值與所述第二值,獲取示例分詞的常用度;所述第一值與所述第二值均和所述常用度為正相關關系。
27、進一步地,所述獲取訓練個體的所有語音簇的詞簇集合內每個分詞的語義特征值,包括:
28、從訓練個體的語音簇的詞簇集合內任選一個分詞記為目標分詞;從訓練個體的所有語音簇中選取目標存在簇,所述目標存在簇內語音數據的分詞集合內存在目標分詞;
29、計算訓練個體的所有目標存在簇的詞簇集合內目標分詞的所述常用度的均值,作為目標分詞的常用整體值;將訓練個體的所有語音簇中目標存在簇的占比,作為目標分詞的出現值;
30、根據所述常用整體值與所述出現值,獲取目標分詞的語義特征值。
31、進一步地,所述對訓練個體的所有語音數據進行聚類的方法為凝聚層次聚類算法。
32、進一步地,所述訓練個體包括抑郁癥患者與正常個體。
33、第二方面,本專利技術另一個實施例提供了一種基于深度學習的抑郁癥語音識別系統,該系統包括:
34、數據采集模塊,用于獲取訓練個體與待測個體的語音數據,以及每個語音數據的分詞集合與每種語音屬性的特征序列;
35、語音特征提取模塊,用于根據訓練個體的任意兩個語音數據的同種語音屬性的特征序列中元素差異與元素波動程度的差異,對訓練個體的所有語音數據進行聚類,得到訓練個體的語音簇;基于所述語音簇內語音數據個數調整語音數據的每種語音屬性的特征序列中元素,獲取訓練個體的每種語音屬性的特征語音值;
36、特征分詞篩選模塊,用于將每個語音簇內語音數據的分詞集合內分詞構成的集合記為詞簇集合;根據訓練個體的所有語音簇的詞簇集合內同一分詞在其所屬語音簇內的出現次數,以及存在訓練個體的語音簇的詞簇集合內每個分詞的語音簇個數,構建訓練個體的特征分詞集合;
37、抑郁癥檢測模塊,用于結合訓練個體的所述本文檔來自技高網...
【技術保護點】
1.一種基于深度學習的抑郁癥語音識別方法,其特征在于,該方法包括:
2.根據權利要求1所述的一種基于深度學習的抑郁癥語音識別方法,其特征在于,所述訓練個體的語音簇的獲取方法,包括:
3.根據權利要求2所述的一種基于深度學習的抑郁癥語音識別方法,其特征在于,所述獲取訓練個體的任意兩個語音數據的特征距離,包括:
4.根據權利要求1所述的一種基于深度學習的抑郁癥語音識別方法,其特征在于,所述獲取訓練個體的每種語音屬性的特征語音值,包括:
5.根據權利要求1所述的一種基于深度學習的抑郁癥語音識別方法,其特征在于,所述構建訓練個體的特征分詞集合,包括:
6.根據權利要求5所述的一種基于深度學習的抑郁癥語音識別方法,其特征在于,所述獲取訓練個體的每個語音簇的詞簇集合內每個分詞的常用度,包括:
7.根據權利要求5所述的一種基于深度學習的抑郁癥語音識別方法,其特征在于,所述獲取訓練個體的所有語音簇的詞簇集合內每個分詞的語義特征值,包括:
8.根據權利要求2所述的一種基于深度學習的抑郁癥語音識別方法,其特征在于,所
9.根據權利要求1所述的一種基于深度學習的抑郁癥語音識別方法,其特征在于,所述訓練個體包括抑郁癥患者與正常個體。
10.一種基于深度學習的抑郁癥語音識別系統,其特征在于,該系統包括:
...【技術特征摘要】
1.一種基于深度學習的抑郁癥語音識別方法,其特征在于,該方法包括:
2.根據權利要求1所述的一種基于深度學習的抑郁癥語音識別方法,其特征在于,所述訓練個體的語音簇的獲取方法,包括:
3.根據權利要求2所述的一種基于深度學習的抑郁癥語音識別方法,其特征在于,所述獲取訓練個體的任意兩個語音數據的特征距離,包括:
4.根據權利要求1所述的一種基于深度學習的抑郁癥語音識別方法,其特征在于,所述獲取訓練個體的每種語音屬性的特征語音值,包括:
5.根據權利要求1所述的一種基于深度學習的抑郁癥語音識別方法,其特征在于,所述構建訓練個體的特征分詞集合,包括:
6.根據權利要求5所述...
【專利技術屬性】
技術研發人員:沈宇星,彭小兵,
申請(專利權)人:成都好麥科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。