System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及語音識別,具體涉及一種基于視頻話機語音識別的校園霸凌行為檢測方法及系統。
技術介紹
1、在校園安全領域,校園霸凌問題一直是學校、家長和社會關注的焦點。校園霸凌行為,對受害者的身心健康造成了嚴重的傷害,同時也破壞了校園的和諧氛圍。通過及時發現和處理校園霸凌行為,學校能夠更好地保護學生的身心健康,促進學生的全面發展,為學生提供一個更加安全、和諧的學習環境。
2、近年來,隨著視頻監控技術的快速發展,越來越多的學校開始采用視頻監控來輔助校園安全管理。然而,單純的視頻監控也面臨著一些問題,視頻監控雖然可以捕捉畫面,但其只能捕捉到肢體上的異常行為,對于聲音信息的利用不足,而聲音往往能提供重要的線索,如爭吵、哭泣等異常聲音都可能與校園霸凌行為相關。所以如果只依據監控畫面進行校園霸凌行為的判斷,則可能導致言語霸凌等行為被忽視,從而導致校園霸凌行為檢測的準確度以及可信度降低。
技術實現思路
1、為了解決只依據監控畫面進行校園霸凌行為的判斷,會導致對于聲音信息的利用不足,從而影響校園霸凌行為檢測的準確度以及可信度的技術問題,本專利技術的目的在于提供一種基于視頻話機語音識別的校園霸凌行為檢測方法及系統,所采用的技術方案具體如下:
2、獲取視頻話機監控區域內同時段下的聲音信號以及連續的多張圖像幀;
3、識別圖像幀中人物的特征點并跟蹤所述特征點在連續的多張圖像幀中的位置變化,量化人物的移動特征值;將所述移動特征值與所有圖像幀中人物之間的位置分布相結合,從而得
4、根據聲音信號中的數據波動情況對聲音信號進行劃分,得到多個聲音數據段;基于每個聲音數據段所表現的聲學特征與標準情況之間的偏差程度,確定每個聲音數據段的異常因子;
5、綜合所有聲音數據段的異常因子以及監控區域內人物之間的聚集特征值,得到異常特征值;根據所述異常特征值,進行校園霸凌行為的檢測,得到檢測結果。
6、進一步地,所述移動特征值的獲取方法包括:
7、在每相鄰兩張圖像幀中,識別圖像幀中人物的特征點并對特征點進行匹配,從而得到匹配特征點對;
8、在每相鄰兩張圖像幀中,將每對匹配特征點對中兩個特征點位置之間的歐式距離,作為位移因子,將每相鄰兩張圖像幀中所有匹配特征點對之間的位移因子的均值作為位移參數;
9、將連續的多張圖像幀對應的所有位移參數的均值作為所述移動特征值。
10、進一步地,所述匹配特征點對的獲取方法包括:
11、將每張圖像幀作為預先訓練好的神經網絡的輸入,從而得到每張圖像幀中的人物區域;
12、在每張圖像幀中,利用sift算法獲取人物區域中的特征點以及特征點對應的特征值;
13、將每張圖像幀中的每個特征點與相鄰的下一張圖像幀中的每個特征點進行組合,得到所有的特征點對,計算每個特征點對中兩個特征點的特征值之間的歐式距離,作為差異指標;
14、對于每張圖像中每個特征點,在與相鄰的下一張圖像幀中的所有特征點對中,將最小差異指標對應的特征點對作為相鄰兩張圖像幀之間的一個匹配特征點對。
15、進一步地,所述聚集特征值的獲取方法包括:
16、在每張圖像幀中,將所有的人物區域進行兩兩組合,得到所有的區域組合;
17、在每個區域組合中,計算兩個人物區域的質心之間的歐式距離,作為距離因子,將所有區域組合對應的距離因子的均值與所有區域組合中的距離因子的最小值的乘積,作為距離參數;
18、將每張圖像幀中人物區域的數量與所述距離參數的比值,作為每張圖像幀中人物之間的聚集因子;
19、綜合所述移動特征值與所有圖像幀的聚集因子,確定所述聚集特征值,且所述移動特征值與聚集特征值呈負相關,所述聚集因子與聚集特征值呈正相關。
20、進一步地,所述聲音數據段的獲取方法包括:
21、將聲音信號中每相鄰兩個極值點之間的聲音信號作為一個初始數據段;
22、在每個初始數據段中,將最大值與最小值之間的數值差值作為每個初始數據段的波動幅度;
23、在聲音信號的所有初始數據段中,基于相鄰的初始數據段之間的波動幅度的相似情況對初始數據段進行合并,從而得到聲音信號中的所有聲音數據段。
24、進一步地,所述合并過程包括:
25、將相鄰兩個初始數據段的波動幅度之間的差值絕對值進行負相關映射并歸一化后的值,作為合并指數;
26、在聲音信號中,將時序上第一個初始數據段作為待測數據段開始遍歷,判斷待測數據段與相鄰的下一個初始數據段之間的合并指數是否滿足預設條件,若不滿足,則將待測數據段作為一個聲音數據段,且將與待測數據段相鄰的下一個初始數據段作為新的待測數據段繼續進行遍歷;
27、若滿足,則將與待測數據段相鄰的下一個初始數據段并入待測數據段中,得到新的待測數據段,判斷新的待測數據段中最后一個初始數據段與相鄰的下一個初始數據段之間的合并指數是否滿足預設條件,若不滿足,則將與待測數據段相鄰的下一個初始數據段作為新的待測數據段繼續進行遍歷;
28、其中,預設條件為合并指數大于預設合并閾值。
29、進一步地,所述異常因子的獲取方法包括:
30、在每個聲音數據段中,將所有極大值的均值與預設標準值之間的差值進行歸一化后的值,作為聲音幅值偏差因子;
31、將每個聲音數據段中初始數據段的數量與聲音數據段時間長度的比值,作為每個聲音數據段中的波動頻率,并將所述波動頻率與預設標準頻率之間的差值進行歸一化后的值,作為波動頻率偏差因子;
32、將每個聲音數據段的所述聲音幅值偏差因子與波動頻率偏差因子的乘積,作為每個聲音數據段的異常因子。
33、進一步地,所述異常特征值的獲取方法包括:
34、將所有聲音數據段的異常因子的均值與監控區域內人物之間的聚集特征值的乘積進行歸一化后的值,作為所述異常特征值。
35、進一步地,所述檢測結果的獲取方法包括:
36、當異常特征值大于或等于預設異常閾值時,判斷出現霸凌現象,進行預警;當異常特征值小于預設異常閾值時,判斷未出現霸凌現象。
37、一種基于視頻話機語音識別的校園霸凌行為檢測系統,包括處理器和存儲器,存儲器中存儲有至少一條指令、至少一段程序、代碼集或指令集,至少一條指令、至少一段程序、代碼集或指令集由處理器加載并執行時實現所述一種基于視頻話機語音識別的校園霸凌行為檢測方法的步驟。
38、本專利技術具有如下有益效果:
39、針對現有技術在對校園霸凌行為進行檢測時,缺乏對聲音信息的利用的問題,本專利技術獲取了視頻話機監控區域內同時段下的聲音信號以及連續的多張圖像幀,從而可以實現視覺信息與聽覺信息的有效融合,更加全面的捕捉和分析校園內的異常情況。鑒于在發生校園霸凌行為時,往往會存在肢體接觸或者人員聚集,因此通過識別圖像幀中人物的特征點并追蹤本文檔來自技高網...
【技術保護點】
1.一種基于視頻話機語音識別的校園霸凌行為檢測方法,其特征在于,所述方法包括:
2.根據權利要求1所述的一種基于視頻話機語音識別的校園霸凌行為檢測方法,其特征在于,所述移動特征值的獲取方法包括:
3.根據權利要求2所述的一種基于視頻話機語音識別的校園霸凌行為檢測方法,其特征在于,所述匹配特征點對的獲取方法包括:
4.根據權利要求3所述的一種基于視頻話機語音識別的校園霸凌行為檢測方法,其特征在于,所述聚集特征值的獲取方法包括:
5.根據權利要求1所述的一種基于視頻話機語音識別的校園霸凌行為檢測方法,其特征在于,所述聲音數據段的獲取方法包括:
6.根據權利要求5所述的一種基于視頻話機語音識別的校園霸凌行為檢測方法,其特征在于,所述合并過程包括:
7.根據權利要求5所述的一種基于視頻話機語音識別的校園霸凌行為檢測方法,其特征在于,所述異常因子的獲取方法包括:
8.根據權利要求1所述的一種基于視頻話機語音識別的校園霸凌行為檢測方法,其特征在于,所述異常特征值的獲取方法包括:
9.根據權利要求1
10.一種基于視頻話機語音識別的校園霸凌行為檢測系統,其特征在于,包括處理器和存儲器,存儲器中存儲有至少一條指令、至少一段程序、代碼集或指令集,至少一條指令、至少一段程序、代碼集或指令集由處理器加載并執行時實現如權利要求1-9任意一項所述一種基于視頻話機語音識別的校園霸凌行為檢測方法的步驟。
...【技術特征摘要】
1.一種基于視頻話機語音識別的校園霸凌行為檢測方法,其特征在于,所述方法包括:
2.根據權利要求1所述的一種基于視頻話機語音識別的校園霸凌行為檢測方法,其特征在于,所述移動特征值的獲取方法包括:
3.根據權利要求2所述的一種基于視頻話機語音識別的校園霸凌行為檢測方法,其特征在于,所述匹配特征點對的獲取方法包括:
4.根據權利要求3所述的一種基于視頻話機語音識別的校園霸凌行為檢測方法,其特征在于,所述聚集特征值的獲取方法包括:
5.根據權利要求1所述的一種基于視頻話機語音識別的校園霸凌行為檢測方法,其特征在于,所述聲音數據段的獲取方法包括:
6.根據權利要求5所述的一種基于視頻話機語音識別的校園霸凌行為檢測方法,其特征在于,所述合并...
【專利技術屬性】
技術研發人員:馬曉潔,
申請(專利權)人:廣東奧訊達信息科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。