System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于語義匹配,具體涉及一種交通事故文本分類方法、存儲介質及電子設備。
技術介紹
1、隨著城市化進程的加速和汽車保有量的快速增長,交通事故已經成為一個全球性的難題。交通事故不僅給人們的生命和財產帶來巨大損失,也對社會的穩定和安全構成嚴重威脅。因此,對交通事故進行有效的文本分類和分析,對于預防事故、提高道路安全水平具有重要意義。
2、傳統的交通事故文本分類方法主要依賴于人工分析和處理,這種方式不僅效率低下,而且容易受到主觀因素的影響,導致分類結果不準確。隨著人工智能和機器學習技術的快速發展,基于這些先進技術的交通事故文本分類方法逐漸興起。這些技術能夠自動從大量的交通事故文本數據中提取有用的信息,并通過訓練模型實現自動分類。與傳統方法相比,基于人工智能和機器學習的文本分類方法具有更高的效率和準確性,能夠更好地滿足實際應用的需求。然而,目前交通事故文本分類技術仍存在一些挑戰和問題。例如,不同地區的交通事故文本可能存在語言和文化差異,這會對分類模型的性能和準確性產生影響。此外,交通事故文本中往往包含大量的噪聲和無關信息,這也會增加分類的難度。
技術實現思路
1、針對上述問題,本專利技術的目的是提供一種交通事故文本分類方法、存儲介質及電子設備,以解決現有交通事故文本分類中分類精度較低,判別不準確的問題。
2、為實現上述目的,本專利技術采取的技術方案包括:
3、一種交通事故文本分類方法,包括以下步驟:
4、s1,采集多個交通事故文本并對其
5、s2,獲得s1中的多個交通事故文本對應的標簽,并為每個交通事故文本添加一個標準交通事故文本,得到交通事故文本數據集,交通事故文本數據集為多個交通事故文本數據的集合,每個交通事故文本數據包括一個標準交通事故文本、一個交通事故文本和其對應的標簽;
6、對每個交通事故文本數據中的交通事故文本對照高頻關鍵詞集,得到每個文本的高頻關鍵詞集,得到交通事故關鍵詞數據集,交通事故關鍵詞數據集為多個交通事故關鍵詞數據的集合,每個交通事故關鍵詞數據包括一個標準交通事故文本、一個交通事故文本、文本的高頻關鍵詞集和交通事故文本對應的標簽;
7、對每個交通事故文本數據中的標準交通事故文本和交通事故文本進行序列化,得到文本序列sx集,再將文本序列sx集對照高頻關鍵詞集并標記高頻關鍵詞的位置,得到關鍵詞標記矩陣集;同時將文本序列sx集對照高頻關鍵詞集并標記非高頻關鍵詞的位置,得到上下文標記矩陣集;
8、s3,建立預訓練模型,將s2得到的文本序列sx集、關鍵詞標記矩陣集和上下文標記矩陣集輸入預訓練模型,得到交通事故文本表示集,交通事故文本表示集包括全局表示集、全局關鍵詞表示集、局部關鍵詞表示集、全局上下文表示集和局部上下文表示集;
9、全局表示集為文本序列sx集經過模型表示后得到,全局關鍵詞表示集為文本序列sx集與關鍵詞標記矩陣集相乘后經過模型表示得到,局部關鍵詞表示集為文本序列sx集經過模型表示后與關鍵詞標記矩陣集相乘得到,全局上下文表示集為文本序列sx集與上下文標記矩陣集相乘后經過模型表示得到,局部上下文表示集為文本序列sx集經過模型表示后與上下文標記矩陣集相乘得到;
10、s4,對s3得到的全局表示集通過交叉熵損失函數計算,得到第一損失值;對s3得到的全局關鍵詞表示集、局部關鍵詞表示集、全局上下文表示集和局部上下文表示集分別進行平均池化操作后拼接,再通過交叉熵損失函數計算得到第二損失值;
11、s5,將s4得到的第一損失值和第二損失值相加得到損失函數,并使用損失函數對s3和s4中的預訓練模型進行迭代至最優,得到多個交通事故文本分類結果。
12、一種計算機可讀存儲介質,存儲有可執行指令,用于引起處理器執行可執行指令時,實現本專利技術的交通事故文本分類方法。
13、一種電子設備,包括:存儲器,用于存儲可執行指令;處理器,用于執行存儲器中存儲的可執行指令時,實現本專利技術交通事故文本分類方法。
14、與現有技術相比,本專利技術的優點為:
15、本專利技術的一種交通事故文本分類方法、存儲介質及電子設備,保證數據標簽均衡,將文本分類任務轉換為文本匹配任務,并利用統計學方法獲取數據集關鍵詞,將其作為局部特征,對局部特征和全局特征進行對比交互從而增強模型對局部特征的關注度,進而提升模型的表現性能。
本文檔來自技高網...【技術保護點】
1.一種交通事故文本分類方法,其特征在于,包括以下步驟:
2.一種計算機可讀存儲介質,其特征在于,存儲有可執行指令,用于引起處理器執行所述可執行指令時,實現權利要求1的交通事故文本分類方法。
3.一種電子設備,其特征在于,包括:
【技術特征摘要】
1.一種交通事故文本分類方法,其特征在于,包括以下步驟:
2.一種計算機可讀存儲介質,其特征在于,存儲有可執行指令...
【專利技術屬性】
技術研發人員:趙世明,楊明遠,黃河,鄒旺賢,李志暉,戴維廉,
申請(專利權)人:中鐵七局集團第三工程有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。