一種基于融合多文本特征的中文文本情感分析方法技術

技術編號：29928113 閱讀：31 留言：0更新日期：2021-09-04 18:51

本發明專利技術提供了一種基于融合多文本特征的中文文本情感分析方法，包括：步驟Step1:獲取中文文本信息，并對所述中文文本信息進行預處理，得到所述中文文本信息對應的多個序列；步驟Step2:將所述多個序列輸入BiGRU網絡提取各序列的文本特征，生成所述多個序列對應的多個文本特征信息；步驟Step3:將所述多個文本特征信息進行融合，并輸入到BiLSTM網絡中進行學習；步驟Step4:再利用自注意力機制篩選特征；步驟Step5:將經過自注意力機制篩選后的特征向量，輸入sigmoid分類器進行分類，得到最終的情感分析結果，本發明專利技術解決了傳統基于雙向長短期記憶神經網絡(BiLSTM)的文本情感分析方法對文本自身包含的特征信息學習不夠的問題，且能有效地提高中文文本情感分析的準確率。能有效地提高中文文本情感分析的準確率。能有效地提高中文文本情感分析的準確率。

全部詳細技術資料下載

【技術實現步驟摘要】
一種基于融合多文本特征的中文文本情感分析方法

[0001]本專利技術涉及自然語言處理
，尤其涉及到一種基于融合多文本特征的中文文本情感分析方法。

技術介紹

[0002]文本情感分析(Sentiment Analysis)是指利用自然語言處理和文本挖掘技術，對帶有情感色彩的主觀性文本進行分析、處理和抽取的過程。其涉及領域包括自然語言處理、文本挖掘、信息檢索、信息抽取和機器學習等。傳統雙向長短期記憶神經網絡(BidirectiLnalLLng ShLrt
?
Term MemLry,BiLSTM)在文本情感分析上已經取得較好的效果，但對文本自身包含的特征信息學習不夠。針對此問題，本文提出融合多文本特征的中文文本情感分析方法。
[0003]綜上所述，提供一種可解決傳統雙向長短期記憶神經網絡(BiLSTM)對文本自身包含的特征信息學習不夠的問題，且能有效地提高中文文本情感分析的準確率的基于融合多文本特征的中文文本情感分析方法，是本領域技術人員急需解決的問題。

技術實現思路

[0004]本方案針對上文提到的問題和需求，提出一種基于融合多文本特征的中文文本情感分析方法，其由于采取了如下技術方案而能夠解決上述技術問題。
[0005]為實現上述目的，本專利技術提供如下技術方案：一種基于融合多文本特征的中文文本情感分析方法，包括以下步驟：步驟Step1:獲取中文文本信息，并對所述中文文本信息進行預處理，得到所述中文文本信息對應的多個序列；
[0006]步驟Step2:將所述...

【技術保護點】

【技術特征摘要】
1.一種基于融合多文本特征的中文文本情感分析方法，其特征在于，包括以下步驟：步驟Step1:獲取中文文本信息，并對所述中文文本信息進行預處理，得到所述中文文本信息對應的多個序列；步驟Step2:將所述多個序列輸入BiGRU網絡提取各序列的文本特征，生成所述多個序列對應的多個文本特征信息；步驟Step3:將所述多個文本特征信息進行融合，并輸入到BiLSTM網絡中進行學習；步驟Step4:再利用自注意力機制篩選特征，對步驟Step3提取的特征信息分配相應的權重，獲取最重要的情感信息；步驟Step5:將經過自注意力機制篩選后的特征向量，輸入sigmoid分類器進行分類，得到最終的情感分析結果。2.如權利要求1所述的基于融合多文本特征的中文文本情感分析方法，其特征在于，所述多個序列包括文本詞序列、詞性序列、字序列、字詞性序列、字
?
位置序列和字
?
詞性
?
位置序列。3.如權利要求2所述的基于融合多文本特征的中文文本情感分析方法，其特征在于，所述提取各序列的文本特征包括：將所述多個序列通過word2vec模型訓練得到所述多個序列對應的多個序列矩陣，每個序列中對應的每個元素的元素向量為x
i
，x
i
∈R
n
×
d
，其中n是元素數，d是向量維度，則每個序列的整個序列矩陣Uj表示為：U
j
＝{x1,x2,
…
,x
n
},j表示序列編號；將Uj輸入訓練好的BiGRU網絡，同時處理正向和反向文本序列，對文本深層次信息進行特征提取，得到對應的特征向量信息A
t
、B
t
、C
t
、D
t
、E
t
、F
t
。4.如權利要求3所述的基于融合多文本特征的中文文本情感分析方法，其特征在于，所述BiGRU網絡由正向GRU、反向GRU和正反向GRU的輸出狀態連接層組成，若記t時刻正向GRU輸出的隱藏狀態為則反向GRU輸出的隱藏狀態為則而BiGRU網絡輸出的語義表示為h
t
，，其中，w
t
,v
t
是權值矩陣，GRU為GRU函數，U
t
為t時刻的GRU輸入，b
t
為偏置向量。5.如權利要求4所述的基于融合多文本特征的中文文本情感分析方法，其特征在于，所述將所述多個文本特征信息進行融合包括：將所述對應的特征向量信...

【專利技術屬性】
技術研發人員：王麗亞，陳哲，
申請(專利權)人：王麗亞，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術