<rt id="ko8c6"></rt>

<button id="ko8c6"></button>

當前位置: 首頁 > 專利查詢>國泰君安證券股份有限公司專利>正文

基于Transformer實現細粒度情感分析的方法、裝置、處理器及其存儲介質制造方法及圖紙

技術編號：33133758 閱讀：24 留言：0更新日期：2022-04-17 00:55

本發明專利技術涉及一種基于Transformer實現細粒度情感分析的方法，其中，該方法包括以下步驟：(1)獲取Sem

全部詳細技術資料下載

【技術實現步驟摘要】
基于Transformer實現細粒度情感分析的方法、裝置、處理器及其存儲介質

[0001]本專利技術涉及人工智能
，尤其涉及自然語言處理
，具體是指一種基于Transformer實現細粒度情感分析的方法、裝置、處理器及其計算機可讀存儲介質。

技術介紹

[0002]在人工智能出現之前，機器智能處理結構化的數據(例如Excel里的數據)。但是現實場景中大部分的數據都是非結構化的，例如：文章、圖片、音頻、視頻
…
。在非結構數據中，文本的數量是最多的，他雖然沒有圖片和視頻占用的空間大，但是他的信息量是最大的。為了能夠分析和利用這些文本信息，我們就需要利用NLP技術，讓機器理解這些文本信息，并加以利用。
[0003]自然語言處理(Natural Language Processing，NLP)是計算機科學，信息工程和人工智能的子領域，涉及計算機與人類(自然)語言之間的交互，特別是如何對計算機進行編程以處理和分析大量自然語言數據。自然語言處理中的挑戰通常涉及自然語言理解(NLU)和自然語言生成(NLG)兩大任務。
[0004]自然語言理解就是希望機器像人一樣，具備正常人的語言理解能力。自然語言理解(NLU)或自然語言解釋(NLI)是自然語言處理在人工智能與機器涉及閱讀理解的子主題。其應用于實體抽取、關系抽取、機器翻譯、智能問答、文本分類、情感分析等諸多子領域。
[0005]自然語言生成是NLP的重要組成部分，主要目的是降低人類和機器之間的溝通鴻溝，將非語言格式的數據轉換成人類...

【技術保護點】

【技術特征摘要】
1.一種基于Transformer實現細粒度情感分析的方法，其特征在于，所述的方法包括以下步驟：(1)獲取Sem
?
Eval 2014Task 4的Laptop和Restaurant兩個領域的數據集進行模型驗證；(2)對獲取到的相應數據集進行數據解析以及轉換處理；(3)基于正文文本、主體以及主體情感類別進行情感分析模型的構建；(4)加入預設的初始參數進行情感分析模型的模型訓練；(5)獲取模型訓練得到的細粒度情感分析輸出結果。2.根據權利要求1所述的基于Transformer實現細粒度情感分析的方法，其特征在于，所述的步驟(1)包括以下步驟：(1.1)獲取Sem
?
Eval 2014Task 4數據源包含的Laptop和Restaurant兩個領域的數據集，且各個數據集均為文件格式為.xml，包含訓練數據以及測試數據的數據集；(1.2)將Laptop和Restaurant兩個領域的數據集進行情感標簽確定的準確率作為評估指標進行有效性的驗證。3.根據權利要求2所述的基于Transformer實現細粒度情感分析的方法，其特征在于，所述的情感標簽的分布情況具體包括：Laptop和Restaurant兩個領域的數據集中正面標簽在訓練集和測試集中的分布情況；Laptop和Restaurant兩個領域的數據集中中性標簽在訓練集和測試集中的分布情況；以及Laptop和Restaurant兩個領域的數據集中負面標簽在訓練集和測試集中的分布情況。4.根據權利要求3所述的基于Transformer實現細粒度情感分析的方法，其特征在于，所述的步驟(2)具體包括以下步驟：(2.1)針對所述的Laptop和Restaurant數據集中的訓練集數據以及測試集數據分別進行.xml數據的解析，提取包含正文文本信息數據、主體信息數據以及主體情感類別信息數據；(2.2)將所述的正文文本信息數據、主體信息數據以及主體情感類別信息數據統一轉為UTF
?
8編碼；(2.3)將所述的正文文本信息數...

【專利技術屬性】
技術研發人員：俞楓，黃韋，梅龍，
申請(專利權)人：國泰君安證券股份有限公司，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術