• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    文本情感傾向判斷方法與系統技術方案

    技術編號:12407447 閱讀:63 留言:0更新日期:2015-11-29 04:32
    本發明專利技術提供一種文本情感傾向判斷方法與系統。文本情感傾向判斷方法包括:語料取得步驟,取得一定時間窗口內的用戶歷史文本信息作為語料;用戶性格特征判斷步驟,根據所述語料判斷用戶的性格特征;情感詞匯權重調整步驟,利用情感詞匯詞典獲取需要判斷的用戶文本中的情感詞匯以及初始權重形成情感詞匯列表,并且根據所述用戶性格特征判斷步驟中判斷出的用戶的性格特征對所述情感詞匯列表中的詞匯權重進行調整;以及文本情感傾向判斷步驟,根據所述情感詞匯列表中每個詞匯的極性及其被調整過的權重,判斷所述需要判斷的用戶文本的情感傾向。

    【技術實現步驟摘要】

    本專利技術涉及數據處理
    中的用戶文本情感傾向判斷。更具體而言,本專利技術 涉及一種基于用戶性格特征的文本情感傾向判斷方法與系統
    技術介紹
    隨著SNS (Social Networking Services,社會性網絡服務)不斷流行,人們通過微 博、論壇等平臺,對人物、事件、產品發布各種各樣的觀點。為了有效處理這些信息,發現人 們的態度意見,就需要進行文本情感分析。文本情感傾向,表達了人們對某事件、某產品的 喜好。 然而,在個性化時代的今天,每個人表達情感的方式和程度都是不一樣的。比如對 于"還好"這個詞,對一些人表示"好的"而對另一些人則表示"一般"而已。因此如何能根 據每個人不同的性格特征、表達特點去做情感判斷才客觀真實。 為了解決上面提到的問題。我們首先來看看現有技術方法,以及該方法的不足。 在專利文獻1中公開了一種情感分析系統及方法,該系統包括語料庫建立模組, 用于建立觀點句識別及情感傾向分析所需的訓練集;數據預處理模組,用于對訓練集中的 句子進行預處理;觀點句識別模組,采用支持向量機分類器與貝葉斯分類器分別對預處理 后的句子進行觀點句識別,并對兩分類器的結果進行集成處理,得到最終的分類結果;以及 情感傾向分析模組,基于支持向量機分類器及貝葉斯分類器分別直接將預處理后的句子分 為正面、負面和無觀點三類,并通過一集成公式將該支持向量機分類器和貝葉斯分類器的 分類結果集成,得到當前句子的分類結果 在專利文獻2中公開了一種面向微博短文本的情感分析方法,該方法包括:步驟 1,采集包含指定關鍵字詞的微博數據存入數據庫;步驟2,對微博數據進行預處理;步驟3, 加載相關字典;步驟4,進行分句,過濾掉不包含用戶配置關鍵字的句子;步驟5,對包含關 鍵字的句子進行分詞,詞性標注;步驟6,利用句法分析工具對包含主題的句子進行依存句 法分析;步驟7,對包含主題詞的每個句子的極性進行判斷;步驟8,判斷完所有包含主題詞 的句子的極性后,判斷整條微博的情感傾向性。 然而,在現有技術中都存在一個共同問題:忽略了人本身的性格特征和表達方式, 情感分析按照統一的無差別的方式進行標準化計算,得出的情感傾向必然失真。 現有技術文獻 專利文獻 專利文獻 I :CNl〇3〇34626A 專利文獻 2 :CN102663046A
    技術實現思路
    本專利技術鑒于上述問題而研發,目的在于提供一種考慮了用戶性格特征的文本情感 傾向判斷方法與系統,提高文本情感傾向判斷的準確性。 本專利技術的一個方面涉及一種文本情感傾向判斷方法,其特征在于包括:語料取得 步驟,取得一定時間窗口內的用戶歷史文本信息作為語料;用戶性格特征判斷步驟,根據所 述語料判斷用戶的性格特征;情感詞匯權重調整步驟,利用情感詞匯詞典獲取需要判斷的 用戶文本中的情感詞匯以及初始權重形成情感詞匯列表,并且根據所述用戶性格特征判斷 步驟中判斷出的用戶的性格特征對所述情感詞匯列表中的詞匯權重進行調整;以及文本情 感傾向判斷步驟,根據所述情感詞匯列表中每個詞匯的極性及其被調整過的權重,判斷所 述需要判斷的用戶文本的情感傾向。 另外,在本專利技術中優選:還包括文本處理步驟,在所述文本處理步驟中,對所述語 料或者所述需要判斷的用戶文本進行分詞、詞性判斷,并且利用情感詞匯詞典獲取所述語 料或者所述需要判斷的用戶文本中的情感詞匯,在所述用戶性格特征判斷步驟中,根據所 述語料中的情感詞匯來判斷用戶的性格特征。 另外,在本專利技術中優選:所述用戶性格特征判斷步驟包括:將所述語料按照文本 發布的時間進行排序的步驟;按照時間對所述語料進行聚類,并將不同的聚類分別保存在 不同的語料集合中的步驟;對每一個所述語料集合中的語料進行分析,判斷對于當前語料 集合的用戶性格特征的步驟;以及對全部所述語料集合的用戶性格特征進行綜合計算,從 而得到最終的用戶的性格特征的步驟。 另外,在本專利技術中優選:在對全部所述語料集合的用戶性格特征進行綜合計算時, 利用下述數學式調整用戶性格特征的權重W, 其中,T為表示衰減周期的常數,t為時間間隔,e為規定常數。 在本專利技術中優選:在所述情感詞匯權重調整步驟中,利用下述數學式對情感詞匯 的權重S進行調整, a 其中,a是大于1的經驗參數,S。是情感詞匯的初始權重,X是量化后的用戶性格 特征,y是情感詞匯的極性。 另外,在本專利技術中優選:在所述文本情感傾向判斷步驟中,當所述情感詞匯列表中 的所有正向詞匯的貢獻率與所有負向詞匯的貢獻率之差的絕對值不大于給定閾值β時, 將所述需要判斷的用戶文本的情感傾向判斷為中性,當所述情感詞匯列表中的所有正向詞 匯的貢獻率與所有負向詞匯的貢獻率之差大于β時,將所述需要判斷的用戶文本的情感 傾向判斷為正性,當所述情感詞匯列表中的所有正向詞匯的貢獻率與所有負向詞匯的貢獻 率之差小于-β時,將所述需要判斷的用戶文本的情感傾向判斷為負性。 本專利技術的另一方面涉及一種文本情感傾向判斷系統,其特征在于包括:語料取得 單元,取得一定時間窗口內的用戶歷史文本信息作為語料;用戶性格特征判斷單元,根據所 述語料判斷用戶的性格特征;情感詞匯權重調整單元,利用情感詞匯詞典獲取需要判斷的 用戶文本中的情感詞匯以及初始權重形成情感詞匯列表,并且根據由所述用戶性格特征判 斷單元判斷出的用戶的性格特征對所述情感詞匯列表中的詞匯權重進行調整;以及文本情 感傾向判斷單元,根據所述情感詞匯列表中每個詞匯的極性及其被調整過的權重,判斷所 述需要判斷的用戶文本的情感傾向。 另外,在本專利技術中優選:還包括文本處理單元,在所述文本處理單元中,對所述語 料或者所述需要判斷的用戶文本進行分詞、詞性判斷,并且利用情感詞匯詞典獲取所述語 料或者所述需要判斷的用戶文本中的情感詞匯,所述用戶性格特征判斷單元根據所述語料 中的情感詞匯來判斷用戶的性格特征。 專利技術效果 根據本專利技術,能夠根據用戶的歷史語料判斷出用戶的性格、情緒、表達風格(即用 戶性格特征)再進行情感分析。根據此方法能夠進行準確的信息推薦(如商品、好友、新聞 等等)、評價等工作。【附圖說明】 附圖用來對本專利技術做進一步理解,構成說明書的一部分,與優選實施例一起用于 對本專利技術進行詳細的解釋,并不構成對本專利技術的限制。其中: 圖1是本專利技術涉及的文本情感傾向判斷系統的示意框圖。 圖2是本專利技術涉及的文本情感傾向判斷方法的主流程圖。 圖3是本專利技術用于判斷用戶性格特征的流程圖。 圖4是本專利技術用于調整情感詞匯權重的流程圖。【具體實施方式】 下面將參考附圖來對本專利技術的實施方式進行詳細說明,但本專利技術并不限于該實施 方式。此外,在本專利技術的下列描述中,將省略對已知功能和配置的具體描述,以避免使本發 明的主題不清楚。 如圖1所示,本實施方式的文本情感傾向判斷系統包括:語料取得單元101、用戶 性格特征判斷單元102、情感詞匯權重調整單元103、文本情感傾向判斷單元104、用戶接口 單元105、以及文本處理單元106。 語料取得單元101收集在一定時間窗口內用戶的歷史文本信息作為語料。時間窗 口可以是天、月等單位,也可以是用戶自行設置的時間單位。通過網站提供的API進行內容 抓取,也可以通過網絡爬蟲進行文本收集。將獲得到的網絡文本信息保存至本地存儲作為 語料庫。將語料按照文本發布的時本文檔來自技高網
    ...

    【技術保護點】
    一種文本情感傾向判斷方法,其特征在于包括:語料取得步驟,取得一定時間窗口內的用戶歷史文本信息作為語料;用戶性格特征判斷步驟,根據所述語料判斷用戶的性格特征;情感詞匯權重調整步驟,利用情感詞匯詞典獲取需要判斷的用戶文本中的情感詞匯以及初始權重形成情感詞匯列表,并且根據所述用戶性格特征判斷步驟中判斷出的用戶的性格特征對所述情感詞匯列表中的詞匯權重進行調整;以及文本情感傾向判斷步驟,根據所述情感詞匯列表中每個詞匯的極性及其被調整過的權重,判斷所述需要判斷的用戶文本的情感傾向。

    【技術特征摘要】

    【專利技術屬性】
    技術研發人員:張磊尚磊
    申請(專利權)人:株式會社日立制作所
    類型:發明
    國別省市:日本;JP

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲AV无码精品无码麻豆| 性无码一区二区三区在线观看| 色欲AV永久无码精品无码| 亚洲av成本人无码网站| 日韩精品无码视频一区二区蜜桃| 午夜福利无码不卡在线观看| 无码无套少妇毛多69XXX| 亚洲AV永久无码精品水牛影视| 人妻少妇精品无码专区| 色窝窝无码一区二区三区色欲 | 少妇人妻av无码专区| 久久国产精品无码网站| 2019亚洲午夜无码天堂| 亚洲不卡中文字幕无码| heyzo高无码国产精品| 丰满少妇人妻无码专区| 永久免费AV无码国产网站| 亚洲AV无码国产在丝袜线观看| 日韩专区无码人妻| 国产成人无码区免费A∨视频网站| 91精品久久久久久无码| 无码人妻丰满熟妇精品区| 亚洲中文字幕无码一久久区| 亚洲国产精品无码久久九九 | 久久无码人妻精品一区二区三区| 亚洲AV永久无码天堂影院| 中文字幕人成无码人妻| 久久久久久亚洲Av无码精品专口| 国产激情无码一区二区app| 久久久久亚洲AV无码专区桃色 | 久久精品无码av| 国产精品亚洲αv天堂无码| 无码精品不卡一区二区三区| 内射人妻无套中出无码| 精品无码成人久久久久久| 亚洲爆乳无码精品AAA片蜜桃| av区无码字幕中文色| 无码中文字幕乱码一区| 午夜成人无码福利免费视频| 久久亚洲AV永久无码精品| 在线a亚洲v天堂网2019无码|