本發明專利技術公開了一種基于輿情的市場分析方法、裝置、設備及可讀存儲介質。本發明專利技術采集目標市場的歷史輿論語料文本作為市場分析的基礎,將采集到的歷史輿論語料文本標注標簽后對輿論情感分類模型進行訓練。再基于訓練完成的輿論情感分類模型對實時輿論語料文本進行分類,得到目標市場中消費者的當前情感傾向,該情感傾向即可作為目標市場的調整依據。可以理解的是,相對于目前采用成交數據對房地產市場進行分析的方式,本發明專利技術中作為分析的依據輿情語料數據具有更強的實時性和更多的數量樣本,使得最終的市場分析情況更加準確和充分。最終的市場分析情況更加準確和充分。最終的市場分析情況更加準確和充分。
【技術實現步驟摘要】
基于輿情的市場分析方法、裝置、設備及可讀存儲介質
[0001]本專利技術涉及大數據分析領域,尤其涉及一種基于輿情的市場分析方法、裝置、設備及可讀存儲介質。
技術介紹
[0002]而目前房地產市場(如房價)的監測方法通常是基于成交數據進行分析的,然而房地產是大額不動產,交易行為會十分謹慎,因此交易數據維度較少,同時還有一定的滯后性。因此,目前對房地產市場進行監測的分析方式并不能充分的反應房地產的市場情況。
[0003]上述內容僅用于輔助理解本專利技術的技術方案,并不代表承認上述內容是現有技術。
技術實現思路
[0004]本專利技術的主要目的在于提供一種基于輿情的市場分析方法、裝置、設備及可讀存儲介質,旨在解決目前對房地產市場進行監測的分析方式并不能充分的反應房地產的市場情況的技術問題。
[0005]為實現上述目的,本專利技術提供一種基于輿情的市場分析方法,所述基于輿情的市場分析方法包括以下步驟:采集目標市場的歷史輿情語料作為輿論情感分類模型的訓練數據集;對所述訓練數據集中各歷史輿情語料進行標簽標注得到標注訓練數據集;基于所述標注訓練數據集對所述輿論情感分類模型進行訓練;將所述目標市場的實時輿情語料輸入至所述輿論情感分類模型得到所述目標市場中消費者的當前情感傾向。
[0006]進一步的,所述對所述訓練數據集中各歷史輿情語料進行標簽標注得到標注訓練數據集的步驟包括:對各所述歷史輿情語料的進行分類處理得到預設第一數量的語料集;基于所述語料集的中心語料對所述語料集中的每個所述歷史輿情語料進行標簽標注,以得到所述標注訓練數據集。
[0007]進一步的,所述對各所述歷史輿情語料的進行分類處理得到預設第一數量的語料集的步驟包括:通過預設bert模型對所述訓練數據集進行預處理,以將所述訓練數據集中的每條歷史輿情語料導入至多維空間;基于K
?
means算法對所述多維空間中各所述歷史輿情語料進行聚類分類,以得到所述預設第一數量的具有中心語料的語料集。
[0008]進一步的,所述基于所述語料集的中心語料對所述語料集中的每個所述歷史輿情語料進行標簽標注的步驟包括:輸出各所述中心語料;
接收基于所述中心語料的情感對所述中心語料進行標注的標簽;將與所述中心語料對應的所述語料集中各所述歷史輿情語料標注為與所述中心語料相同的標簽。
[0009]進一步的,所述基于所述標注訓練數據集對所述輿論情感分類模型進行訓練的步驟包括:通過所述預設bert模型對所述標注訓練數據集中的標注語料進行文本特征提取;將各所述文本特征輸入至所述輿論情感分類模型得到所述標注語料的情感分類結果,其中,所述輿論情感分類模型為神經網絡模型;基于所述情感分類結果與所述標注語料的標簽的比對結果對所述輿論情感分類模型中的分類權重進行更新,以完成所述輿論情感分類模型的一次訓練;當所述輿論情感分類模型的訓練次數達到預設輪訓次數時,所述輿論情感分類模型的訓練完成。
[0010]進一步的,所述基于所述情感分類結果與所述標注語料的標簽的比對結果對所述輿論情感分類模型中的分類權重進行更新的步驟包括:根據所述情感分類結果和所述標注語料的標簽的比對結果生成交叉熵損失函數的損失函數;將所述損失函數的梯度向量的負方向作為所述輿論情感分類模型中的分類權重的更新方向;基于所述更新方向和所述輿論情感分類模型的預設學習率對所述輿論情感分類模型中的分類權重進行更新。
[0011]進一步的,所述將所述目標市場的實時輿情語料輸入至所述輿論情感分類模型得到所述目標市場中消費者的當前情感傾向的步驟包括:將各所述實時輿情語料輸入至所述輿論情感分類模型;通過所述輿論情感分類模型對各所述實時輿情語料進行情感分類得到所述目標市場中消費者的情感分布數據;將所述情感分布數據中占比最多的情感類別作為所述消費者的當前情感傾向,其中,所述當前情感傾向可被作為所述目標市場的調整依據。
[0012]此外,為實現上述目的,本專利技術還提供一種基于輿情的市場分析裝置,所述基于輿情的市場分析裝置包括:采集模塊,用于采集目標市場的歷史輿情語料作為輿論情感分類模型的訓練數據集;標注模塊,用于對所述訓練數據集中各歷史輿情語料進行標簽標注得到標注訓練數據集;訓練模塊,用于基于所述標注訓練數據集對所述輿論情感分類模型進行訓練;分析模塊,用于將所述目標市場的實時輿情語料輸入至所述輿論情感分類模型得到所述目標市場中消費者的當前情感傾向。
[0013]此外,為實現上述目的,本專利技術還提供一種基于輿情的市場分析設備,所述基于輿情的市場分析設備包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的基于輿情的市場分析程序,所述基于輿情的市場分析程序被所述處理器執行時實現如上
述的基于輿情的市場分析方法的步驟。
[0014]此外,為實現上述目的,本專利技術還提供一種可讀存儲介質,所述可讀存儲介質上存儲有基于輿情的市場分析程序,所述基于輿情的市場分析程序被處理器執行時實現如上述的基于輿情的市場分析方法的步驟。
[0015]本專利技術實施例提出的一種基于輿情的市場分析方法、裝置、設備及可讀存儲介質,采集目標市場的歷史輿情語料作為輿論情感分類模型的訓練數據集;對所述訓練數據集中各歷史輿情語料進行標簽標注得到標注訓練數據集;基于所述標注訓練數據集對所述輿論情感分類模型進行訓練;將所述目標市場的實時輿情語料輸入至所述輿論情感分類模型得到所述目標市場中消費者的當前情感傾向。即本專利技術采集目標市場的歷史輿論語料文本作為市場分析的基礎,將采集到的歷史輿論語料文本標注標簽后對輿論情感分類模型進行訓練。再基于訓練完成的輿論情感分類模型對實時輿論語料文本進行分類,得到目標市場中消費者的當前情感傾向,該情感傾向即可作為目標市場的調整依據。可以理解的是,相對于目前采用成交數據對房地產市場進行分析的方式,本專利技術中作為分析的依據輿情語料數據具有更強的實時性和更多的數量樣本,使得最終的市場的分析情況更加準確和充分。
附圖說明
[0016]圖1是本專利技術實施例方案涉及的硬件運行環境的設備結構示意圖;圖2為本專利技術基于輿情的市場分析方法的第一實施例的流程示意圖;圖3為本專利技術基于輿情的市場分析方法的第二實施例的流程示意圖;圖4為本專利技術基于輿情的市場分析方法的第三實施例的流程示意圖;圖5為本專利技術基于輿情的市場分析方法中神經網絡模型的結構示意圖。
[0017]本專利技術目的的實現、功能特點及優點將結合實施例,參照附圖做進一步說明。
具體實施方式
[0018]應當理解,此處所描述的具體實施例僅僅用以解釋本專利技術,并不用于限定本專利技術。
[0019]如圖1所示,圖1是本專利技術實施例方案涉及的硬件運行環境的設備結構示意圖。
[0020]本專利技術實施例設備可以是PC,也可以是智能手機、平板電腦、便攜計算機等具有顯示功能的電子終端設備。
[0021]如圖1所示,該設備可以包括:處理器1001,例如CPU,網絡接口1004,用戶接口1003,存儲器1005,通信總線1002。其中,通信總線10本文檔來自技高網...
【技術保護點】
【技術特征摘要】
1.一種基于輿情的市場分析方法,其特征在于,所述基于輿情的市場分析方法包括以下步驟:采集目標市場的歷史輿情語料作為輿論情感分類模型的訓練數據集;對所述訓練數據集中各歷史輿情語料進行標簽標注得到標注訓練數據集;基于所述標注訓練數據集對所述輿論情感分類模型進行訓練;將所述目標市場的實時輿情語料輸入至所述輿論情感分類模型得到所述目標市場中消費者的當前情感傾向。2.如權利要求1所述的基于輿情的市場分析方法,其特征在于,所述對所述訓練數據集中各歷史輿情語料進行標簽標注得到標注訓練數據集的步驟包括:對各所述歷史輿情語料的進行分類處理得到預設第一數量的語料集;基于所述語料集的中心語料對所述語料集中的每個所述歷史輿情語料進行標簽標注,以得到所述標注訓練數據集。3.如權利要求2所述的基于輿情的市場分析方法,其特征在于,所述對各所述歷史輿情語料的進行分類處理得到預設第一數量的語料集的步驟包括:通過預設bert模型對所述訓練數據集進行預處理,以將所述訓練數據集中的每條歷史輿情語料導入至多維空間;基于K
?
means算法對所述多維空間中各所述歷史輿情語料進行聚類分類,以得到所述預設第一數量的具有中心語料的語料集。4.如權利要求3所述的基于輿情的市場分析方法,其特征在于,所述基于所述語料集的中心語料對所述語料集中的每個所述歷史輿情語料進行標簽標注的步驟包括:輸出各所述中心語料;接收基于所述中心語料的情感對所述中心語料進行標注的標簽;將與所述中心語料對應的所述語料集中各所述歷史輿情語料標注為與所述中心語料相同的標簽。5.如權利要求4所述的基于輿情的市場分析方法,其特征在于,所述基于所述標注訓練數據集對所述輿論情感分類模型進行訓練的步驟包括:通過所述預設bert模型對所述標注訓練數據集中的標注語料進行文本特征提取;將各所述文本特征輸入至所述輿論情感分類模型得到所述標注語料的情感分類結果,其中,所述輿論情感分類模型為神經網絡模型;基于所述情感分類結果與所述標注語料的標簽的比對結果對所述輿論情感分類模型中的分類權重進行更新,以完成所述輿論情感分類模型的一次訓練;當所述輿論情感分類...
【專利技術屬性】
技術研發人員:陳濤濤,
申請(專利權)人:深圳市明源云科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。