【技術實現步驟摘要】
本專利技術涉及計算機應用
,尤其涉及一種預估模型參數的訓練方法、服務質量預估方法及對應裝置。
技術介紹
在O2O(OnlineToOffline)服務的提供當中,有一些O2O服務是屬于超低頻的行業,比如家裝行業,婚慶行業,二手房中介行業等等,因為用戶使用此類O2O服務的頻率非常低,通常為一生當中只有一兩次會使用此類服務,而此類服務的服務質量通常依賴于具體的從業人員的個人素質及專業程度。同時,相對于其他高頻的O2O服務而言,所提供的服務內容根據特定用戶的需求具有非常高的個性化,因此,之前的服務案例的評價并不能很好的作為本次服務的參考依據。用戶在具體決定是否采用某個服務提供者的時候,需要能夠快速的預估該服務人員針對該用戶的本次服務的服務質量,從而能夠讓該用戶享受到較為滿意的服務體驗。當前超低頻O2O行業的某次服務的服務質量的預估主要采用如下的方法:方法一,用戶通過向朋友或者熟人咨詢的方式來了解具體的某個從業人員的口碑,來從直覺判斷本次服務的質量;方法二,用戶通過瀏覽歷史用戶對某個服務人員所提供的服務案例的評價內容及服務星級等指標來判斷本次服務的服務質量。這兩種傳統的方法,盡管能夠給用戶一定的參考來了解該服務人員的服務質量,但是由于超低頻O2O服務行業的特殊性,此類數據一般比較少,參考意義有限;另外,某個具體的服務項目都有很強的個性化,過去的服務案例與本次服務內容之間并不一致,從而會誤導用 ...
【技術保護點】
一種預估模型參數的訓練方法,其特征在于,包括:構建預設類型服務對應的訓練數據集,所述訓練數據集包括從與所述預設類型服務相關的用戶與服務提供者的溝通記錄中篩選出的樣本數據;利用所述訓練數據集訓練得到與所述預設類型服務對應的預估模型參數,所述預估模型參數包括由所述訓練數據集所包含詞語的詞向量構成的詞向量矩陣,詞向量矩陣所對應的分布權重向量。
【技術特征摘要】
1.一種預估模型參數的訓練方法,其特征在于,包括:
構建預設類型服務對應的訓練數據集,所述訓練數據集包括從與所述預設
類型服務相關的用戶與服務提供者的溝通記錄中篩選出的樣本數據;
利用所述訓練數據集訓練得到與所述預設類型服務對應的預估模型參數,
所述預估模型參數包括由所述訓練數據集所包含詞語的詞向量構成的詞向量矩
陣,詞向量矩陣所對應的分布權重向量。
2.根據權利要求1所述的方法,其特征在于,所述樣本數據包括用戶問題,
服務提供者回答,服務質量分數。
3.根據權利要求1所述的方法,其特征在于,利用所述訓練數據集訓練得
到所述預設類型服務相關的預估模型參數包括:
建立參數化的詞向量矩陣,參數化的所述分布權重向量;
初始化所述詞向量矩陣中的參數,所述分布權重向量中的參數;
采用預設的迭代算法,對所述詞向量矩陣中的參數,所述分布權重向量中
的參數進行迭代,直至達到預設的迭代終止條件。
4.根據權利要求1所述的方法,其特征在于,利用所述訓練數據集訓練得
到所述預設類型服務相關的預估模型參數還包括:
初始化預估偏移參數;
采用預設的迭代算法,對所述預估偏移參數進行迭代,直至達到預設的迭
代終止條件。
5.根據權利要求3所述的方法,其特征在于,所述建立參數化的詞向量矩
陣包括:
將所述樣本數據進行分詞;
參數化分詞得到的各詞語的詞向量;
由參數化后得到的各詞語的詞向量構成詞向量矩陣。
6.根據權利要求3所述的方法,其特征在于,所述迭代終止條件包括:
達到預設的迭代次數;或者
本次迭代后得到的損失函數的值小于預設目標值;或者
本次迭代結束后得到的損失函數與上次迭代結束后得到的損失函數的值之
差小于預設的閾值;其中,所述損失函數根據訓練數據集所預估的服務質量分
數與訓練數據集中的服務質量分數間的距離確定。
7.一種服務質量預估方法,其特征在于,該方法包括:
獲取用戶與某類型服務的服務提供者的溝通記錄;
查詢與所述服務相關的預估模型參數,獲取所述溝通記錄對應的詞向量矩
陣;
依據所述溝通記錄對應的詞向量矩陣以及所述預估模型參數,計算所述服
務提供者的服務質量分數;
其中所述預估模型參數是采用權利要求1~6任一權項所述的方法訓練得到
的。
8.根據權利要求7所述的方法,其特征在于,所述獲取所述溝通記錄對應
的詞向量矩陣,包括:
根據所述溝通記錄提取至少一個由用戶問題及服務提供者回答構成的二元
對;
對每個二元對中的用戶問題QU及服務提供者回答AN進行分詞;
查詢與所述服務相關的詞向量矩陣,獲取每個二元對當中所有詞語的詞向
量。
9.根據權利要求7所述的方法,其特征在于,所述計算所述服務提供者的
服務質量分數,包括:
利用預設向量計算方法對每個二元對所對應的詞向量矩陣計算得到每個二
元對所對應的詞向量;
根據每個二元對所對應的詞向量及所述預估模型參數計算每個二元對所對
應的服務質量分數;
根據每個二元對所對應的服務質量分數計算所述服務提供者的服務質量分
\t數。
10.根據權利要求8所述的方法,其特征在于,所述根據每個二元對所對
應的詞向量及所述預估模型參數計算每個二元對所對應的服務質量分數的計算
公式如下:
Scorei=(rep(QU-AN)·V+b,
其中Scorei表示第i個二元對所對應的服務質量分數。rep(QU-AN)·V表示
rep(QU-AN)與分布權重向量V的內積,rep(QU-AN)表示第i個二元對所對應的
詞向量,所述b表示預估偏移參數。
11.一種預估模型參數的訓練裝置,其特征在于,包括:
構...
【專利技術屬性】
技術研發人員:張軍,
申請(專利權)人:北京百度網訊科技有限公司,
類型:發明
國別省市:北京;11
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。