本申請涉及一種內(nèi)容建聯(lián)方法、裝置、計算機設備和存儲介質(zhì)。所述方法包括:獲取資訊文本數(shù)據(jù)和產(chǎn)品服務文本描述數(shù)據(jù),進行分詞處理,得到文本數(shù)據(jù)集合;對所述文本數(shù)據(jù)集合中的資訊文本數(shù)據(jù)進行向量化,得到第一語義特征向量和第二語義特征向量;針對標簽詞,采用語義向量模型訓練得到標簽詞對應的標簽語義向量,以及標簽語義向量列表;將資訊文本數(shù)據(jù)和產(chǎn)品服務文本描述數(shù)據(jù)對應的文本標簽和標簽語義向量存儲在內(nèi)存數(shù)據(jù)庫中;在線檢索時,通過查詢資訊文本的文本標簽對應的標簽語義向量,得到相似文本列表,從相似文本列表選擇最終建聯(lián)的產(chǎn)品服務文本列表。采用本方法能夠提高建聯(lián)的準確性。高建聯(lián)的準確性。高建聯(lián)的準確性。
【技術實現(xiàn)步驟摘要】
內(nèi)容建聯(lián)方法、裝置、計算機設備和存儲介質(zhì)
[0001]本申請涉及計算機
,特別是涉及一種內(nèi)容建聯(lián)方法、裝置、計算機設備和存儲介質(zhì)。
技術介紹
[0002]內(nèi)容
?
產(chǎn)品/服務建聯(lián)是指在信息流推薦場景下,將資訊內(nèi)容跟實際業(yè)務中的產(chǎn)品或服務相互關聯(lián),使得資訊內(nèi)容與產(chǎn)品/服務之間形成有機的聯(lián)系。產(chǎn)品/服務可以通過內(nèi)容來宣傳自己的特點和優(yōu)勢,而內(nèi)容/服務也可以通過產(chǎn)品來傳達自己的價值和意義。通過內(nèi)容
?
產(chǎn)品/服務建聯(lián),可以提高產(chǎn)品的知名度和認可度,同時也可以提升內(nèi)容的傳播效果和影響力。有效的內(nèi)容
?
產(chǎn)品/服務建聯(lián)體系既可以提升資訊內(nèi)容消費轉(zhuǎn)化,也可以降低內(nèi)容運營的復雜度。
[0003]目前,內(nèi)容建聯(lián)方法基本是通過標簽把特定的內(nèi)容與服務進行匹配關聯(lián),并沒有考慮產(chǎn)品/服務實際的內(nèi)容,從而導致內(nèi)容建聯(lián)的準確度不高,后續(xù)維護效率低下。
技術實現(xiàn)思路
[0004]基于此,有必要針對上述技術問題,提供一種能夠內(nèi)容建聯(lián)方法、裝置、計算機設備和存儲介質(zhì)。
[0005]一種內(nèi)容建聯(lián)方法,所述方法包括:獲取資訊文本數(shù)據(jù)和產(chǎn)品服務文本描述數(shù)據(jù),對所述資訊文本數(shù)據(jù)和產(chǎn)品服務文本描述數(shù)據(jù)進行分詞處理,得到文本數(shù)據(jù)集合;對所述文本數(shù)據(jù)集合中的資訊文本數(shù)據(jù)進行向量化,得到所述資訊文本數(shù)據(jù)的標簽對應的第一語義特征向量,對所述文本數(shù)據(jù)集合中的產(chǎn)品服務文本描述數(shù)據(jù)進行向量化,得到產(chǎn)品服務文本描述數(shù)據(jù)的標簽對應的第二語義特征向量;針對所述第一語義特征向量和所述第二語義特征向量對應的標簽詞,采用語義向量模型訓練得到所述標簽詞對應的標簽語義向量,以及標簽語義向量列表;將所述資訊文本數(shù)據(jù)和產(chǎn)品服務文本描述數(shù)據(jù)對應的文本標簽和所述標簽語義向量采用Key
?
Value方式存儲在內(nèi)存數(shù)據(jù)庫中;在線檢索時,通過查詢資訊文本的文本標簽對應的標簽語義向量,得到相似文本列表,從所述相似文本列表選擇最終建聯(lián)的資訊文本和/或產(chǎn)品服務文本列表。
[0006]在其中一個實施例中,所述資訊文本數(shù)據(jù)包括:標題、文本內(nèi)容的文本數(shù)據(jù),所述產(chǎn)品服務文本描述數(shù)據(jù)包括:名稱、描述、所屬行業(yè)、類型的描述數(shù)據(jù)。
[0007]在其中一個實施例中,還包括:獲取所述標簽詞對應的多個所述第一語義特征向量和所述第二語義特征向量;通過Word2Vec方式對所述第一語義特征向量和所述第二語義特征向量進行訓練,生成標簽詞的標簽語義向量。
[0008]在其中一個實施例中,還包括:對內(nèi)存數(shù)據(jù)庫中存儲的數(shù)據(jù)的標簽變化進行全量數(shù)據(jù)更新。
[0009]在其中一個實施例中,還包括:提取待檢索資訊文本的標簽詞,根據(jù)所述標簽詞從所述內(nèi)存數(shù)據(jù)庫中檢索標簽詞對應的標簽語義向量,得到標簽列表;獲取所述待檢索資訊文本的語義向量,根據(jù)所述語義向量在所述內(nèi)存數(shù)據(jù)庫進行語義檢索,得到標簽相似度列表;根據(jù)所述標簽列表和標簽相似度列表,排序得到最終建聯(lián)的資訊文本和/或產(chǎn)品服務文本列表。
[0010]在其中一個實施例中,所述待檢索資訊文本包含多個標簽詞;還包括:提取待檢索資訊文本的多個標簽詞,依次將每個所述標簽詞在所述內(nèi)存數(shù)據(jù)庫中檢索標簽詞對應的標簽語義向量,得到標簽列表。
[0011]一種內(nèi)容建聯(lián)裝置,所述裝置包括:文本處理模塊,用于獲取資訊文本數(shù)據(jù)和產(chǎn)品服務文本描述數(shù)據(jù),對所述資訊文本數(shù)據(jù)和產(chǎn)品服務文本描述數(shù)據(jù)進行分詞處理,得到文本數(shù)據(jù)集合;語義向量化模塊,用于對所述文本數(shù)據(jù)集合中的資訊文本數(shù)據(jù)進行向量化,得到所述資訊文本數(shù)據(jù)的標簽對應的第一語義特征向量,對所述文本數(shù)據(jù)集合中的產(chǎn)品服務文本描述數(shù)據(jù)進行向量化,得到產(chǎn)品服務文本描述數(shù)據(jù)的標簽對應的第二語義特征向量;標簽向量化模塊,用于針對所述第一語義特征向量和所述第二語義特征向量對應的標簽詞,采用語義向量模型訓練得到所述標簽詞對應的標簽語義向量,以及標簽語義向量列表;內(nèi)容建聯(lián)模塊,用于將所述資訊文本數(shù)據(jù)和產(chǎn)品服務文本描述數(shù)據(jù)對應的文本標簽和所述標簽語義向量采用Key
?
Value方式存儲在內(nèi)存數(shù)據(jù)庫中;在線檢索時,通過查詢文本標簽對應的標簽語義向量,得到相似文本列表,從所述相似文本列表選擇最終建聯(lián)的資訊文本和/或產(chǎn)品服務文本列表。
[0012]在其中一個實施例中,所述資訊文本數(shù)據(jù)包括:標題、文本內(nèi)容的文本數(shù)據(jù),所述產(chǎn)品服務文本描述數(shù)據(jù)包括:名稱、描述、所屬行業(yè)、類型的描述數(shù)據(jù)。
[0013]一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)以下步驟:獲取資訊文本數(shù)據(jù)和產(chǎn)品服務文本描述數(shù)據(jù),對所述資訊文本數(shù)據(jù)和產(chǎn)品服務文本描述數(shù)據(jù)進行分詞處理,得到文本數(shù)據(jù)集合;對所述文本數(shù)據(jù)集合中的資訊文本數(shù)據(jù)進行向量化,得到所述資訊文本數(shù)據(jù)的標簽對應的第一語義特征向量,對所述文本數(shù)據(jù)集合中的產(chǎn)品服務文本描述數(shù)據(jù)進行向量化,得到產(chǎn)品服務文本描述數(shù)據(jù)的標簽對應的第二語義特征向量;針對所述第一語義特征向量和所述第二語義特征向量對應的標簽詞,采用語義向量模型訓練得到所述標簽詞對應的標簽語義向量,以及標簽語義向量列表;將所述資訊文本數(shù)據(jù)和產(chǎn)品服務文本描述數(shù)據(jù)對應的文本標簽和所述標簽語義向量采用Key
?
Value方式存儲在內(nèi)存數(shù)據(jù)庫中;在線檢索時,通過查詢資訊文本的文本標簽對應的標簽語義向量,得到相似文本列表,從所述相似文本列表選擇最終建聯(lián)的資訊文本和/或產(chǎn)品服務文本列表。
[0014]一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)以下步驟:獲取資訊文本數(shù)據(jù)和產(chǎn)品服務文本描述數(shù)據(jù),對所述資訊文本數(shù)據(jù)和產(chǎn)品服務文
本描述數(shù)據(jù)進行分詞處理,得到文本數(shù)據(jù)集合;對所述文本數(shù)據(jù)集合中的資訊文本數(shù)據(jù)進行向量化,得到所述資訊文本數(shù)據(jù)的標簽對應的第一語義特征向量,對所述文本數(shù)據(jù)集合中的產(chǎn)品服務文本描述數(shù)據(jù)進行向量化,得到產(chǎn)品服務文本描述數(shù)據(jù)的標簽對應的第二語義特征向量;針對所述第一語義特征向量和所述第二語義特征向量對應的標簽詞,采用語義向量模型訓練得到所述標簽詞對應的標簽語義向量,以及標簽語義向量列表;將所述資訊文本數(shù)據(jù)和產(chǎn)品服務文本描述數(shù)據(jù)對應的文本標簽和所述標簽語義向量采用Key
?
Value方式存儲在內(nèi)存數(shù)據(jù)庫中;在線檢索時,通過查詢資訊文本的文本標簽對應的標簽語義向量,得到相似文本列表,從所述相似文本列表選擇最終建聯(lián)的資訊文本和/或產(chǎn)品服務文本列表。
[0015]上述內(nèi)容建聯(lián)方法、裝置、計算機設備和存儲介質(zhì),通過對資訊文本數(shù)據(jù)和產(chǎn)品服務文本描述數(shù)據(jù)進行兩個維度的關聯(lián),最終實現(xiàn)內(nèi)容建立的精準度,第一個維度的建聯(lián)是分別提取資訊文本數(shù)據(jù)和產(chǎn)品服務文本描述數(shù)據(jù)的語義向量,將資訊文本和產(chǎn)品/服務文本進行相同維度的轉(zhuǎn)化,第二個維度是通過對文本的標簽進行統(tǒng)一,在大量的文本數(shù)據(jù)支持下,每個標簽對應的語義向量來自于不同的資訊文本和產(chǎn)品服務文本描述數(shù)據(jù),通過上述語義向量綜合來描述標簽詞,從而實現(xiàn)了資訊和產(chǎn)品服務第二維度的建聯(lián),將上述處理的數(shù)據(jù)存儲在高性能內(nèi)存數(shù)據(jù)庫中,本文檔來自技高網(wǎng)...
【技術保護點】
【技術特征摘要】
1.一種內(nèi)容建聯(lián)方法,其特征在于,所述方法包括:獲取資訊文本數(shù)據(jù)和產(chǎn)品服務文本描述數(shù)據(jù),對所述資訊文本數(shù)據(jù)和產(chǎn)品服務文本描述數(shù)據(jù)進行分詞處理,得到文本數(shù)據(jù)集合;對所述文本數(shù)據(jù)集合中的資訊文本數(shù)據(jù)進行向量化,得到所述資訊文本數(shù)據(jù)的標簽對應的第一語義特征向量,對所述文本數(shù)據(jù)集合中的產(chǎn)品服務文本描述數(shù)據(jù)進行向量化,得到產(chǎn)品服務文本描述數(shù)據(jù)的標簽對應的第二語義特征向量;針對所述第一語義特征向量和所述第二語義特征向量對應的標簽詞,采用語義向量模型訓練得到所述標簽詞對應的標簽語義向量,以及標簽語義向量列表;將所述資訊文本數(shù)據(jù)和產(chǎn)品服務文本描述數(shù)據(jù)對應的文本標簽和所述標簽語義向量采用Key
?
Value方式存儲在內(nèi)存數(shù)據(jù)庫中;在線檢索時,通過查詢資訊文本的文本標簽對應的標簽語義向量,得到相似文本列表,從所述相似文本列表選擇最終建聯(lián)的產(chǎn)品服務文本列表。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述資訊文本數(shù)據(jù)包括:標題、文本內(nèi)容的文本數(shù)據(jù),所述產(chǎn)品服務文本描述數(shù)據(jù)包括:名稱、描述、所屬行業(yè)、類型的描述數(shù)據(jù)。3.根據(jù)權(quán)利要求1所述的方法,其特征在于,采用語義向量模型訓練得到所述標簽詞對應的標簽語義向量,包括:獲取所述標簽詞對應的多個所述第一語義特征向量和所述第二語義特征向量;通過Word2Vec方式對所述第一語義特征向量和所述第二語義特征向量進行訓練,生成標簽詞的標簽語義向量。4.根據(jù)權(quán)利要求1所述的方法,其特征在于,在將所述資訊文本數(shù)據(jù)和產(chǎn)品服務文本描述數(shù)據(jù)對應的文本標簽和所述標簽語義向量采用Key
?
Value方式存儲在內(nèi)存數(shù)據(jù)庫中之后,所述方法還包括:對內(nèi)存數(shù)據(jù)庫中存儲的數(shù)據(jù)的標簽變化進行全量數(shù)據(jù)更新。5.根據(jù)權(quán)利要求1至4任一項所述的方法,其特征在于,通過查詢文本標簽對應的標簽語義向量,得到多個相似的文本標簽,從所述相似文本列表選擇最終建聯(lián)的產(chǎn)品服務文本列表,包括:提取待檢索資訊文本的標簽詞,根據(jù)所述標簽詞從所述內(nèi)存數(shù)據(jù)庫中檢索標簽詞對應的標簽語義向量,得到標簽列表;獲取所述待檢索資訊文本的語義向...
【專利技術屬性】
技術研發(fā)人員:李煜,丑曉慧,王瑋,
申請(專利權(quán))人:寧波深擎信息科技有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。