System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本公開涉及數據挖掘,具體而言,本申請涉及一種技術競爭對手的識別方法、裝置、電子設備和存儲介質
技術介紹
1、技術競爭對手的識別是指通過系統化的分析和評估,識別在特定
中存在技術競爭關系的企業、高校、研究機構或個人。這些技術競爭對手在技術創新、專利申請、市場開拓等方面與競爭主體存在直接或間接的競爭關系。識別技術競爭對手對于企業的戰略規劃、技術研發方向的調整、市場競爭力的提升等具有重要意義。
2、現有技術中通常基于產業數據(包括專利數據、產品數據、用戶評論數據、網頁數據等等),采用人工智能算法進行技術競爭對手的識別。目前無論是基于企業視角、客戶視角、企業和客戶混合視角以及互聯網視角實現的競爭對手的識別方法,均以單語種數據為基礎,難以適應當前技術全球化的趨勢,無法進行跨越語種和國別的技術競爭對手的識別。
技術實現思路
1、本公開實施例提供了一種技術競爭對手的識別方法、裝置、電子設備和存儲介質,用于解決現有技術中技術競爭對手的識別方法無法進行跨越語種和國別的技術競爭對手的識別的技術問題。
2、根據本公開實施例的一個方面,提供了一種技術競爭對手的識別方法,包括:
3、獲取文本集,文本集包括多個第一文本,第一文本為目標
的第一對象的技術文本;
4、根據預先訓練的第一模型,獲得各個第一文本的第一語義向量,第一模型根據總文本集,以對比學習機制對預訓練的多語種的第一嵌入模型進行再訓練得到,總文本集中包括目標
的多語種的技術文本;
5、計算每一第一語義向量與各第二語義向量之間的相似度,并根據相似度,從各第二語義向量中獲取目標語義向量,第二語義向量為目標
中第二對象的技術文本的語義向量;
6、對于每個第二對象,根據第二對象對應的各個目標語義向量對應的相似度,獲得第二對象與第一對象的競爭強度,競爭強度表征第一對象與第二對象之間技術的相似程度;
7、根據第二對象的競爭強度,從各個第二對象中確定第一對象的技術競爭對手。
8、根據本公開實施例的另一個方面,提供了一種技術競爭對手的識別裝置,包括:
9、技術文本獲取模塊,用于獲取文本集,文本集包括多個第一文本,第一文本為目標
的第一對象的技術文本;
10、語義向量獲取模塊,用于根據預先訓練的第一模型,獲得各個第一文本的第一語義向量,第一模型根據總文本集,以對比學習機制對預訓練的多語種的第一嵌入模型進行再訓練得到,總文本集中包括目標
的多語種的技術文本;
11、相似度比較模塊,用于計算每一第一語義向量與各第二語義向量之間的相似度,并根據相似度,從各第二語義向量中獲取目標語義向量,第二語義向量為目標
中第二對象的技術文本的語義向量;
12、競爭強度獲取模塊,用于對于每個第二對象,根據第二對象對應的各個目標語義向量對應的相似度,獲得第二對象與第一對象的競爭強度,競爭強度表征第一對象與第二對象之間技術的相似程度;
13、競爭對手確定模塊,根據第二對象的競爭強度,從各個第二對象中確定第一對象的技術競爭對手。
14、根據本公開實施例的另一個方面,提供了一種電子設備,該電子設備包括存儲器、處理器及存儲在存儲器上的計算機程序,處理器執行計算機程序以實現上述任一實施例所提供的方法的步驟。
15、根據本公開實施例的再一個方面,提供了一種計算機可讀存儲介質,其上存儲有計算機程序,計算機程序被處理器執行時實現上述任一實施例所提供的方法的步驟。
16、根據本公開實施例的一個方面,提供了一種計算機程序產品,包括計算機程序,計算機程序被處理器執行上述任一實施例所提供的方法的步驟。
17、本公開實施例提供的技術方案帶來的有益效果是:
18、本公開實施例提供的技術方案可以在目標
大量多語種的技術文本的基礎上構建總文本集,通過對比學習機制對多語種的第一嵌入模型進行再訓練得到第一模型,能夠微調優化第一嵌入模型對目標
的多語種的文本向量表達能力,利用訓練好的第一模型,可以在不依賴于任何人工參與的情況下,對于確定的第一對象,將第一對象的文本集中各第一文本轉換為第一語義向量,并根據第一語義向量與目標
中各第二語義向量之間的相似度,確定目標語義向量,以目標語義向量確定第二對象并計算第二對象的競爭強度,以競爭強度從各個第二對象中確定第一對象的技術競爭對手,使得技術競爭對手識別能夠跨越語種和國別的限制,從而極大地節約進行技術競爭對手判斷的人力資源成本,為全球范圍內的產業分析、技術布局分析等分析場景提供巨大支撐。
【技術保護點】
1.一種技術競爭對手的識別方法,其特征在于,包括:
2.根據權利要求1所述的技術競爭對手的識別方法,其特征在于,所述第一模型通過以下方式生成:
3.根據權利要求1所述的技術競爭對手的識別方法,其特征在于,所述第一模型通過以下方式生成:
4.根據權利要求3所述的技術競爭對手的識別方法,其特征在于,所述第二模型通過以下方式生成:
5.根據權利要求1-4任一項所述的技術競爭對手的識別方法,其特征在于,所述計算每一第一語義向量與各第二語義向量之間的相似度,并根據所述相似度,從各第二語義向量中獲取目標語義向量,包括:
6.根據權利要求5所述的技術競爭對手的識別方法,其特征在于,所述向量數據庫的索引通過以下方式構建:
7.根據權利要求1-4任一項所述的技術競爭對手的識別方法,其特征在于,對于每個第二對象,根據所述第二對象對應的各個目標語義向量對應的相似度,獲得所述第二對象與所述第一對象的競爭強度,包括:
8.一種技術競爭對手的識別裝置,其特征在于,包括:
9.一種電子設備,包括存儲器、處理器及存儲
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1-7任一項所述方法的步驟。
11.一種計算機程序產品,包括計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1-7任一項所述方法的步驟。
...【技術特征摘要】
1.一種技術競爭對手的識別方法,其特征在于,包括:
2.根據權利要求1所述的技術競爭對手的識別方法,其特征在于,所述第一模型通過以下方式生成:
3.根據權利要求1所述的技術競爭對手的識別方法,其特征在于,所述第一模型通過以下方式生成:
4.根據權利要求3所述的技術競爭對手的識別方法,其特征在于,所述第二模型通過以下方式生成:
5.根據權利要求1-4任一項所述的技術競爭對手的識別方法,其特征在于,所述計算每一第一語義向量與各第二語義向量之間的相似度,并根據所述相似度,從各第二語義向量中獲取目標語義向量,包括:
6.根據權利要求5所述的技術競爭對手的識別方法,其特征在于,所述向量數據庫的索引通過以下方式構建:
7.根...
【專利技術屬性】
技術研發人員:高影繁,王莉軍,李巖,王淑君,鄭明,袁鳴,
申請(專利權)人:中國科學技術信息研究所,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。