System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于關系分類,尤其涉及一種面向噪聲場景的小樣本關系分類方法和裝置。
技術介紹
1、關系分類作為信息抽取的重要組成部分,旨在識別給定句子中兩個目標實體之間的語義關系,憑借其卓越的信息識別和語義理解能力,其在自然語言處理的各種下游任務如知識圖譜的構建、推薦系統、智能問答中發揮了至關重要的作用。具體來說,給定一個查詢實例“jinnah?and?his?wife?rattanbai?petit?had?separated?soon?after?theirdaughter?dina?wadia?was?bom”,它的頭實體為“dina?wadia”,尾實體為“rattanbaipetit”,我們需要正確的將頭尾實體的關系分類為“mother”。
2、在傳統的基于監督學習的關系分類方法中,每個關系都需要依賴大量標記的數據進行訓練,然而現實生活中的絕大多數據都是未經過標記處理的,這嚴重影響了監督學習方法對關系進行分類的能力。此外,手動注釋數據也是一個費時費力的過程。同時在某些特定的領域中,例如醫療、法律等,可獲取的數據是極其有限的,無法像常規關系一樣為這些領域中的特定關系提供足夠數量的可學習實例,這種長尾分布問題也成為當前技術的難點。元學習方法嚴重依賴其網絡結構的設計,元學習器使用相同的初始化模型參數從多個任務中學習知識,當任務間的差異性較大時,不僅需要重新考慮網絡結構,也要多次對參數進行優化。小樣本關系分類任務的典型設置為n-way-k-shot,即在可供訓練的支持集中共有n類關系,每類關系又包含了k個句子實例。現有方
3、目前現有的技術無法解決上述存在的問題,為此我們提出一種面向噪聲場景的小樣本關系分類方法和裝置,將正確的支持實例隨機的按照一定的比例進行替換為表達不同關系的實例,以增強與現實場景下分類的相似性;同時逐步增加n和k的值,引入更多的關系種類和句子實例,以更真實地模擬我們的模型在現實世界中處理噪聲數據的能力。
技術實現思路
1、本專利技術的目的在于提供一種面向噪聲場景的小樣本關系分類方法和裝置,旨在解決上述
技術介紹
中提出的問題。
2、為實現上述目的,本專利技術提供如下技術方案:
3、一種面向噪聲場景的小樣本關系分類方法,包括以下步驟:
4、步驟s1、獲取標注后的支持集和查詢集;
5、步驟s2、按照一定比例把支持集中表達同類關系的句子實例替換為表達不同關系的句子實例;
6、步驟s3、對查詢集和支持集中的句子樣本進行實例級別的交互式匹配,并獲取相應的匹配分數;
7、步驟s4、對匹配分數進行歸一化加權,獲取加權后的各類別原型表示;
8、步驟s5、將原型表示和查詢集中的樣本實例進行拼接,使用全連接層進一步整合;
9、步驟s6、削弱受噪聲影響的特征維度;
10、步驟s7、完成最終的分類。
11、一種面向噪聲場景的小樣本關系分類裝置,包括:
12、實例引導匹配模塊,用于對查詢集和支持集中的句子樣本進行實例級別的交互式匹配,并獲取相應的匹配分數;
13、維度引導注意力模塊,用于削弱受噪聲影響的特征維度;
14、關系感知訓練分類器,用于完成最終的分類。
15、進一步的,所述實例引導匹配模塊將余弦相似度作為評分函數,對所有的支持實例和查詢實例進行相似度匹配,計算方式為:
16、
17、其中,smn和q分別是支持集中第m類關系的第n個向量的特征和查詢實例的向量特征。
18、進一步的,所述維度引導注意力模塊的計算方式為:
19、
20、其中,dimi是向量在第i個維度上的特征差異,k是每個支持集中支持實例的數量,sim和sin分別代表關系類別i的第m個支持實例和第n個支持實例;
21、計算關系i的特征維度向量
22、
23、其中,wi是特征向量在第i個維度上的權重系數,bi是偏置項;
24、修正查詢實例和類別原型兩個向量之間距離的計算公式為:
25、
26、其中,q和pi分別代表查詢實例和類別原型。
27、進一步的,所述關系感知訓練分類器分為兩個訓練階段,第一階段的目標函數為:
28、
29、其中,n為關系類別的數量,q為查詢實例的數量,α是關系因子,衡量噪聲實例對分類結果產生的影響程度;p(y=ri|q)是查詢實例q被分類為關系ri的概率,q是待分類的查詢實例,ri是對應的候選關系;
30、第二階段的優化函數為:
31、
32、其中,xi和xj是支持集中不同的支持實例;
33、最終的損失函數為:
34、j=lfirst+β·lsecond;
35、其中,β是控制優化函數在總體目標函數中權重的超參數。
36、與現有技術相比,本專利技術的有益效果是:
37、本專利技術面向小樣本分類任務,僅需要很少的數據即可完成分類同時解決了樣本的長尾分布問題。針對復雜的噪聲分類場景,通過設計實例引導匹配模塊、維度引導注意力模塊和關系感知訓練分類器極大地提升了分類的性能;同時擴展了關系類別數量和句子實例數量,破除了以往方法關系類別數量和句子實例數量固定為特殊值的局限性,有效解決了引入更多信息帶來的噪聲問題。
本文檔來自技高網...【技術保護點】
1.一種面向噪聲場景的小樣本關系分類方法,其特征在于,包括以下步驟:
2.一種面向噪聲場景的小樣本關系分類裝置,其特征在于,包括:
3.根據權利要求2所述的面向噪聲場景的小樣本關系分類裝置,其特征在于,所述實例引導匹配模塊將余弦相似度作為評分函數,對所有的支持實例和查詢實例進行相似度匹配,計算方式為:
4.根據權利要求2所述的面向噪聲場景的小樣本關系分類裝置,其特征在于,所述維度引導注意力模塊的計算方式為:
5.根據權利要求2所述的面向噪聲場景的小樣本關系分類裝置,其特征在于,所述關系感知訓練分類器分為兩個訓練階段,第一階段的目標函數為:
【技術特征摘要】
1.一種面向噪聲場景的小樣本關系分類方法,其特征在于,包括以下步驟:
2.一種面向噪聲場景的小樣本關系分類裝置,其特征在于,包括:
3.根據權利要求2所述的面向噪聲場景的小樣本關系分類裝置,其特征在于,所述實例引導匹配模塊將余弦相似度作為評分函數,對所有的支持實例和查詢實...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。