System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本公開的實施例涉及計算機,具體涉及基于權限標簽的問答信息處理方法、裝置和電子設備。
技術介紹
1、隨著機器學習相關技術的發展,基于機器學習的問答信息提煉及應用被越來越多使用(例如,應用于法規領域的問答信息應用)。然而,針對多個問答信息庫,當存在重復的用于問答信息提煉的文件時,往往會導致問答信息的重復提煉和存儲,可能造成計算資源和存儲資源的浪費。
2、該
技術介紹
部分中所公開的以上信息僅用于增強對本專利技術構思的背景的理解,并因此,其可包含并不形成本領域普通技術人員已知的現有技術的信息。
技術實現思路
1、本公開的內容部分用于以簡要的形式介紹構思,這些構思將在后面的具體實施方式部分被詳細描述。本公開的內容部分并不旨在標識要求保護的技術方案的關鍵特征或必要特征,也不旨在用于限制所要求的保護的技術方案的范圍。
2、本公開的一些實施例提出了基于權限標簽的問答信息處理方法、裝置和電子設備,來解決以上
技術介紹
部分提到的技術問題中的一項或多項。
3、第一方面,本公開的一些實施例提供了一種基于權限標簽的問答信息處理方法,該方法包括:獲取問答信息集合,其中,上述問答信息集合中的問答信息對應不同的且相互之間數據隔離的問答信息庫,問答信息包括:問答信息源、問答內容信息和問答信息標簽,其中,問答信息標簽表征問答信息的被訪問權限;對上述問答信息集合中的每個問答信息包括的問答內容信息進行問答信息特征提取,以生成問答信息特征;根據問答信息對應的問答信息特征,對上述問答信息集合中
4、第二方面,本公開的一些實施例提供了一種基于權限標簽的問答信息處理裝置,裝置包括:獲取單元,被配置成獲取問答信息集合,其中,上述問答信息集合中的問答信息對應不同的且相互之間數據隔離的問答信息庫,問答信息包括:問答信息源、問答內容信息和問答信息標簽,其中,問答信息標簽表征問答信息的被訪問權限;信息特征提取單元,被配置成對上述問答信息集合中的每個問答信息包括的問答內容信息進行問答信息特征提取,以生成問答信息特征;異源問答信息合并單元,被配置成根據問答信息對應的問答信息特征,對上述問答信息集合中的問答信息進行異源問答信息合并,以生成問答信息組集合;執行單元,被配置成對于上述問答信息組集合中的每個問答信息組,執行以下第二處理步驟:響應于確定上述問答信息組包括的問答信息的數量大于目標數量,根據上述問答信息組中的問答信息包括的問答信息源和問答信息標簽,生成針對上述問答信息組的更新后問答信息標簽;根據上述更新后問答信息標簽和上述問答信息組,對虛擬問答信息庫對應的問答信息索引樹進行索引更新,得到更新后問答信息索引樹;響應于確定上述問答信息組包括的問答信息的數量等于上述目標數量,根據上述問答信息組,對上述問答信息索引樹進行索引更新,得到更新后問答信息索引樹。
5、第三方面,本公開的一些實施例提供了一種電子設備,包括:一個或多個處理器;存儲裝置,其上存儲有一個或多個程序,當一個或多個程序被一個或多個處理器執行,使得一個或多個處理器實現上述第一方面任一實現方式所描述的方法。
6、第四方面,本公開的一些實施例提供了一種計算機可讀介質,其上存儲有計算機程序,其中,程序被處理器執行時實現上述第一方面任一實現方式所描述的方法。
7、本公開的上述各個實施例具有如下有益效果:通過本公開的一些實施例的基于權限標簽的問答信息處理方法,減少了存儲資源的浪費。具體來說,造成存儲資源浪費的原因在于:針對多個問答信息庫,當存在重復的用于問答信息提煉的文件時,往往會導致問答信息的重復提煉和存儲,可能造成計算資源和存儲資源的浪費?;诖?,本公開的一些實施例的基于權限標簽的問答信息處理方法,首先,獲取問答信息集合,其中,上述問答信息集合中的問答信息對應不同的且相互之間數據隔離的問答信息庫,問答信息包括:問答信息源、問答內容信息和問答信息標簽,其中,問答信息標簽表征問答信息的被訪問權限。以此得到待合并存儲的問答信息。接著,對上述問答信息集合中的每個問答信息包括的問答內容信息進行問答信息特征提取,以生成問答信息特征。通過問答信息特征提取,一是可以對問答信息進行特征粒度的信息提煉,二是將不同問答信息庫的問答信息映射至相同的特征空間。進一步,根據問答信息對應的問答信息特征,對上述問答信息集合中的問答信息進行異源問答信息合并,以生成問答信息組集合。以此將來源不同的但內容相同的問答信息進行合并。此外,對于上述問答信息組集合中的每個問答信息組,執行以下第一處理步驟:第一步,響應于確定上述問答信息組包括的問答信息的數量大于目標數量,根據上述問答信息組中的問答信息包括的問答信息源和問答信息標簽,生成針對上述問答信息組的更新后問答信息標簽。即當問答信息組中包含至少一個來源于不同問答信息庫的問答信息時,需要根據問答信息組中的問答信息標簽,對問答信息組進行整體的問答信息標簽更新。第二步,根據上述更新后問答信息標簽和上述問答信息組,對虛擬問答信息庫對應的問答信息索引樹進行索引更新,得到更新后問答信息索引樹。通過更新問答信息索引樹,實現將來源于不同問答信息庫的問答信息整體存儲,避免了當存在信息冗余時,獨立存儲可能造成的存儲資源浪費的問題。第三步,響應于確定上述問答信息組包括的問答信息的數量等于上述目標數量,根據上述問答信息組,對上述問答信息索引樹進行索引更新,得到更新后問答信息索引樹。實踐中,當問答信息組包括的問答信息的數量等于上述目標數量,即表征問答信息組包括的問答信息均來源于相同的問答信息庫,此時可以直接對問答信息索引樹進行更新。通過此種將多個問答信息庫中的問答信息合并存儲的方式,大大提高了存儲資源利用率。
本文檔來自技高網...【技術保護點】
1.一種基于權限標簽的問答信息處理方法,包括:
2.根據權利要求1所述的方法,其中,所述方法還包括:
3.根據權利要求2所述的方法,其中,所述問答信息集合中的問答信息包括:問詢信息和答復信息;以及
4.根據權利要求3所述的方法,其中,所述根據問答信息對應的問答信息特征,對所述問答信息集合中的問答信息進行異源問答信息合并,以生成問答信息組集合,包括:
5.根據權利要求4所述的方法,其中,所述根據所述問答信息組中的問答信息包括的問答信息源和問答信息標簽,生成針對所述問答信息組的更新后問答信息標簽,包括:
6.根據權利要求5所述的方法,其中,所述根據所述更新后問答信息標簽和所述問答信息組,對虛擬問答信息庫對應的問答信息索引樹進行索引更新,得到更新后問答信息索引樹,包括:
7.一種基于權限標簽的問答信息處理裝置,包括:
8.一種電子設備,包括:
9.一種計算機可讀介質,其上存儲有計算機程序,其中,所述計算機程序被處理器執行時實現如權利要求1至6中任一所述的方法。
【技術特征摘要】
1.一種基于權限標簽的問答信息處理方法,包括:
2.根據權利要求1所述的方法,其中,所述方法還包括:
3.根據權利要求2所述的方法,其中,所述問答信息集合中的問答信息包括:問詢信息和答復信息;以及
4.根據權利要求3所述的方法,其中,所述根據問答信息對應的問答信息特征,對所述問答信息集合中的問答信息進行異源問答信息合并,以生成問答信息組集合,包括:
5.根據權利要求4所述的方法,其中,所述根據所述問答信息組中的問答信息包括的問答信...
【專利技術屬性】
技術研發人員:梁文杰,徐崚峰,王桂強,舒光斌,何燁,劉殊玥,吳東學,張凱,張蔚坪,李相彬,劉曉影,張翼飛,
申請(專利權)人:中信證券股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。