System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請中實施方式涉及數據壓縮存儲,尤其涉及一種人群數據的壓縮存儲方法、解壓方法及相關裝置。
技術介紹
1、隨著大數據技術的迅猛發展以及人們對數據挖掘需求的持續增長,在電商營銷領域內,人群數據的獲取已經成為研究的熱點。人群數據具有采集頻率高、數據規模龐大的特征,由于存儲海量人群數據會占用大量的硬件資源,且人群數據傳輸過程中會消耗高額帶寬資源,所以在存儲和傳輸人群數據前通常需要進行數據壓縮處理。
2、傳統的數據壓縮方法如霍夫曼編碼、算術編碼和lz壓縮算法等主要基于數據的統計特性進行數據壓縮,以實現對人群數據的高效壓縮,但現有技術中對人群數據進行壓縮之后,存在較為嚴重的壓縮失真,導致壓縮后的人群數據丟失大量信息。
技術實現思路
1、有鑒于此,本申請多個實施方式致力于提供一種人群數據的壓縮存儲方法、解壓方法及相關裝置,可以一定程度上減弱壓縮失真。
2、本申請的一個實施方式提供一種人群數據的壓縮存儲方法,所述人群數據包括多個個人數據,所述方法包括:對應個人數據生成個人向量表示;針對所述個人向量表示進行壓縮編碼得到編碼數據;其中,在針對所述個人向量表示進行壓縮編碼的過程中,識別多個個人向量表示之間的關聯關系,并使得編碼數據包含的信息能表達所述關聯關系;存儲所述人群數據對應的編碼數據。
3、本申請的一個實施方式還提供一種人群數據的解壓方法,包括:接收如前述人群數據的壓縮存儲方法中所述的編碼數據;在針對所述編碼數據進行解碼的過程中,依照所述編碼數據表達的多個個人
4、本申請的一個實施方式還提供一種人群數據的壓縮存儲裝置,所述人群數據包括多個個人數據,所述壓縮存儲裝置包括:向量生成模塊,用于對應個人數據生成個人向量表示;編碼模塊,用于針對所述個人向量表示進行壓縮編碼得到編碼數據;其中,在針對所述個人向量表示進行壓縮編碼的過程中,識別多個個人向量表示之間的關聯關系,并使得編碼數據包含的信息能表達所述關聯關系;存儲模塊,用于存儲所述人群數據對應的編碼數據。
5、本申請的一個實施方式還提供一種人群數據的解壓裝置,所述解壓裝置包括:接收模塊,用于接收如前述人群數據的壓縮存儲方法中所述的編碼數據;解碼模塊,用于在針對所述編碼數據進行解碼的過程中,依照所述編碼數據表達的多個個人向量表示的關聯關系,解碼得出所述多個個人向量表示。
6、本申請的一個實施方式還提供一種計算機設備,所述計算機設備包括存儲器及處理器,所述存儲器中存儲有至少一條計算機程序,所述至少一條計算機程序由所述處理器加載并執行,以實現如前述的方法。
7、本申請的一個實施方式還提供一種計算機可讀存儲介質,所述計算機可讀存儲介質中存儲有至少一條計算機程序,所述至少一條計算機程序被處理器執行時能夠實現如前述的方法。
8、本申請的一個實施方式還提供一種計算機程序產品,計算機程序產品用于實現如前述的方法。
9、在本申請提供的多個實施方式中,通過對應個人數據生成個人向量表示,并在壓縮編碼過程中識別多個個人向量之間的關聯關系,使得編碼數據能夠有效表達這些關聯關系,從而減弱了人群數據的壓縮失真。
本文檔來自技高網...【技術保護點】
1.一種人群數據的壓縮存儲方法,其特征在于,所述人群數據包括多個個人數據,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,對應個人數據生成個人向量表示的步驟,包括:
3.根據權利要求2所述的方法,其特征在于,為所述初級向量表示,分配表示位置順序的位置向量表示的步驟,包括:
4.根據權利要求1所述的方法,其特征在于,所述指定編碼模型包括線性變換層;所述線性變換層使用低維線性矩陣對經過所述多頭注意力機制處理后的個人向量表示,進行降維處理,得到編碼數據。
5.一種人群數據的解壓方法,其特征在于,所述方法包括:
6.一種人群數據的壓縮存儲裝置,其特征在于,所述人群數據包括多個個人數據,所述壓縮存儲裝置包括:
7.一種人群數據的解壓裝置,其特征在于,所述解壓裝置包括:
8.一種計算機設備,其特征在于,所述計算機設備包括存儲器及處理器,所述存儲器中存儲有至少一條計算機程序,所述至少一條計算機程序由所述處理器加載并執行,以實現如權利要求1至4中任一項所述的方法。
9.一種計算機可讀存儲介質
10.一種計算機程序產品,其特征在于,計算機程序產品用于實現如權利要求1至4中任一項所述的方法。
...【技術特征摘要】
1.一種人群數據的壓縮存儲方法,其特征在于,所述人群數據包括多個個人數據,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,對應個人數據生成個人向量表示的步驟,包括:
3.根據權利要求2所述的方法,其特征在于,為所述初級向量表示,分配表示位置順序的位置向量表示的步驟,包括:
4.根據權利要求1所述的方法,其特征在于,所述指定編碼模型包括線性變換層;所述線性變換層使用低維線性矩陣對經過所述多頭注意力機制處理后的個人向量表示,進行降維處理,得到編碼數據。
5.一種人群數據的解壓方法,其特征在于,所述方法包括:
6.一種人群數據的壓縮存儲裝置,其特征在于,...
【專利技術屬性】
技術研發人員:姜智,楊圣磊,
申請(專利權)人:阿里健康科技中國有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。