System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及數據處理,具體涉及一種數據提取分析處理方法及系統。
技術介紹
1、在國際投資領域,跨國公司需對潛在投資國家的投資環境數據進行系統評估,以確保選擇理想的投資目的地。同時,為了吸引外國直接投資,東道國需要根據投資環境數據評價的關鍵要素來采取相應措施以改善其投資環境。然而,投資環境數據十分復雜,不僅包含硬環境和軟環境方面的諸多因素,還涉及經濟、自然、社會等多個維度的大量數據。這些數據紛繁復雜,使得分析處理變得相當困難。如何高效且精確地提取這些數據并進行深入的分析處理成為了一個亟待解決的問題。
2、盡管國際上已有眾多機構對國家投資環境數據進行了深入研究,但目前仍然缺乏一種專門針對礦業投資環境數據進行有效提取的方法,以確保數據的全面性和準確性,并能對數據進行精確篩選和高效處理。因此,本申請提出了一種礦業投資環境數據評價方法,該方法在精準性、時效性和實踐性方面均表現突出,對于指導跨國公司的礦業投資決策具有非常重要的意義。
技術實現思路
1、為解決上述問題,本專利技術公開了一種數據提取分析處理方法及系統。
2、在一方面,本申請提供了一種數據提取分析處理方法,包括以下步驟:
3、確定評價對象,獲取該評價對象對應的多源數據;
4、對所述多源數據進行標準化預處理,生成待評價標準數據集;
5、將所述待評價標準數據集輸入第一預設評價模型和第二預設評價模型,分別計算生成對應的第一評價結論和第二評價結論;
6、將第一評價結論
7、將所述多源數據歸類至對應的原始數據集,確定數據集中的最小值和最大值;
8、對所述原始數據集中的各個數據點應用線性變換,將原始數據值映射到0-100的范圍內,得到標準化后的值;
9、使用標準化后的值更新原始數據集或創建一個新的數據集,以得到待評價標準數據集;
10、建立待評價標準數據集與原始數據集的對應關系。
11、其中,所述第一預設評價模型與所述第二預設評價模型構成互補關系,其中,所述第一預設評價模型基于定性數據訓練得到,所述第二預設評價模型基于定量數據訓練得到。
12、進一步地,所述第一預設評價模型的輸入數據為轉化后的定量數據,所述轉化后的定量數據進一步根據預設的權重指標生成。
13、上述標準化預處理的方法進一步包括:
14、對所述評價對象分別建立多源數據對應的更新數據集和驗證數據集;
15、計算所述更新數據集和驗證數據集的數據差異值;
16、判斷所述數據差異值是否在預設采集數據誤差范圍內,若是,則對所述多源數據進行標準化預處理;否則,輸出采集數據異常提醒,并執行人工確認步驟。
17、具體的,所述驗證數據集包括歷史數據集和第三方來源數據集,所述第三方來源數據集與所述更新數據集的地理區域不同。
18、其中,所述歷史數據集中的數據以密文方式存儲,加密所述歷史數據集時包括以下步驟:
19、將待加密的歷史數據分割成多個固定大小的分片;
20、通過隨機數生成器生成一個隨機排列序列;
21、根據所述隨機排列序列為每個分片生成一個唯一的隨機數標記;
22、為各分片生成對應的加密密鑰,建立加密密鑰與分片對應的隨機數標記的映射關系;
23、使用生成的加密密鑰加密對應的分片,以得到歷史數據集密文。
24、在具體的方案中,標記所述分片時包括以下步驟:
25、按位依次從所述隨機排列序列中選取對應長度的隨機數片段;
26、對應分片順序為依次為各分片分配對應的隨機數片段,其中,所述各分片對應的隨機數片段長度依次遞增。
27、在另一方面,本申請還提供了一種數據提取分析處理系統,該系統具體包括:
28、數據獲取模塊,用于確定評價對象,并獲取該評價對象對應的多源數據;
29、預處理模塊,用于對所述多源數據進行標準化預處理,生成待評價標準數據;
30、初始評價模塊,包括第一預設評價模型和第二預設評價模型,用于向第一預設評價模型和第二預設評價模型分別輸入待評價標準數據集,計算生成對應的第一評價結論和第二評價結論;
31、結果處理模塊,用于將第一評價結論和第二評價結論輸入至第三模型生成最終評價結果;
32、此外,所述系統進一步包括:加密模塊,用于將歷史數據集中的數據以密文方式存儲,并標記所述分片,為各分片生成對應的加密密鑰,建立加密密鑰與分片對應的隨機數標記的映射關系,并使用生成的加密密鑰加密對應的分片,以得到歷史數據集密文。
33、本申請的方案,在數據處理時,首先,從多個來源獲取與評價對象相關的數據,實現了多源數據的有效整合,進而提高了數據的全面性和豐富度;其次,通過對這些多源數據進行標準化預處理,以生成待評價標準數據集,有效消除了數據間的差異性和不規則性,從而提升了數據的可比性和準確性;此外,本方法采用了雙重評價模型,即第一預設評價模型和第二預設評價模型,對待評價標準數據集進行并行處理,分別得出了第一評價結論和第二評價結論,這種雙模型驗證的方式顯著增強了評價結論數據的可靠性。
本文檔來自技高網...【技術保護點】
1.一種數據提取分析處理方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的方法,其特征在于,所述標準化預處理的方法包括:
3.根據權利要求2所述的方法,其特征在于,所述第一預設評價模型與所述第二預設評價模型構成互補關系,其中,所述第一預設評價模型基于定性數據訓練得到,所述第二預設評價模型基于定量數據訓練得到。
4.根據權利要求3所述的方法,其特征在于,所述第一預設評價模型的輸入數據為轉化后的定量數據,所述轉化后的定量數據進一步根據預設的權重指標生成。
5.根據權利要求4所述的方法,其特征在于,所述標準化預處理的方法進一步包括:
6.根據權利要求5所述的方法,其特征在于,所述驗證數據集包括歷史數據集和第三方來源數據集,所述第三方來源數據集與所述更新數據集的地理區域不同。
7.根據權利要求6所述的方法,其特征在于,所述歷史數據集中的數據以密文方式存儲,加密所述歷史數據集時包括以下步驟:
8.根據權利要求7所述的方法,其特征在于,標記所述分片時包括以下步驟:
9.一種數據提取分析處理
10.根據權利要求9所述的系統,其特征在于,所述系統進一步包括:加密模塊,用于將歷史數據集中的數據以密文方式存儲,并標記所述分片,為各分片生成對應的加密密鑰,建立加密密鑰與分片對應的隨機數標記的映射關系,并使用生成的加密密鑰加密對應的分片,以得到歷史數據集密文。
...【技術特征摘要】
1.一種數據提取分析處理方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的方法,其特征在于,所述標準化預處理的方法包括:
3.根據權利要求2所述的方法,其特征在于,所述第一預設評價模型與所述第二預設評價模型構成互補關系,其中,所述第一預設評價模型基于定性數據訓練得到,所述第二預設評價模型基于定量數據訓練得到。
4.根據權利要求3所述的方法,其特征在于,所述第一預設評價模型的輸入數據為轉化后的定量數據,所述轉化后的定量數據進一步根據預設的權重指標生成。
5.根據權利要求4所述的方法,其特征在于,所述標準化預處理的方法進一步包括:
6.根據權利要求5所述的方法,其特征在于,所述...
【專利技術屬性】
技術研發人員:張偉波,王靚靚,于瑞,何學洲,陳秀法,黃霞,張潮,趙東杰,
申請(專利權)人:中國地質調查局發展研究中心,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。