System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及科學數據處理領域,尤其涉及一種基于多維度大數據篩選分析方法。
技術介紹
1、隨著信息技術的發展,科學數據庫在各個領域的應用越來越廣泛。然而,傳統的科學數據庫檢索方式往往依賴于用戶輸入的檢索式,這種方式的效率和準確性受到了很大的限制。為了解決這個問題,近年來,學者們提出了許多改進的檢索技術,以提高科學數據庫的檢索效率和準確性。為了提高檢索效率,研究者們提出了各種索引技術。例如,b樹索引、b+樹索引、哈希索引等。這些索引技術通過對科學數據進行預處理和排序,使得科學數據能夠更快地被檢索。此外,還有一些新興的索引技術,如倒排索引、布隆過濾器等,它們在不同的應用場景下表現出了優秀的性能。
2、然而,其本質還是依賴于檢索式本身,因此如何降低科學數據檢索的復雜性,以及提高其科學數據匹配準確性是目前研究的熱點問題。
技術實現思路
1、本申請實施例提供一種基于多維度大數據篩選分析方法,用實現降低科學數據檢索的復雜性的同時,提高其科學數據匹配準確性。
2、為達到上述目的,本申請采用如下技術方案:
3、第一方面,提供一種基于多維度大數據篩選分析方法,應用于電子設備,該方法包括:步驟s1:響應于用戶的檢索操作,電子設備獲取待分析的科學數據檢索式;步驟s2:電子設備通過多維度科學數據匹配,從科學數據檢索式庫中確定與待分析的科學數據檢索式匹配的科學數據檢索式,科學數據檢索式庫中科學數據檢索式為有對應的科學數據檢索結果的檢索式;步驟s3:電子設備輸出匹配的科學數據檢
4、一種可能的設計方案中,電子設備通過多維度科學數據匹配,從科學數據檢索式庫中確定與待分析的科學數據檢索式匹配的科學數據檢索式,包括:電子設備將科學數據表達結構的待分析的科學數據檢索式,轉換為矩陣表達結構的待分析的科學數據矩陣;電子設備對待分析的科學數據矩陣進行多維度科學數據匹配,從科學數據檢索式庫中確定與待分析的科學數據矩陣匹配的科學數據矩陣,矩陣表達結構的匹配的科學數據矩陣的科學數據表達結構即為匹配的科學數據檢索式。
5、可選地,待分析的科學數據矩陣為由0和1構成的基矩陣,電子設備對待分析的科學數據矩陣進行多維度科學數據匹配,從科學數據檢索式庫中確定與待分析的科學數據矩陣匹配的科學數據矩陣,包括:電子設備使用多維的酉矩陣對待分析的科學數據矩陣進行擴展運算,得到多維度的待分析科學數據矩陣;電子設備確定多維度的待分析科學數據矩陣中的每列與科學數據檢索式庫中的科學數據矩陣的每列的內積,并將科學數據檢索式庫中內積之和的科學數據矩陣確定為匹配的科學數據矩陣。
6、可選地,多維的酉矩陣為多維的dft矩陣,多維的dft矩陣的維度與步驟s2被輪訓執行的次數正相關;
7、多維的酉矩陣為3維dft矩陣,3維dft矩陣表示為如下:;
8、或者,多維的酉矩陣為4維dft矩陣,4維dft矩陣表示為如下:。
9、可選地,使用多維的酉矩陣對待分析的科學數據矩陣進行擴展運算是指:通過多維的酉矩陣,將待分析的科學數據矩陣的每列擴展到與多維的酉矩陣的列數相同,即多維度的待分析科學數據矩陣的列數是多維的酉矩陣與待分析的科學數據矩陣的列數之積。
10、可選地,多維度的待分析科學數據矩陣為的矩陣,科學數據檢索式庫中的第k個科學數據矩陣為,k為正整數,多維度的待分析科學數據矩陣中的第i列與第k個科學數據矩陣中第j列的內積為,i為取1至n的整數,j為取1至pk的整數;
11、在此基礎上,多維度的待分析科學數據矩陣與第k個科學數據矩陣的內積之和為:。
12、可選地,電子設備將科學數據表達結構的待分析的科學數據檢索式,轉換為矩陣表達結構的待分析的科學數據矩陣,包括:電子設備對待分析的科學數據檢索式進行獨熱編碼,得到待分析的科學數據檢索式的由0和1構成的字符串表達式,字符串表達式的長度為l;電子設備按預設取值為m將字符串表達式截取為z段,并將z段中的每段構造為矩陣的一列,得到待分析的科學數據矩陣,z為round(l/m),round()表示向上取整;其中,若z段中的最后一段在截取時的長度不足m,則電子設備通過在最后一段的段末填充0/1的方式,將最后一段的長度填充到m。
13、進一步的,電子設備按預設取值為m將字符串表達式截取為z段,并將z段中的每段構造為矩陣的一列,得到待分析的科學數據矩陣,包括:電子設備按預設取值為m將字符串表達式截取為z段;電子設備確定z段中是否有取值相同的重復段落;若z段中沒有取值相同的重復段落,則電子設備將z段中的每段構造為矩陣的一列,得到待分析的科學數據矩陣,待分析的科學數據矩陣為的矩陣;或者,若z段中有x段取值相同的重復段落,則電子設備將x段從z段中刪除,得到z-x段,并將z-x段中的每段構造為矩陣的一列,得到待分析的科學數據矩陣,待分析的科學數據矩陣為的矩陣。
14、一種可能的設計方案中,科學數據檢索結果包括如下至少一項:地球科學類科學數據、微生物學科學數據、基因組學科學數據、化學科學數據、動物學科學數據、農業科學數據、空間科學數據、基礎醫學科學數據、植物學科學數據、生態學科學數據、林業科學數據、物理學科學數據、或天文學科學數據。
15、第二方面,提供一種基于多維度大科學數據篩選分析裝置,應用于電子設備,裝置被配置為:步驟s1:響應于用戶的檢索操作,電子設備獲取待分析的科學數據檢索式;步驟s2:電子設備通過多維度科學數據匹配,從科學數據檢索式庫中確定與待分析的科學數據檢索式匹配的科學數據檢索式,科學數據檢索式庫中科學數據檢索式為有對應的科學數據檢索結果的檢索式;步驟s3:電子設備輸出匹配的科學數據檢索式對應的科學數據檢索結果,或者響應于用戶的拒絕操作,電子設備返回迭代執行步驟s2,輸出科學數據檢索結果或者迭代到預設次數。
16、一種可能的設計方案中,電子設備通過多維度科學數據匹配,從科學數據檢索式庫中確定與待分析的科學數據檢索式匹配的科學數據檢索式,包括:電子設備將科學數據表達結構的待分析的科學數據檢索式,轉換為矩陣表達結構的待分析的科學數據矩陣;電子設備對待分析的科學數據矩陣進行多維度科學數據匹配,從科學數據檢索式庫中確定與待分析的科學數據矩陣匹配的科學數據矩陣,矩陣表達結構的匹配的科學數據矩陣的科學數據表達結構即為匹配的科學數據檢索式。
17、可選地,待分析的科學數據矩陣為由0和1構成的基矩陣,電子設備對待分析的科學數據矩陣進行多維度科學數據匹配,從科學數據檢索式庫中確定與待分析的科學數據矩陣匹配的科學數據矩陣,包括:電子設備使用多維的酉矩陣對待分析的科學數據矩陣進行擴展運算,得到多維度的待分析科學數據矩陣;電子設備確定多維度的待分析科學數據矩陣中的每列與科學數據檢索式庫中的科學數據矩陣的每列的內積,并將科學數據檢索式庫中內積之和的科學數據矩陣確定為匹配的科本文檔來自技高網...
【技術保護點】
1.一種基于多維度大數據篩選分析方法,其特征在于,應用于電子設備,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述電子設備通過多維度科學數據匹配,從科學數據檢索式庫中確定與所述待分析的科學數據檢索式匹配的科學數據檢索式,包括:
3.根據權利要求2所述的方法,其特征在于,所述待分析的科學數據矩陣為由0和1構成的基矩陣,所述電子設備對所述待分析的科學數據矩陣進行多維度科學數據匹配,從所述科學數據檢索式庫中確定與所述待分析的科學數據矩陣匹配的科學數據矩陣,包括:
4.根據權利要求3所述的方法,其特征在于,所述多維的酉矩陣為所述多維的DFT矩陣,所述多維的DFT矩陣的維度與所述步驟S2被輪訓執行的次數正相關;
5.根據權利要求3或4所述的方法,其特征在于,使用多維的酉矩陣對所述待分析的科學數據矩陣進行擴展運算是指:通過所述多維的酉矩陣,將所述待分析的科學數據矩陣的每列擴展到與所述多維的酉矩陣的列數相同,即所述多維度的待分析科學數據矩陣的列數是所述多維的酉矩陣與所述待分析的科學數據矩陣的列數之積。
6.根據權利要求3
7.根據權利要求2所述的方法,其特征在于,所述電子設備將科學數據表達結構的所述待分析的科學數據檢索式,轉換為矩陣表達結構的待分析的科學數據矩陣,包括:
8.根據權利要求7所述的方法,其特征在于,所述電子設備按預設取值為M將所述字符串表達式截取為Z段,并將所述Z段中的每段構造為矩陣的一列,得到所述待分析的科學數據矩陣,包括:
9.根據權利要求1所述的方法,其特征在于,所述科學數據檢索結果包括如下至少一項:地球科學類科學數據、微生物學科學數據、基因組學科學數據、化學科學數據、動物學科學數據、農業科學數據、空間科學數據、基礎醫學科學數據、植物學科學數據、生態學科學數據、林業科學數據、物理學科學數據、或天文學科學數據。
10.一種基于多維度大科學數據篩選分析裝置,其特征在于,應用于電子設備,所述裝置被配置為:
...【技術特征摘要】
1.一種基于多維度大數據篩選分析方法,其特征在于,應用于電子設備,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述電子設備通過多維度科學數據匹配,從科學數據檢索式庫中確定與所述待分析的科學數據檢索式匹配的科學數據檢索式,包括:
3.根據權利要求2所述的方法,其特征在于,所述待分析的科學數據矩陣為由0和1構成的基矩陣,所述電子設備對所述待分析的科學數據矩陣進行多維度科學數據匹配,從所述科學數據檢索式庫中確定與所述待分析的科學數據矩陣匹配的科學數據矩陣,包括:
4.根據權利要求3所述的方法,其特征在于,所述多維的酉矩陣為所述多維的dft矩陣,所述多維的dft矩陣的維度與所述步驟s2被輪訓執行的次數正相關;
5.根據權利要求3或4所述的方法,其特征在于,使用多維的酉矩陣對所述待分析的科學數據矩陣進行擴展運算是指:通過所述多維的酉矩陣,將所述待分析的科學數據矩陣的每列擴展到與所述多維的酉矩陣的列數相同,即所述多維度的待分析科學數據矩陣的列數是所述多維的酉矩陣與所述待分析的科學數據矩陣的列數之積。
6.根據權利要求3或4所述...
【專利技術屬性】
技術研發人員:羅俊博,陳樹敏,李莎,薛露,方少亮,何碩楠,鄭偉鴻,林珠,
申請(專利權)人:廣東省科技基礎條件平臺中心,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。