一種面向大數據的多范型融合分析處理方法技術

技術編號：15799173 閱讀：286 留言：0更新日期：2017-07-11 13:19

本發明專利技術公開了一種面向大數據的多范型融合分析處理方法，該方法包括以下步驟：數據預處理階段；配置文件階段：數據查詢分析階段；用戶反饋階段。本發明專利技術提出的基于GBase數據庫的大數據多范型融合分析處理是可以有效滿足大數據分析市場需求的解決方案。

Multi paradigm fusion analysis processing method for large data

The invention discloses a multi paradigm for the integration of large data analysis methods, the method comprises the following steps: data preprocessing; configuration file: data query analysis stage; user feedback stage. The method of fusion and analysis of large data and multiple patterns based on GBase database provided by the invention is a solution that can effectively meet the market demand of large data analysis.

全部詳細技術資料下載

【技術實現步驟摘要】
一種面向大數據的多范型融合分析處理方法
本專利技術涉及互聯網
，具體地說，涉及一種面向大數據的多范型融合分析處理方法。
技術介紹
自上世紀90年代萬維網應用普及以來，人類社會每年產生和收集的數據量以驚人的速度增長著。從目前萬維網應用的發展趨勢看，數據增長速率有增無減，已遠超過摩爾定律的增長速率。IDC的調查顯示，從2013開始全球產生的數據量以每年40％的速度增長，到2020年全球數據量將增長為現在的10倍，即44。毋容置疑，這標志著人類早經邁入了“大數據時代”。大數據的特點可概括為：大容量(Volume)、高速率(Velocity)、多樣化(Variety)和總體價值(Value)，即“4個V”。在大數據時代，數據在量上的增長已經產生了質的飛躍，原來很多困難的事情，借助大數據已變成了現實，大數據分析應運而生。大數據分析(BigDataAnalysis)是通過計算工具處理和分析大數據集，從中發現隱藏的模式、未知的關聯、未來的趨勢、用戶的偏好、有用的商業信息等各種新知識。這項技術對于任何企業和組織的發展都是至關重要的，因為它使得大數據成為了推動企業進行科學決策和戰略發展的抓手，將大數據化為了一種與競爭對手比拼的戰略資源。可以預見，在未來十年的時間內，誰成功駕馭了大數據分析的利器，誰就贏得了未來企業競爭的商機，誰就能夠占領行業制高點。傳統關系型數據管理技術雖然經歷了并行化的發展，但在一些特殊的應用場景下，依舊不能滿足大數據的分析任務，在擴展性和適應性上遇到了巨大障礙。大數據分析方法與技術需要解決的矛盾是：如何在盡量短的時間內，處理和分析盡量多的數據以發現...
一種面向大數據的多范型融合分析處理方法

【技術保護點】
一種面向大數據的多范型融合分析處理方法，其特征在于，包括以下步驟：步驟1、數據預處理階段：該階段獨立于以下業務流程階段，是用戶將所需要的數據經過用戶自定義的規則進行數據清理并存入關系數據庫的過程，用戶需記錄該關系數據庫的位置、用戶名、密碼的連接數據庫時所用到基本信息；步驟2、配置文件階段：配置文件分為關系數據庫配置文件和機器學習配置文件，用戶需要在配置文件中按照給出的標簽填寫相應的參數信息，具體的數據庫配置文件中，“configuration”表示配置文件的開始，在“database”標簽內填寫有關數據庫的信息，其中，用戶需要在“url”中指明在步驟1中提到的數據庫的位置信息，“user”表示該數據庫連接時需要用到的用戶名，“password”是該用戶名對應的密碼，“sql”是數據庫查詢語句；具體的機器學習配置文件中，“database”與上述的數據庫配置文件中的相同，“parameter”表示調用的機器學習算法所需的除了輸入參數外的其他參數，“algorithm”表示需要調用的算法名；步驟3、數據查詢分析階段：根據用戶提供的配置文件信息，開始數據庫查詢和機器學習算法調用，除了“Con...

【技術特征摘要】
1.一種面向大數據的多范型融合分析處理方法，其特征在于，包括以下步驟：步驟1、數據預處理階段：該階段獨立于以下業務流程階段，是用戶將所需要的數據經過用戶自定義的規則進行數據清理并存入關系數據庫的過程，用戶需記錄該關系數據庫的位置、用戶名、密碼的連接數據庫時所用到基本信息；步驟2、配置文件階段：配置文件分為關系數據庫配置文件和機器學習配置文件，用戶需要在配置文件中按照給出的標簽填寫相應的參數信息，具體的數據庫配置文件中，“configuration”表示配置文件的開始，在“database”標簽內填寫有關數據庫的信息，其中，用戶需要在“url”中指明在步驟1中提到的數據庫的位置信息，“user”表示該數據庫連接時需要用到的用戶名，“password”是該用戶名對應的密碼，“sql”是數據庫查詢語句；具體的機器學習配置文件中，“datab...

【專利技術屬性】
技術研發人員：張小旺，馮志勇，張嘉慧，
申請(專利權)人：天津大學，
類型：發明
國別省市：天津,12

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術