一種大數據開發與運行方法及系統技術方案

技術編號：15298241 閱讀：103 留言：0更新日期：2017-05-11 22:58

本發明專利技術涉及一種大數據開發與運行方法及系統，其中的方法包括：擴展大數據計算處理流程，形成大數據處理流程的集成環境；基于所述集成環境，獲取用戶定制的大數據處理流程；上傳所述定制的大數據處理流程，調度運行所述上傳的大數據處理流程，并顯示運行結果。其抽象了大數據應用開發的流程，將大數據應用開發流程集成在一起，方便用戶自行定制大數據處理流程，提高了工作效率，達到降低大數據應用門檻、降低生產成本的目標。

Large data development and operation method and system

The invention relates to a method and system for data development and operation, the method includes: extended data calculation process, the formation of integrated environment data processing; the integrated environment based on large data acquisition, customized processing; data uploading the making process of big data scheduling run the upload process and display the results. The abstract data application development process, the big data application development process are integrated together to facilitate users to customize the data processing flow, improve work efficiency, reduce the data application threshold, reducing the production cost target.

全部詳細技術資料下載

【技術實現步驟摘要】

本專利技術涉及數據處理領域，尤其涉及一種大數據開發與運行方法及系統。
技術介紹
目前，各公司、單位通常基于開源或商業的大數據基礎平臺進行大數據應用開發，這些開源或商業的大數據基礎平臺通常對Hadoop、Spark體系平臺進行了定制、封裝和集成。在此基礎上進行大數據開發時，通常在本地完成程序的開發和編譯，隨后上傳到上述平臺運行。此種方式中的所有運行、調度等工作都需要自寫代碼完成，其大致流程如圖1所示，首先，開發人員在本地計算機進行大數據應用開發，并編譯成在大數據平臺運行的目標文件；操作人員將目標文件上傳到大數據平臺，并使用命令行提交到大數據平臺運行；運行成功結束或失敗后，操作人員檢查運行結果、日志。如運行結果與預想的不一致，則開發人員還需要再修改、編譯代碼。然后再重復上述過程。現有大數據平臺是通常只是大數據運行Hadoop、Spark框架和組件的堆砌，相關通常直接基于上述底層的組件進行開發和運行，在諸多方面具有不足，大致有以下幾種缺點：1、大數據應用門檻高大數據運行Hadoop、Spark框架包含程序組件有上百個之多，開發人員、運維人員學習這些框架的曲線非常陡峭。另外，人才市場也缺少具有這些技能的開發人員與運維人員。基于以上原因，企業要在現有大數據平臺上開展大數據應用，門檻非常高。2、生產效率低下從上面描述的生產過程可知，在現有大數據平臺上開展大數據應用的幾個步驟是完全割裂的。在實際的工作中往往需要反復執行上述步驟，割裂的步驟導致低下的生產效率。3、生產成本高開展大數據應用的高門檻、生產效率的低下，導致企業或單位開展大數據應用的成本極高，嚴重阻礙了大數據行...
一種大數據開發與運行方法及系統

【技術保護點】
一種大數據開發與運行方法，其特征在于，包括：擴展大數據計算處理流程，形成大數據處理流程的集成環境；基于所述集成環境，獲取用戶定制的大數據處理流程；上傳所述定制的大數據處理流程，調度運行所述上傳的大數據處理流程，并顯示運行結果。

【技術特征摘要】
1.一種大數據開發與運行方法，其特征在于，包括：擴展大數據計算處理流程，形成大數據處理流程的集成環境；基于所述集成環境，獲取用戶定制的大數據處理流程；上傳所述定制的大數據處理流程，調度運行所述上傳的大數據處理流程，并顯示運行結果。2.根據權利要求1所述的大數據開發與運行方法，其特征在于，用戶根據所述運行結果，與其期望運行結果進行對比，如果所述運行結果與其期望運行結果不同，則重新定制新的大數據處理流程。3.根據權利要求1所述的大數據開發與運行方法，其特征在于，所述擴展大數據計算處理流程，形成大數據處理流程的集成環境的步驟包括數據采集的擴展、數據存儲的擴展、數據處理的擴展和數據分享的擴展。4.根據權利要求3所述的大數據開發與運行方法，其特征在于，所述數據采集的擴展包括歷史數據的采集和實時數據的采集，采集的數據類型包括結構化數據、半結構化數據和非結構化數據。5.根據權利要求3或4所述的大數據開發與運行方法，其特征在于，所述數據存儲的擴展包括存儲結構化數據的關系型數據存儲和支持存儲半結構化數據和非結構化數據的非關系型數據存儲。6.根據權利要求3或4所述的大數據開發與運行方法，其特征在于，所述數據處理的擴展包括SQL處理、通用算法處理及利用用戶開發的處理程序的處理；所述數據分享的擴展包括數據的批量輸出、實時輸出和外部高并發訪問。7.一種大數據開發與運行系統，其特征在于，包括：處理流程集成模塊，用于集成擴展后的大數據計算處理流程；獲取模塊，用于獲取用戶定制的大數據處理流程；上傳模塊，用于將定制的大數據處理流程上傳至大數...

【專利技術屬性】
技術研發人員：黃超，曹正鳳，張祺君，郜義浩，邊海葉，
申請(專利權)人：北京云星宇交通科技股份有限公司，北京博宇通達科技有限公司，
類型：發明
國別省市：北京;11

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術