• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種營商政策系統的構建方案及系統技術方案

    技術編號:37293247 閱讀:31 留言:0更新日期:2023-04-21 03:25
    本發明專利技術涉及一種營商政策系統的構建方案及系統。本發明專利技術基于大數據平臺能力,獲取國內政府網站全部公開政策資訊,多重組合算法區分政策和資訊信息,包括站點算法、板塊算法、鏈接算法、索引算法,融合線下匯編政策,保障數據廣度,同時,構建營商環境知識圖譜,擴展營商環境政策庫識別范圍;另一方面,基于營商環境文本分析模型及知識圖譜,識別分類實體隱性關系及關系的動態變化,精準識別、分類、分析政策,建立特有的政策影響力分析模型,從影響廣度和影響深度2個方向進行深度分析。響深度2個方向進行深度分析。響深度2個方向進行深度分析。

    【技術實現步驟摘要】
    一種營商政策系統的構建方案及系統


    [0001]本專利技術涉及信息處理分析
    ,具體為一種營商政策系統的構建方案及系統。

    技術介紹

    [0002]工作流,是對工作流程及其各操作步驟之間業務規則的抽象、概括描述。工作流建模,即將工作流程中的工作如何前后組織在一起的邏輯和規則,在計算機中以恰當的模型表達并對其實施計算。工作流要解決的主要問題是:為實現某個業務目標,利用計算機在多個參與者之間按某種預定規則自動傳遞文檔、信息或者任務。
    [0003]大數據分析技術主要由五大步驟組成:選擇平臺操作系統、構建Hadoop集群、數據整合和預處理、數據存儲、數據挖掘和分析。其中Hadoop是一個用于存儲和處理大數據的開源框架,存儲空間與處理效率高,適用于批處理操作。同時Spark屬于Hadoop的改進型,適用于流式與交互式數據處理與查詢,實時性強且交互性好。還有較為重要的一個環節便是數據挖掘,它的主要任務包括預測建模、關聯分析、聚類分析、異常檢測等。在這些步驟中,有三個關鍵技術貫通始終:虛擬化(提升存儲空間與資源利用效率),Mapreduce(為大數據平臺提供并行處理的計算模型,更適用于集群平臺高性能計算)和人工智能(輔助分析挖掘)。
    [0004]數據倉庫技術,數據倉庫可分為:操作型數據庫和分析型數據庫。主要由四部分組成:各個數據源單獨的數據庫、數據倉庫技術(ETL)、數據倉庫和前端應用。各類數據在數據倉庫中整理歸納后方可更加快速精準地進行分析預測。
    [0005]工作流能解決政策數據的業務流轉和審批,但是對于新政策的指定并沒有辦法提供有效的參考和分析,無法對已有的政策進行提煉共性,輔助決策新政策的指定。同樣的,大數據技術對于政策信息的采集是有幫助的,采集之后的政策可以按照聚類、去重、降噪等預處理,并進行海量大數據的存儲入庫,但是其缺乏對于政策數據的指標化管理和段邏輯分析,進而無法形成政策影響下的企業精準畫像,沒辦法真正的評估政策的出臺對于營商環境的改善效果。

    技術實現思路

    [0006]鑒于現有技術中所存在的問題,本專利技術公開了一種營商政策系統的構建方案及系統,具體包括:一、算法建模,具體包括:(1)、數據抽?。赫哳愓军c及板塊目前覆蓋了26個省份、67個地級市,共122個政務網站,涉及的板塊數多達3252個,覆蓋了國內大部分主要政務網站的公開政策信息;資訊類站點及板塊,也有74個主要政務資訊站點,涉及458個板塊;在大量的采集數據語料的基礎上,數據入庫的時候會對數據進行數據預處理,包括對文本的分段、分句和詞向量預訓練;首先對政策資訊的原始文本數據進行分段分句操作,知識抽取模型訓練的基礎都以句子為單位處理,并剔除部分臟數據、短句;
    (2)、通用模型抽?。菏褂矛F有的通用實體抽取模型抽取政務輿情數據中的實體,包括發文單位、發文時間、政策類型等;(3)數據標注:確定標注規范,對通過通用實體抽取模型抽取的政策資訊數據進行標注,把標注的數據放入模型進行訓練;目前數源政策分析系統,支持3級營商環境體系,其中一級指標有3個,包括政務環境、法務環境和市場環境;二級指標在一級類目基礎上進行細分,例如開辦企業、辦理建筑許可等;三級指標是對二級指標進行再次細分,現有80多三級營商指標,就開辦企業二級指標,就包括了開辦企業環節、時間、成本、便利度等三級指標;(4)、政策資訊分類模型訓練:在數據標注的基礎上,對詞進行詞向量預訓練,將詞以向量化形式標識;(5)、政策影響力算法模型訓練:在營商環境中,通過算法標注識別,可以得到政策一級營商指標,二級營商指標,三級營商指標;不同的營商環境指標,通過設置不同的權限比重來標識影響深度,通過全面的政策關鍵詞標識政策影響廣度,通過影響深度和影響廣度的配置,加入到影響力模型訓練中,提升政策影響力的準確性;計算模型算法,這里BM25相關度算法的基礎上,結合影響深度和廣度指標,對正文的數據進行影響力計算,計算公式:其中D是指政策資訊文本,Q是指不同營商指標的關鍵詞數據;k通過調整對應的權重比分,使得影響力比分結果;(6)、生成模型:通過一系列模型訓練和調優,得到業務使用的三個模型數據,包括通用模型、政策資訊分類模型、影響力評分模型,供后續的數據處理流程使用;二、數據處理:營商政策數據的數據處理流程,包括數據預處理、實體抽取、關系抽取及后處理:(1)、數據預處理:對輸入的內容中出現的雜聲進行過濾,過濾規則:根據內容去重、根據標題去除雜質、根據內容中時間出現次數去除雜志、根據命中關鍵字進行去重;(2)、實體抽?。焊鶕嶓w通用識別模型,識別內容中出現的政府部門、發文單位、一級營商指標、二級營商指標、三級營商指標,發布地,省級單位;(3)、關系抽?。喊褜嶓w識別抽取到的政府部門、發文單位、一級營商指標、二級營商指標、三級營商指標,發布地,省級單位,分別作為主語,與政策內容一起作為輸入,抽取與該主語有關的謂語和賓語,形成三元組關系;(4)、后處理:將營商環境知識圖譜構建中獲取大量的營商環境實體三元組數據,實現數據到政策知識的轉化,并把這些數據存儲到營商環境的知識圖譜數據庫Neo4j中。
    [0007]作為本專利技術的一種優選方案,所述詞向量預訓練利用word2vec進行,政策資訊分類利用站點算法、板塊算法、鏈接算法對數據集進行模型訓練。
    [0008]本專利技術的有益效果:本專利技術基于大數據平臺能力,獲取國內政府網站全部公開政策資訊,多重組合算法區分政策和資訊信息,包括站點算法、板塊算法、鏈接算法、索引算法,融合線下匯編政策,保障數據廣度,同時,構建營商環境知識圖譜,擴展營商環境政策庫識別范圍;另一方面,基于營商環境文本分析模型及知識圖譜,識別分類實體隱性關系及關
    系的動態變化,精準識別、分類、分析政策,建立特有的政策影響力分析模型,從影響廣度和影響深度2個方向進行深度分析。本專利技術利用知識圖譜平臺,訓練6000多營商環境政策語料,輸出含20000多實體,1000多關系及30000多三元組的營商領域知識圖譜,用于營商環境政策庫識別、段落標注,語料越多,訓練時間越長,識別越準。
    附圖說明
    [0009]圖1為專利技術的政策大數據采集處理流程圖;
    [0010]圖2為專利技術的政策分析系統核心算法數據處理流程圖;
    [0011]圖3為專利技術的政務營商環境標注指標示例圖;
    [0012]圖4為專利技術的政策站點及其板塊標注材料示例圖。
    具體實施方式
    [0013]實施例1
    [0014]如圖1、圖2所示,本專利技術公開了一種營商政策系統的構建方案及系統,具體包括:一、算法建模,具體包括:(1)、數據抽?。赫哳愓军c及板塊目前覆蓋了26個省份、67個地級市,共122個政務網站,涉及的板塊數多達3252個,覆蓋了國內大部分主要政務網站的公開政策信息;資訊類站點及板塊,也有74個主要政務資訊站點,涉及458個板塊;在大量的采集數據語料的基礎上,數據入庫的時候會對數據進行數據預處理,包括對文本的分段、分句和詞向量預訓練;首先對政策資訊的原始文本數據進行分段分句操作,知識抽取模型訓練的基礎都以句子為單位處理,本文檔來自技高網
    ...

    【技術保護點】

    【技術特征摘要】
    1.一種營商政策系統的構建方案及系統,其特征在于,具體包括:一、算法建模,具體包括:(1)數據抽?。簩祿M行數據預處理,包括對文本的分段、分句和詞向量預訓練;首先對政策資訊的原始文本數據進行分段分句操作,知識抽取模型訓練的基礎都以句子為單位處理,并剔除部分臟數據、短句;(2)通用模型抽取:使用現有的通用實體抽取模型抽取政務輿情數據中的實體,包括發文單位、發文時間、政策類型;(3)數據標注:確定標注規范,對通過通用實體抽取模型抽取的政策資訊數據進行標注,把標注的數據放入模型進行訓練;(4)政策資訊分類模型訓練:在數據標注的基礎上,對詞進行詞向量預訓練,將詞以向量化形式標識;(5)政策影響力算法模型訓練:在營商環境中,通過算法標注識別,可以得到政策一級營商指標,二級營商指標,三級營商指標;不同的營商環境指標,通過設置不同的權限比重來標識影響深度,通過全面的政策關鍵詞標識政策影響廣度,通過影響深度和影響廣度的配置,加入到影響力模型訓練中,提升政策影響力的準確性;計算模型算法,這里BM25相關度算法的基礎上,結合影響深度和廣度指標,對正文的數據進行影響力計算,計算公式:其中D是指政策資訊文本,Q是指不同營商指標的關鍵詞數據;k通過調整對應的權重比分,使得影響...

    【專利技術屬性】
    技術研發人員:陳學言,田平,劉源,
    申請(專利權)人:廣東數源智匯科技有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 一本一道av中文字幕无码| 最新中文字幕AV无码不卡| 人妻丰满熟妇AV无码区| 用舌头去添高潮无码视频 | 久久精品无码精品免费专区| 亚洲精品天堂无码中文字幕| 亚洲综合最新无码专区| 亚洲AV永久青草无码精品| 日韩aⅴ人妻无码一区二区| 日韩人妻精品无码一区二区三区| 日韩精品无码人妻免费视频| 无码人妻丰满熟妇区BBBBXXXX | 日韩AV无码久久一区二区| 无码专区一va亚洲v专区在线| 99精品国产在热久久无码| 久久久久亚洲AV无码专区网站| 丰满爆乳无码一区二区三区| 无码人妻精品一区二区三18禁 | 曰韩精品无码一区二区三区| (无码视频)在线观看| 亚洲AV永久无码天堂影院| 秋霞鲁丝片Av无码少妇| 无码一区二区三区视频| 亚洲国产成人片在线观看无码| 中文字幕无码免费久久9一区9| 日韩加勒比一本无码精品| 东京热av人妻无码| 成人免费无码大片A毛片抽搐色欲| 一本色道久久综合无码人妻| 久久午夜无码鲁丝片秋霞| 精品无码人妻一区二区三区品| 日韩精品专区AV无码| 久久精品aⅴ无码中文字字幕不卡 久久精品aⅴ无码中文字字幕重口 | 无码av高潮喷水无码专区线| 久久久久亚洲AV片无码下载蜜桃| 无码国产精品一区二区免费16| 午夜亚洲AV日韩AV无码大全| 日韩人妻无码精品久久久不卡| 久久无码AV一区二区三区| 久久久无码一区二区三区 | 无码av无码天堂资源网|