• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種非結(jié)構(gòu)信息處理與資源管理系統(tǒng)技術(shù)方案

    技術(shù)編號:20622562 閱讀:36 留言:0更新日期:2019-03-20 14:25
    本發(fā)明專利技術(shù)屬于非結(jié)構(gòu)信息與資源處理技術(shù)領(lǐng)域,尤其涉及一種非結(jié)構(gòu)信息處理與資源管理系統(tǒng)。本發(fā)明專利技術(shù)利用自定義的處理策略以及規(guī)則處理方案,形成了靈活快捷的數(shù)據(jù)采集和處理方案,同時能夠?qū)Ψ墙Y(jié)構(gòu)性信息數(shù)據(jù)進(jìn)行有效分析處理;能夠有效降低用戶學(xué)習(xí)使用的成本,提高非結(jié)構(gòu)性信息數(shù)據(jù)處理效率。

    A Non-structural Information Processing and Resource Management System

    The invention belongs to the technical field of non-structural information and resource processing, in particular to a non-structural information processing and resource management system. By using self-defined processing strategy and rule processing scheme, the invention has formed a flexible and fast data acquisition and processing scheme, and can effectively analyze and process non-structural information data, effectively reduce the cost of user learning and use, and improve the efficiency of data processing of non-structural information.

    【技術(shù)實現(xiàn)步驟摘要】
    一種非結(jié)構(gòu)信息處理與資源管理系統(tǒng)
    本專利技術(shù)屬于非結(jié)構(gòu)信息與資源處理
    ,尤其涉及一種非結(jié)構(gòu)信息處理與資源管理系統(tǒng)。
    技術(shù)介紹
    隨著社會經(jīng)濟(jì)的發(fā)展,人們需要面對越來越龐大的數(shù)據(jù)處理需求,而信息技術(shù)以及自動化控制技術(shù)的應(yīng)用,大大提高實際工作生活中規(guī)劃和管理的效率,相對而言,傳統(tǒng)的生產(chǎn)加工活動主要涉及的是常規(guī)數(shù)據(jù)、表格等結(jié)構(gòu)性數(shù)據(jù),由于這些數(shù)據(jù)具有規(guī)范性的書寫方式以及特定的數(shù)據(jù)存儲點,能夠方便的應(yīng)用自動分析技術(shù)抽取和分類這些結(jié)構(gòu)性信息數(shù)據(jù),對結(jié)構(gòu)性信息數(shù)據(jù)的處理以及研究也是數(shù)據(jù)處理中的主要部分。但另一方面,隨著人們經(jīng)濟(jì)生活的提高,社會對精神生活以及文化生活的重視程度也越來越高,大到整個城市間的文化生活的規(guī)劃,小到街道區(qū)域的小型文化活動,其數(shù)量以及體量也不斷增大,這一方面得益于文化藝術(shù)的發(fā)展繁榮,也少不了相應(yīng)的規(guī)劃分析工作,與傳統(tǒng)生活工作不同,文化類等特殊類活動除了少部分涉及具體的時間數(shù)量之外,還包含有大量的非結(jié)構(gòu)性信息數(shù)據(jù),特別是在用于效果的規(guī)劃預(yù)期,質(zhì)量的評估分析等內(nèi)容時,由于個體的片面性,需要從大批量的人群中收集相應(yīng)的數(shù)據(jù)信息進(jìn)行綜合評價,而這些評價分析數(shù)據(jù)基本都是體量以及數(shù)量不等的非結(jié)構(gòu)性數(shù)據(jù)信息,這些非結(jié)構(gòu)性信息數(shù)據(jù)由于受到個體語言特點以及自身理解的差異,難以有效的進(jìn)行統(tǒng)一和處理,這為上述工作生活內(nèi)容的有效執(zhí)行帶來了困難。
    技術(shù)實現(xiàn)思路
    本專利技術(shù)創(chuàng)造的目的在于,提供一種能夠更方便的處理非結(jié)構(gòu)性信息數(shù)據(jù),以提高非結(jié)構(gòu)性信息數(shù)據(jù)的處理效率,降低工作難度的非結(jié)構(gòu)信息處理與資源管理系統(tǒng)。為實現(xiàn)上述目的,本專利技術(shù)創(chuàng)造采用如下技術(shù)方案。一種非結(jié)構(gòu)信息處理與資源管理系統(tǒng),由信息管理模塊、信息處理模塊以及數(shù)據(jù)采集模塊構(gòu)成;信息管理模塊,包括用于實現(xiàn)詞庫管理操作以實現(xiàn)詞庫的快速更新,包括修改、增刪、檢索詞語的詞庫控件;用于實現(xiàn)數(shù)據(jù)源的增刪查找的數(shù)據(jù)源控件;用于設(shè)置不同分類規(guī)則以對信息進(jìn)行分類,包括增刪、修改和查找規(guī)則的規(guī)則控件;用于配置文本分析功能,根據(jù)分詞或者其他策略的組合形成或者修改信息處理的策略模式的策略控件;用于根據(jù)數(shù)據(jù)源以及策略配置,建立新的任務(wù),并調(diào)用相應(yīng)的數(shù)據(jù)源以及策略模型,對數(shù)據(jù)源進(jìn)行相應(yīng)的策略處理,并輸出相應(yīng)的數(shù)據(jù)結(jié)果的任務(wù)控件;信息處理模塊,包括用于對信息進(jìn)行自動分詞,并完成關(guān)鍵信息提取的提取控件;用于完成文本轉(zhuǎn)換、聚類以及對比的處理控件;提取控件采用規(guī)則匹配以及模型匹配對文本信息進(jìn)行自動分詞處理,并對詞語進(jìn)行詞性標(biāo)注,同時提取文本的關(guān)鍵字詞和關(guān)鍵句作為摘要以便于快速閱覽;處理控件還用于根據(jù)用戶輸入的路徑錄入信息文件,并根據(jù)操作歷史形成日志文件;日志文件用于支持文件的持續(xù)更新讀取等;在具體實施過程中,各處理控件表現(xiàn)為可編輯的下拉窗口或者鏈接至相應(yīng)數(shù)據(jù)庫的超文本編輯欄;分詞處理還包括將信息數(shù)據(jù)中的文本進(jìn)行分割處理,以將其劃分為一個或者多個具有完整語義的字詞單元,同時根據(jù)自定義或者用戶輸入或者調(diào)取頻率進(jìn)行優(yōu)先級提取,以便于優(yōu)先獲取高頻的關(guān)鍵詞,快速形成關(guān)鍵詞摘要;以及,基于規(guī)則處理以及統(tǒng)計方法相結(jié)合,從非結(jié)構(gòu)信息中獲取特定的地名、人名、號碼等實體數(shù)據(jù);數(shù)據(jù)采集模塊,包括用于從數(shù)據(jù)源中采集數(shù)據(jù),調(diào)用文本分析服務(wù)器相應(yīng)的服務(wù)對數(shù)據(jù)進(jìn)行自動處理,并將數(shù)據(jù)處理結(jié)果進(jìn)行存儲的數(shù)據(jù)采集控件;以及,用于利用規(guī)范性數(shù)據(jù)文件對數(shù)據(jù)信息進(jìn)行修正和補(bǔ)充,或者進(jìn)行定義數(shù)據(jù)的錄入和修正;以實現(xiàn)對已采集數(shù)據(jù)進(jìn)行定義的數(shù)據(jù)定義控件。對上述方案的進(jìn)一步優(yōu)化還包括,任務(wù)包括對同一個數(shù)據(jù)源進(jìn)行多個策略處理的組合,通常包含有多個批量或者連續(xù)性的文件操作內(nèi)容,即一般情況下某一項或者多項任務(wù)會與該任務(wù)相應(yīng)的數(shù)據(jù)源進(jìn)行綁定,對數(shù)據(jù)源進(jìn)行單一或者多路策略處理;在任務(wù)管理過程中,任務(wù)控制器控制液面與業(yè)務(wù)的交互內(nèi)容,執(zhí)行策略處理的具體內(nèi)容并返回結(jié)果。對上述方案的進(jìn)一步優(yōu)化還包括,詞庫控件還用于根據(jù)用戶的需求和設(shè)置添加新的空白詞庫,并對詞庫內(nèi)字詞進(jìn)行編輯;還用于根據(jù)用戶指定目錄利用規(guī)范文件錄入或生成已有詞庫數(shù)據(jù);還用于對已生成的詞庫進(jìn)行打包編輯以導(dǎo)出生成規(guī)范的詞庫文件;還用于控制詞庫數(shù)據(jù)的啟用和停用,以控制詞庫的可用狀態(tài);在具體實施過程中,信息模塊中各控件表現(xiàn)為可編輯的框體或者按鈕;具體而言,詞庫控件根據(jù)用戶需求進(jìn)行分壓查詢以及查詢結(jié)果的顯示,之后通過用戶的輸入調(diào)用文本控制器分別生成新的詞庫和錄入;在生成過程中調(diào)用函數(shù)查詢詞庫存在狀態(tài),當(dāng)詞庫存在時,采用默認(rèn)循環(huán)追加后綴或者主動命名的方式生成新詞庫的名稱,再對詞庫進(jìn)行操作之前也會對相應(yīng)的詞庫進(jìn)行檢索以確認(rèn)狀態(tài)。對上述方案的進(jìn)一步優(yōu)化還包括,所述規(guī)范性數(shù)據(jù)文件是指含有基礎(chǔ)數(shù)據(jù)信息以及詞性、詞頻等信息;用于后序?qū)Ψ墙Y(jié)構(gòu)性數(shù)據(jù)進(jìn)行分析處理的補(bǔ)充數(shù)據(jù)。對上述方案的進(jìn)一步優(yōu)化還包括,詞庫控件表現(xiàn)為可編輯的表格或者窗口,表格欄或者窗口區(qū)中可直接調(diào)用文本編輯器。其有益效果在于:本專利技術(shù)利用自定義的處理策略以及規(guī)則處理方案,形成了靈活快捷的數(shù)據(jù)采集和處理方案,同時能夠?qū)Ψ墙Y(jié)構(gòu)性信息數(shù)據(jù)進(jìn)行有效分析處理;能夠有效降低用戶學(xué)習(xí)使用的成本,提高非結(jié)構(gòu)性信息數(shù)據(jù)處理效率。附圖說明圖1是本專利技術(shù)的一種非結(jié)構(gòu)信息處理與資源管理系統(tǒng)的框架圖;圖2是實施例中處理控件的流程示意圖。具體實施方式以下結(jié)合具體實施例對本專利技術(shù)創(chuàng)造作詳細(xì)說明。本專利技術(shù)的一種非結(jié)構(gòu)信息處理與資源管理系統(tǒng);由信息管理模塊、信息處理模塊以及數(shù)據(jù)采集模塊構(gòu)成。信息管理模塊,包括用于實現(xiàn)詞庫管理操作以實現(xiàn)詞庫的快速更新,包括修改、增刪、檢索詞語的詞庫控件;用于實現(xiàn)數(shù)據(jù)源的增刪查找的數(shù)據(jù)源控件;用于設(shè)置不同分類規(guī)則以對信息進(jìn)行分類,包括增刪、修改和查找規(guī)則的規(guī)則控件;用于配置文本分析功能,根據(jù)分詞或者其他策略的組合形成或者修改信息處理的策略模式的策略控件;用于根據(jù)數(shù)據(jù)源以及策略配置,建立新的任務(wù),并調(diào)用相應(yīng)的數(shù)據(jù)源以及策略模型,對數(shù)據(jù)源進(jìn)行相應(yīng)的策略處理,并輸出相應(yīng)的數(shù)據(jù)結(jié)果的任務(wù)控件。其中,任務(wù)是指對同一個數(shù)據(jù)源進(jìn)行多個策略處理的組合,通常包含有多個批量或者連續(xù)性的文件操作內(nèi)容,即一般情況下某一項或者多項任務(wù)會與該任務(wù)相應(yīng)的數(shù)據(jù)源進(jìn)行綁定,對數(shù)據(jù)源進(jìn)行單一或者多路策略處理;在任務(wù)管理過程中,任務(wù)控制器控制液面與業(yè)務(wù)的交互內(nèi)容,執(zhí)行策略處理的具體內(nèi)容并返回結(jié)果。其中,詞庫控件還用于根據(jù)用戶的需求和設(shè)置添加新的空白詞庫,并對詞庫內(nèi)字詞進(jìn)行編輯;還用于根據(jù)用戶指定目錄利用規(guī)范文件錄入或生成已有詞庫數(shù)據(jù);還用于對已生成的詞庫進(jìn)行打包編輯以導(dǎo)出生成規(guī)范的詞庫文件;還用于控制詞庫數(shù)據(jù)的啟用和停用,以控制詞庫的可用狀態(tài);在具體實施過程中,信息模塊中各控件表現(xiàn)為可編輯的框體或者按鈕;具體而言,詞庫控件根據(jù)用戶需求進(jìn)行分壓查詢以及查詢結(jié)果的顯示,之后通過用戶的輸入調(diào)用文本控制器分別生成新的詞庫和錄入;在生成過程中調(diào)用函數(shù)查詢詞庫存在狀態(tài),當(dāng)詞庫存在時,采用默認(rèn)循環(huán)追加后綴或者主動命名的方式生成新詞庫的名稱,再對詞庫進(jìn)行操作之前也會對相應(yīng)的詞庫進(jìn)行檢索以確認(rèn)狀態(tài);具體實施過程中,詞庫控件表現(xiàn)為可編輯的表格或者窗口,表格欄或者窗口區(qū)中可直接調(diào)用文本編輯器。信息處理模塊,包括用于對信息進(jìn)行自動分詞,并完成關(guān)鍵信息提取的提取控件;用于完成文本轉(zhuǎn)換、聚類以及對比的處理控件;提取控件采用規(guī)則匹配以及本文檔來自技高網(wǎng)...

    【技術(shù)保護(hù)點】
    1.一種非結(jié)構(gòu)信息處理與資源管理系統(tǒng),其特征在于,由信息管理模塊、信息處理模塊以及數(shù)據(jù)采集模塊構(gòu)成;信息管理模塊,包括用于實現(xiàn)詞庫管理操作以實現(xiàn)詞庫的快速更新,包括修改、增刪、檢索詞語的詞庫控件;用于實現(xiàn)數(shù)據(jù)源的增刪查找的數(shù)據(jù)源控件;用于設(shè)置不同分類規(guī)則以對信息進(jìn)行分類,包括增刪、修改和查找規(guī)則的規(guī)則控件;用于配置文本分析功能,根據(jù)分詞或者其他策略的組合形成或者修改信息處理的策略模式的策略控件;用于根據(jù)數(shù)據(jù)源以及策略配置,建立新的任務(wù),并調(diào)用相應(yīng)的數(shù)據(jù)源以及策略模型,對數(shù)據(jù)源進(jìn)行相應(yīng)的策略處理,并輸出相應(yīng)的數(shù)據(jù)結(jié)果的任務(wù)控件;信息處理模塊,包括用于對信息進(jìn)行自動分詞,并完成關(guān)鍵信息提取的提取控件;用于完成文本轉(zhuǎn)換、聚類以及對比的處理控件;提取控件采用規(guī)則匹配以及模型匹配對文本信息進(jìn)行自動分詞處理,并對詞語進(jìn)行詞性標(biāo)注,同時提取文本的關(guān)鍵字詞和關(guān)鍵句作為摘要以便于快速閱覽;處理控件還用于根據(jù)用戶輸入的路徑錄入信息文件,并根據(jù)操作歷史形成日志文件;日志文件用于支持文件的持續(xù)更新讀取等;在具體實施過程中,各處理控件表現(xiàn)為可編輯的下拉窗口或者鏈接至相應(yīng)數(shù)據(jù)庫的超文本編輯欄;分詞處理還包括將信息數(shù)據(jù)中的文本進(jìn)行分割處理,以將其劃分為一個或者多個具有完整語義的字詞單元,同時根據(jù)自定義或者用戶輸入或者調(diào)取頻率進(jìn)行優(yōu)先級提取,以便于優(yōu)先獲取高頻的關(guān)鍵詞,快速形成關(guān)鍵詞摘要;以及,基于規(guī)則處理以及統(tǒng)計方法相結(jié)合,從非結(jié)構(gòu)信息中獲取特定的地名、人名、號碼等實體數(shù)據(jù);數(shù)據(jù)采集模塊,包括用于從數(shù)據(jù)源中采集數(shù)據(jù),調(diào)用文本分析服務(wù)器相應(yīng)的服務(wù)對數(shù)據(jù)進(jìn)行自動處理,并將數(shù)據(jù)處理結(jié)果進(jìn)行存儲的數(shù)據(jù)采集控件;以及,用于利用規(guī)范性數(shù)據(jù)文件對數(shù)據(jù)信息進(jìn)行修正和補(bǔ)充,或者進(jìn)行定義數(shù)據(jù)的錄入和修正;以實現(xiàn)對已采集數(shù)據(jù)進(jìn)行定義的數(shù)據(jù)定義控件。...

    【技術(shù)特征摘要】
    1.一種非結(jié)構(gòu)信息處理與資源管理系統(tǒng),其特征在于,由信息管理模塊、信息處理模塊以及數(shù)據(jù)采集模塊構(gòu)成;信息管理模塊,包括用于實現(xiàn)詞庫管理操作以實現(xiàn)詞庫的快速更新,包括修改、增刪、檢索詞語的詞庫控件;用于實現(xiàn)數(shù)據(jù)源的增刪查找的數(shù)據(jù)源控件;用于設(shè)置不同分類規(guī)則以對信息進(jìn)行分類,包括增刪、修改和查找規(guī)則的規(guī)則控件;用于配置文本分析功能,根據(jù)分詞或者其他策略的組合形成或者修改信息處理的策略模式的策略控件;用于根據(jù)數(shù)據(jù)源以及策略配置,建立新的任務(wù),并調(diào)用相應(yīng)的數(shù)據(jù)源以及策略模型,對數(shù)據(jù)源進(jìn)行相應(yīng)的策略處理,并輸出相應(yīng)的數(shù)據(jù)結(jié)果的任務(wù)控件;信息處理模塊,包括用于對信息進(jìn)行自動分詞,并完成關(guān)鍵信息提取的提取控件;用于完成文本轉(zhuǎn)換、聚類以及對比的處理控件;提取控件采用規(guī)則匹配以及模型匹配對文本信息進(jìn)行自動分詞處理,并對詞語進(jìn)行詞性標(biāo)注,同時提取文本的關(guān)鍵字詞和關(guān)鍵句作為摘要以便于快速閱覽;處理控件還用于根據(jù)用戶輸入的路徑錄入信息文件,并根據(jù)操作歷史形成日志文件;日志文件用于支持文件的持續(xù)更新讀取等;在具體實施過程中,各處理控件表現(xiàn)為可編輯的下拉窗口或者鏈接至相應(yīng)數(shù)據(jù)庫的超文本編輯欄;分詞處理還包括將信息數(shù)據(jù)中的文本進(jìn)行分割處理,以將其劃分為一個或者多個具有完整語義的字詞單元,同時根據(jù)自定義或者用戶輸入或者調(diào)取頻率進(jìn)行優(yōu)先級提取,以便于優(yōu)先獲取高頻的關(guān)鍵詞,快速形成關(guān)鍵詞摘要;以及,基于規(guī)則處理以及統(tǒng)計方法相結(jié)合,從非結(jié)構(gòu)信息中獲取特定的地名、人名、號碼等實體數(shù)據(jù);數(shù)據(jù)采集模塊,包括用于從數(shù)據(jù)源中采集數(shù)據(jù),調(diào)用文本分析服務(wù)器相應(yīng)的服務(wù)對數(shù)據(jù)進(jìn)行自動處理,并將數(shù)據(jù)處理結(jié)果進(jìn)行存儲的數(shù)據(jù)采集控件;以及,用于利用規(guī)范性數(shù)據(jù)...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:李剛石淮
    申請(專利權(quán))人:武漢雨滴科技有限公司
    類型:發(fā)明
    國別省市:湖北,42

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 18禁无遮拦无码国产在线播放| 少妇中文无码高清| 曰批全过程免费视频在线观看无码 | 无码人妻精品一区二区三区99不卡 | 中文无码乱人伦中文视频在线V| 99久久国产热无码精品免费| 国产成人无码av在线播放不卡| 精品久久久久久无码专区不卡| 国产av无码专区亚洲av桃花庵| 无码人妻一区二区三区在线水卜樱| 亚洲av永久无码精品漫画| 岛国av无码免费无禁网站| 无码人妻丰满熟妇区毛片| 蜜桃臀AV高潮无码| 亚洲av无码一区二区三区网站| av无码一区二区三区| 无码毛片一区二区三区中文字幕 | 精品无码国产一区二区三区麻豆| 久久亚洲精品无码| 少妇精品无码一区二区三区| 久久国产亚洲精品无码| 无码乱肉视频免费大全合集| 国产成人精品无码一区二区| 精品无码人妻久久久久久| 亚洲精品无码成人| 本道天堂成在人线av无码免费| 久久久久无码精品国产h动漫| 无码人妻久久一区二区三区蜜桃| 亚洲Av永久无码精品黑人| 国产福利无码一区在线 | 中文字幕日韩精品无码内射| 久久久久成人精品无码| 国产精品午夜福利在线无码| 中文字幕精品无码久久久久久3D日动漫 | 无码国产精品一区二区免费式直播 | 亚洲AⅤ永久无码精品AA| 亚洲色无码一区二区三区| 亚洲熟妇无码爱v在线观看| 精品无码一区二区三区在线| 曰产无码久久久久久精品| 亚洲av日韩aⅴ无码色老头|