本發明專利技術公開了一種基于圖分析模型的智能出行圖譜構建方法,該方法包括以下步驟:S1、獲取并分析旅客出行系統的業務流程和業務數據,梳理出行脈絡,構建業務模型;S2、對所述業務模型進行分析,獲取業務需求,并根據業務需求匹配知識體系框架;S3、根據出行脈絡分析出可被識別的關系類型和實體類型,并基于匹配的知識體系框架設計出行圖譜體系,構建出行圖譜模型;S4、根據知識體系框架,對多源異構的數據源進行抓取;S5、采用圖譜模塊將結構化數據、半結構化數據及非結構化數據進行抽取、融合,并以圖的形式存儲到圖數據庫中,構建圖譜庫;S6、通過網絡算法對圖譜庫進行圖分析和圖計算,構建出行圖譜。出行圖譜。出行圖譜。
【技術實現步驟摘要】
一種基于圖分析模型的智能出行圖譜構建方法
[0001]本專利技術涉及數據處理
,具體涉及一種基于圖分析模型的智能出行圖譜構建方法。
技術介紹
[0002]知識圖譜是通過將應用數學、圖形學、信息可視化技術、信息科學等學科的理論與方法與計量學引文分析、共現分析等方法結合,并利用可視化的圖譜形象地展示學科的核心結構、發展歷史、前沿領域以及整體知識架構達到多學科融合目的的現代理論。
[0003]作為新一代人工智能技術的重要分支,知識圖譜常常被用于融合多源數據來構建大規模知識庫。在智慧交通領域,構建交通知識圖譜一方面可以便于交通數據的查詢和統計,另一方面可以為交通態勢分析與預測提供豐富的知識及更加多元的信息。
[0004]隨著智慧交通的發展,交通領域的數據呈現爆炸性的增長,且通出行領域的數據類型多樣,包括視頻、圖片、地理位置信息、傳感器數據等,具有多數據結構的特征,對數據融合能力的要求不斷增加,如何融合多源數據和引入知識對構建智能出行平臺至關重要。此外,在知識圖譜的海量實體關系之間對研究對象進行分析,工作量大,且過度依賴于主觀判斷,需要借助智能標注和模型能力解決。
技術實現思路
[0005]本專利技術的目的在于提供一種基于圖分析模型的智能出行圖譜構建方法用于解決上述問題。
[0006]為實現上述目的,本專利技術采用以下技術方案:
[0007]一種基于圖分析模型的智能出行圖譜構建方法,該方法包括以下步驟:
[0008]S1、獲取并分析旅客出行系統的業務流程和業務數據,梳理出行脈絡,構建業務模型;
[0009]S2、對所述業務模型進行分析,獲取業務需求,并根據業務需求匹配知識體系框架;
[0010]S3、根據出行脈絡分析出可被識別的關系類型和實體類型,并基于匹配的知識體系框架設計出行圖譜體系,構建出行圖譜模型,定義出行體系下的實體、關系及屬性;
[0011]S4、根據知識體系框架,對多源異構的數據源進行抓取,加工轉化成結構化數據、半結構化數據及非結構化數據;
[0012]S5、采用圖譜模塊將結構化數據、半結構化數據及非結構化數據進行抽取、融合,并以圖的形式存儲到圖數據庫中,根據圖譜模型構建圖譜庫;
[0013]S6、通過網絡算法對圖譜庫進行圖分析和圖計算,構建出行圖譜。
[0014]優選地,所述圖譜模塊包括數據源處理單元、數據湖管理單元、知識建模單元、知識管理單元、知識計算單元、知識質量單元、知識應用單元及文本抽取單元;所述數據源處理單元通過數據處理層提供的工具對結構化數據、半結構化數據及非結構化數據進行數據
清洗、轉化、入圖;所述數據湖管理單元用于數據集管理、文件管理、數據同步、數據加工、操作日志及權限管理;所述知識建模單元用于建立知識圖譜的數據模型;所述知識管理單元用于圖譜數據的存儲與管理;所述知識計算單元用于為知識圖譜進行能力輸出,提供融合、標引、推理及復雜圖計算功能;所述知識質量單元用于展示圖譜質量監測、數據湖錯誤數據及入圖沖突數據;所述知識應用單元用于提供前端應用組件,能夠直接使用或集成進行圖譜的可視化探索、分析、挖掘;所述文本抽取單元用于提供語料上傳、數據標注、質檢管理、在線調參訓練生產模型和模型推理預測服務的文本知識結構化全流程能力。
[0015]優選地,所述知識圖譜的數據模型包括模式定義、模式視圖、屬性分組、模式規約、導入導出、自動概念規約及自動屬性規約。
[0016]優選地,所述前端應用組件包括編輯視圖、圖譜探索、時序探索、路徑發現、關聯關系、實體標簽、時序路徑發現、時序關聯關系及圖譜分析Pro。
[0017]優選地,所述文本抽取單元包括語料標注和模型訓練;所述語料標注用于對語料的標注與管理,其包括文本抽取模式、事件抽取模式、文本分類模式及機器閱讀理解;所述模型訓練包括深度學習模型能力和規則模型能力,所述深度學習模型能力用于管理利用平臺提供的深度學習算法訓練生成的深度學習模型,支持實體識別、屬性識別、關系抽取、事件抽取、句子級文本分類、篇章級文本分類及機器閱讀理解模型的訓練,所述規則模型能力用于將已經形成的方案提煉的規則配置到系統中,根據可用已配置好的規則實現文本的內容抽取,支持實體識別、屬性識別、關系抽取及事件抽取模型的創建。
[0018]優選地,所述語料標注具體包括以下步驟:
[0019]A1、構建標注模式;
[0020]A2、構件標注預料;
[0021]A3、模式導入至語料模式;
[0022]A4、上傳語料。
[0023]優選地,步驟S3中出行圖譜模型的構建過程中還包括知識迭代更新,所述知識迭代更新具體包括以下步驟:
[0024]B1、知識抽取按照概念圖譜針對不同的數據源進行抓取;
[0025]B2、知識融合通過實體合并、概念合并、關系抽取的算法指導對知識進行融合;
[0026]B3、知識加工進行本體抽取、知識推理和質量評估,獲得結構化、網絡化的知識體系。
[0027]優選地,所述出行圖譜模型包括基于旅客親密度的粘度模型、旅客關系推測模型及基于旅客價值的影響力模型。
[0028]優選地,步驟S5中圖譜庫的建設包括實體抽取和關系識別。
[0029]采用上述技術方案后,本專利技術與
技術介紹
相比,具有如下有益效果:
[0030]本專利技術提供一種基于圖分析模型的智能出行圖譜構建方法,構建旅客出行圖譜,識別旅客之間的相對關系和絕對關系,研究基于旅客關系的親密度分析的粘度模型,研究基于圖譜網絡的價值分析的影響力模型,為個性化產品推薦和定向化資訊推送提供依據。解決多源數據的融合問題,從海量多源異構數據中抽取實體間關系,基于知識推理模型補全實體數據,挖掘兩個交通實體之間潛在的關聯關系,以豐富知識圖譜中所包含的知識,提供語料標注和模型訓練能力應用到智能交通
,實現交通知識圖譜的自動構建與模
型分析,降低圖譜構建和分析的工作量。
附圖說明
[0031]圖1為本專利技術的流程框圖。
具體實施方式
[0032]為了使本專利技術的目的、技術方案及優點更加清楚明白,以下結合實施例,對本專利技術進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本專利技術,并不用于限定本專利技術。
[0033]實施例
[0034]配合圖1所示,本專利技術公開了一種基于圖分析模型的智能出行圖譜構建方法,該方法包括以下步驟:
[0035]S1、獲取并分析旅客出行系統的業務流程和業務數據,梳理出行脈絡,包括出行前、出行中、出行后,構建業務模型;
[0036]S2、對業務模型進行分析,獲取業務需求,并根據業務需求匹配知識體系框架;
[0037]S3、根據出行脈絡分析出可被識別的關系類型和實體類型,并基于匹配的知識體系框架設計出行圖譜體系,構建出行圖譜模型,定義出行體系下的實體、關系及屬性;
[0038]S4、根據知識體系框架,對多源異構的數據源進行抓取,加工轉化成結構化數據、半結構化數據本文檔來自技高網...
【技術保護點】
【技術特征摘要】
1.一種基于圖分析模型的智能出行圖譜構建方法,其特征在于,該方法包括以下步驟:S1、獲取并分析旅客出行系統的業務流程和業務數據,梳理出行脈絡,構建業務模型;S2、對所述業務模型進行分析,獲取業務需求,并根據業務需求匹配知識體系框架;S3、根據出行脈絡分析出可被識別的關系類型和實體類型,并基于匹配的知識體系框架設計出行圖譜體系,構建出行圖譜模型,定義出行體系下的實體、關系及屬性;S4、根據知識體系框架,對多源異構的數據源進行抓取,加工轉化成結構化數據、半結構化數據及非結構化數據;S5、采用圖譜模塊將結構化數據、半結構化數據及非結構化數據進行抽取、融合,并以圖的形式存儲到圖數據庫中,根據圖譜模型構建圖譜庫;S6、通過網絡算法對圖譜庫進行圖分析和圖計算,構建出行圖譜。2.如權利要求1所述的一種基于圖分析模型的智能出行圖譜構建方法,其特征在于:所述圖譜模塊包括數據源處理單元、數據湖管理單元、知識建模單元、知識管理單元、知識計算單元、知識質量單元、知識應用單元及文本抽取單元;所述數據源處理單元通過數據處理層提供的工具對結構化數據、半結構化數據及非結構化數據進行數據清洗、轉化、入圖;所述數據湖管理單元用于數據集管理、文件管理、數據同步、數據加工、操作日志及權限管理;所述知識建模單元用于建立知識圖譜的數據模型;所述知識管理單元用于圖譜數據的存儲與管理;所述知識計算單元用于為知識圖譜進行能力輸出,提供融合、標引、推理及復雜圖計算功能;所述知識質量單元用于展示圖譜質量監測、數據湖錯誤數據及入圖沖突數據;所述知識應用單元用于提供前端應用組件,能夠直接使用或集成進行圖譜的可視化探索、分析、挖掘;所述文本抽取單元用于提供語料上傳、數據標注、質檢管理、在線調參訓練生產模型和模型推理預測服務的文本知識結構化全流程能力。3.如權利要求2所述的一種基于圖分析模型的智能出行圖譜構建方法,其特征在于:所述知識圖譜的數據模型包括模式定義、模式視圖、屬性分組、模式規約、導入導出、自動概念規約...
【專利技術屬性】
技術研發人員:陳思恩,吳炎泉,薛焱陽,林怡馨,鄭云,
申請(專利權)人:科技谷廈門信息技術有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。