本發明專利技術涉及本體構建技術領域,提供了一種城市公共交通服務的本體構建方法及系統,包括:對獲取的文檔進行分類后,對獲取的文檔進行篩選,對篩選出的文檔進行預處理得到文本詞集,并將文本詞集進行標注和匯總后得到城市公共交通服務本體主題詞表;基于城市公共交通服務本體主題詞表,提取概念和屬性,確定初級公共交通服務本體;基于初級公共交通服務本體,構建節點拓撲圖,并進行實例化張量后,將張量化的拓撲圖的概念節點作為訓練集對圖注意力神經網絡模型進行訓練,對提取的概念和屬性向量化后計算語義相似度,基于語義相似度,添加實體和屬性,得到城市公共交通服務本體。不僅降低了本體構建的工作量;并且提升了本體構建的準確性。的準確性。的準確性。
【技術實現步驟摘要】
一種城市公共交通服務的本體構建方法及系統
[0001]本專利技術屬于本體構建
,尤其涉及一種城市公共交通服務的本體構建方法及系統。
技術介紹
[0002]本部分的陳述僅僅是提供了與本專利技術相關的
技術介紹
信息,不必然構成在先技術。
[0003]本體是對現實世界中實體、實體屬性以及實體之間關系的知識建模工具。本體因具有共享、概念化、明確化和形式化的特性,近年來已經被引入人工智能、圖書情報和知識工程領域,并且發展出多種本體構建方法。
[0004]目前,常見的本體構建方法主要分成兩類,一類是通過人工分析數據,提取概念、屬性等信息手動構建本體。隨著機器學習和深度學習等自然語言處理技術的發展,另一類自動標注,提取概念、屬性的本體構建方法興起。但是以上兩種方法都存在各自的優缺點,手動構建本體雖在一定程度上能夠保證本體的合理性和準確性,尤其體現在構建特定領域的本體方面,但是由于無法從海量數據中自動抽取和學習相關術語,對本體構建者造成很大的工作量。自動構建本體方法雖能批量處理數據,實現概念和屬性的自動抽取,但是無法保證準確性。
[0005]隨著城市化進程的加快,城市規模不斷擴大,城市公共交通服務相關數據激增,來源于多個不同的信息系統的數據之間缺乏語義互操作性。為了實現對城市公共交通服務數據的定義和屬性的統一認識,本體成為最好的選擇,但是在構建城市公共交通服務領域本體的過程中,現有本體構建方法也是人工和自動構建兩類,這造成了城市公共交通服務本體的構建過程中存在工作量比較大,準確度較低的問題。
專利
技術實現思路
[0006]為了解決上述
技術介紹
中存在的技術問題,本專利技術提供一種城市公共交通服務的本體構建方法及系統,采用自動化本體標注方法、提取公共交通服務本體的核心概念、屬性,降低了本體構建的工作量;并且在本體構建過程中采用圖注意力網絡進行語義相似度的計算,提升了本體構建的準確性。
[0007]為了實現上述目的,本專利技術采用如下技術方案:
[0008]本專利技術的第一個方面提供一種城市公共交通服務的本體構建方法,其包括:
[0009]獲取與城市公共交通服務相關的文檔;
[0010]采用貝葉斯算法對獲取的文檔進行分類后,計算每個文檔的條件概率,基于條件概率對獲取的文檔進行篩選,對篩選出的文檔進行預處理得到文本詞集,并將文本詞集進行標注和匯總后得到城市公共交通服務本體主題詞表;
[0011]基于城市公共交通服務本體主題詞表,提取概念和屬性,確定初級公共交通服務本體;
[0012]基于初級公共交通服務本體,構建節點拓撲圖,并對節點拓撲圖的節點進行實例化張量后,將張量化的拓撲圖的概念節點作為訓練集對圖注意力神經網絡模型進行訓練,對提取的概念和屬性向量化后,利用圖注意力神經網絡模型計算語義相似度,基于語義相似度,為初級公共交通服務本體添加實體和屬性,得到城市公共交通服務本體。
[0013]進一步地,所述預處理包括分詞、去重、專有名詞和領域名詞篩選。
[0014]進一步地,使用GATE工具將文本詞集按照本體規則進行標注。
[0015]進一步地,所述初級公共交通服務本體包括但不限于概念、屬性以及概念之間的關系。
[0016]進一步地,將初級公共交通服務本體存儲為含頭實體、屬性和尾實體的三元組,并存儲為RDF格式。
[0017]進一步地,所述初級公共交通服務本體中的概念節點作為節點拓撲圖的節點,特征矩陣使用單位矩陣表示,鄰接矩陣使用點互信息表示。
[0018]進一步地,對節點拓撲圖的節點的鄰接矩陣、特征矩陣、權值矩陣、節點的標簽進行實例化張量。
[0019]本專利技術的第二個方面提供一種城市公共交通服務的本體構建系統,其包括:
[0020]文檔獲取模塊,其被配置為:獲取與城市公共交通服務相關的文檔;
[0021]主題詞表構建模塊,其被配置為:采用貝葉斯算法對獲取的文檔進行分類后,計算每個文檔的條件概率,基于條件概率對獲取的文檔進行篩選,對篩選出的文檔進行預處理得到文本詞集,并將文本詞集進行標注和匯總后得到城市公共交通服務本體主題詞表;
[0022]初級公共交通服務本體確定模塊,其被配置為:基于城市公共交通服務本體主題詞表,提取概念和屬性,確定初級公共交通服務本體;
[0023]城市公共交通服務本體構建模塊,其被配置為:基于初級公共交通服務本體,構建節點拓撲圖,并對節點拓撲圖的節點進行實例化張量后,將張量化的拓撲圖的概念節點作為訓練集對圖注意力神經網絡模型進行訓練,對提取的概念和屬性向量化后,利用圖注意力神經網絡模型計算語義相似度,基于語義相似度,為初級公共交通服務本體添加實體和屬性,得到城市公共交通服務本體。
[0024]本專利技術的第三個方面提供一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執行時實現如上述所述的一種城市公共交通服務的本體構建方法中的步驟。
[0025]本專利技術的第四個方面提供一種計算機設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執行所述程序時實現如上述所述的一種城市公共交通服務的本體構建方法中的步驟。
[0026]與現有技術相比,本專利技術的有益效果是:
[0027]本專利技術提供了一種城市公共交通服務的本體構建方法,其在本體構建過程中,從城市公共交通服務中出現的場景出發,書寫測試用例,并提出能力化問題,將與本體構建相關的城市數據規模縮小,使得本體的實體和屬性更加具有針對性。
[0028]本專利技術提供了一種城市公共交通服務的本體構建方法,其在本體構建過程中采用圖注意力網絡進行語義相似度的計算,提升了本體構建的準確性。
[0029]本專利技術提供了一種城市公共交通服務的本體構建方法,其與手動構建本體的方法相比,采用自動化本體標注方法、提取公共交通服務本體的核心概念、屬性,降低了本體構
建的工作量。
[0030]本專利技術提供了一種城市公共交通服務的本體構建方法,其解決了在城市公共交通服務領域本體構建過程中存在工作量大,準確度低的問題。
附圖說明
[0031]構成本專利技術的一部分的說明書附圖用來提供對本專利技術的進一步理解,本專利技術的示意性實施例及其說明用于解釋本專利技術,并不構成對本專利技術的不當限定。
[0032]圖1是本專利技術實施例一的一種城市公共交通服務的本體構建方法的流程圖;
[0033]圖2是本專利技術實施例一的城市公共交通服務本體主題詞表構建流程圖;
[0034]圖3是本專利技術實施例一的運用圖注意力網絡添加實體和屬性及其關系的流程圖;
[0035]圖4是本專利技術實施例一的初級城市公共交通服務本體結構圖。
具體實施方式
[0036]下面結合附圖與實施例對本專利技術作進一步說明。
[0037]應該指出,以下詳細說明都是例示性的,旨在對本專利技術提供進一步的說明。除非另有指明,本文使用的所有技術和科學術語具有與本專利技術所屬
的普通技術人員通常理解的相同含義。
[003本文檔來自技高網...
【技術保護點】
【技術特征摘要】
1.一種城市公共交通服務的本體構建方法,其特征在于,包括:獲取與城市公共交通服務相關的文檔;采用貝葉斯算法對獲取的文檔進行分類后,計算每個文檔的條件概率,基于條件概率對獲取的文檔進行篩選,對篩選出的文檔進行預處理得到文本詞集,并將文本詞集進行標注和匯總后得到城市公共交通服務本體主題詞表;基于城市公共交通服務本體主題詞表,提取概念和屬性,確定初級公共交通服務本體;基于初級公共交通服務本體,構建節點拓撲圖,并對節點拓撲圖的節點進行實例化張量后,將張量化的拓撲圖的概念節點作為訓練集對圖注意力神經網絡模型進行訓練,對提取的概念和屬性向量化后,利用圖注意力神經網絡模型計算語義相似度,基于語義相似度,為初級公共交通服務本體添加實體和屬性,得到城市公共交通服務本體。2.如權利要求1所述的一種城市公共交通服務的本體構建方法,其特征在于,所述預處理包括分詞、去重、專有名詞和領域名詞篩選。3.如權利要求1所述的一種城市公共交通服務的本體構建方法,其特征在于,使用GATE工具將文本詞集按照本體規則進行標注。4.如權利要求1所述的一種城市公共交通服務的本體構建方法,其特征在于,所述初級公共交通服務本體包括但不限于概念、屬性以及概念之間的關系。5.如權利要求1所述的一種城市公共交通服務的本體構建方法,其特征在于,將初級公共交通服務本體存儲為含頭實體、屬性和尾實體的三元組,并存儲為RDF格式。6.如權利要求1所述的一種城市公共交通服務的本體構建方法,其特征在于,所述初級公共交通服務本體中的概念節點作為節點拓撲圖的節點,特征矩陣使用單位矩陣表示,鄰接矩陣使用點互信息表示。7.如權利要求...
【專利技術屬性】
技術研發人員:于坤,高永超,錢恒,
申請(專利權)人:齊魯工業大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。