System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及數(shù)據(jù)處理,尤其是涉及一種社會治理知識圖譜構(gòu)建方法及裝置。
技術(shù)介紹
1、知識圖譜是人工智能領(lǐng)域中的一個重要分支,在現(xiàn)實(shí)中有著廣泛的應(yīng)用,例如人們?nèi)粘J褂玫乃阉饕妗㈦娚唐脚_等都運(yùn)用了知識圖譜。知識圖譜的應(yīng)用也可以擴(kuò)展到社會治理領(lǐng)域,例如城市管理、公共安全和社會服務(wù)等方面,構(gòu)建知識圖譜能夠有效組織和分析數(shù)據(jù),提升決策效率和服務(wù)質(zhì)量。然而,社會治理領(lǐng)域的數(shù)據(jù)往往呈現(xiàn)出不規(guī)則且內(nèi)容復(fù)雜的特點(diǎn),利用傳統(tǒng)的知識圖譜構(gòu)建技術(shù)從社會治理數(shù)據(jù)中挖掘?qū)嶓w及實(shí)體間關(guān)系時存在效率低下且不準(zhǔn)確的問題。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本專利技術(shù)的目的在于提供一種社會治理知識圖譜構(gòu)建方法及裝置,以緩解相關(guān)技術(shù)中存在的上述問題。
2、第一方面,本專利技術(shù)實(shí)施例提供了一種社會治理知識圖譜構(gòu)建方法,包括:獲取社會治理領(lǐng)域的初始文本數(shù)據(jù),并對所述初始文本數(shù)據(jù)進(jìn)行預(yù)處理;其中,所述預(yù)處理包括以下中至少之一:清洗、分句、分詞、詞性標(biāo)注;對預(yù)處理后文本數(shù)據(jù)進(jìn)行命名實(shí)體識別和主題詞識別,并基于命名實(shí)體識別結(jié)果確定所述預(yù)處理后文本數(shù)據(jù)所包含命名實(shí)體間的文本位置關(guān)系;基于所述命名實(shí)體識別結(jié)果、所述文本位置關(guān)系以及預(yù)先建立好的語法規(guī)則集和/或預(yù)先訓(xùn)練好的第一關(guān)系抽取模型,對所述預(yù)處理后文本數(shù)據(jù)進(jìn)行實(shí)體間關(guān)系識別;基于所述命名實(shí)體識別結(jié)果、主題詞識別結(jié)果以及預(yù)先訓(xùn)練好的第二關(guān)系抽取模型和預(yù)設(shè)聚類算法,對所述預(yù)處理后文本數(shù)據(jù)進(jìn)行實(shí)體與主題詞間關(guān)系識別;基于所述命名實(shí)體識別結(jié)果、所述主題詞識別結(jié)果以及預(yù)設(shè)依存句法
3、第二方面,本專利技術(shù)實(shí)施例還提供一種社會治理知識圖譜構(gòu)建裝置,包括:預(yù)處理模塊,用于獲取社會治理領(lǐng)域的初始文本數(shù)據(jù),并對所述初始文本數(shù)據(jù)進(jìn)行預(yù)處理;其中,所述預(yù)處理包括以下中至少之一:清洗、分句、分詞、詞性標(biāo)注;第一識別模塊,用于對預(yù)處理后文本數(shù)據(jù)進(jìn)行命名實(shí)體識別和主題詞識別,并基于命名實(shí)體識別結(jié)果確定所述預(yù)處理后文本數(shù)據(jù)所包含命名實(shí)體間的文本位置關(guān)系;第二識別模塊,用于基于所述命名實(shí)體識別結(jié)果、所述文本位置關(guān)系以及預(yù)先建立好的語法規(guī)則集和/或預(yù)先訓(xùn)練好的第一關(guān)系抽取模型,對所述預(yù)處理后文本數(shù)據(jù)進(jìn)行實(shí)體間關(guān)系識別;第三識別模塊,用于基于所述命名實(shí)體識別結(jié)果、主題詞識別結(jié)果以及預(yù)先訓(xùn)練好的第二關(guān)系抽取模型和預(yù)設(shè)聚類算法,對所述預(yù)處理后文本數(shù)據(jù)進(jìn)行實(shí)體與主題詞間關(guān)系識別;第四識別模塊,用于基于所述命名實(shí)體識別結(jié)果、所述主題詞識別結(jié)果以及預(yù)設(shè)依存句法分析算法,對所述預(yù)處理后文本數(shù)據(jù)進(jìn)行事件三元組識別;生成模塊,用于基于實(shí)體間關(guān)系識別結(jié)果、實(shí)體與主題詞間關(guān)系識別結(jié)果和事件三元組識別結(jié)果,生成所述初始文本數(shù)據(jù)對應(yīng)的知識圖譜。
4、本專利技術(shù)實(shí)施例提供的一種社會治理知識圖譜構(gòu)建方法及裝置,獲取社會治理領(lǐng)域的初始文本數(shù)據(jù),并對初始文本數(shù)據(jù)進(jìn)行預(yù)處理;對預(yù)處理后文本數(shù)據(jù)進(jìn)行命名實(shí)體識別和主題詞識別,并基于命名實(shí)體識別結(jié)果確定預(yù)處理后文本數(shù)據(jù)所包含命名實(shí)體間的文本位置關(guān)系;基于命名實(shí)體識別結(jié)果、文本位置關(guān)系以及預(yù)先建立好的語法規(guī)則集和/或預(yù)先訓(xùn)練好的第一關(guān)系抽取模型,對預(yù)處理后文本數(shù)據(jù)進(jìn)行實(shí)體間關(guān)系識別;基于命名實(shí)體識別結(jié)果、主題詞識別結(jié)果以及預(yù)先訓(xùn)練好的第二關(guān)系抽取模型和預(yù)設(shè)聚類算法,對預(yù)處理后文本數(shù)據(jù)進(jìn)行實(shí)體與主題詞間關(guān)系識別;基于命名實(shí)體識別結(jié)果、主題詞識別結(jié)果以及預(yù)設(shè)依存句法分析算法,對預(yù)處理后文本數(shù)據(jù)進(jìn)行事件三元組識別;基于實(shí)體間關(guān)系識別結(jié)果、實(shí)體與主題詞間關(guān)系識別結(jié)果和事件三元組識別結(jié)果,生成初始文本數(shù)據(jù)對應(yīng)的知識圖譜。采用上述技術(shù),可快速、準(zhǔn)確地從社會治理數(shù)據(jù)中挖掘出實(shí)體、主題詞和事件以及實(shí)體間關(guān)系和實(shí)體與主題詞間關(guān)系以構(gòu)建出知識圖譜,以便相關(guān)人員根據(jù)知識圖譜快速識別出關(guān)鍵信息和復(fù)雜關(guān)系進(jìn)而更有效地理解問題和制定相應(yīng)措施,從而提高公共服務(wù)效率。
5、本專利技術(shù)的其他特征和優(yōu)點(diǎn)將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實(shí)施本專利技術(shù)而了解。本專利技術(shù)的目的和其他優(yōu)點(diǎn)在說明書、權(quán)利要求書以及附圖中所特別指出的結(jié)構(gòu)來實(shí)現(xiàn)和獲得。
6、為使本專利技術(shù)的上述目的、特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉較佳實(shí)施例,并配合所附附圖,作詳細(xì)說明如下。
本文檔來自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種社會治理知識圖譜構(gòu)建方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的社會治理知識圖譜構(gòu)建方法,其特征在于,所述文本位置關(guān)系包括近鄰詞位關(guān)系和/或長間隔詞位關(guān)系,所述近鄰詞位關(guān)系表征文本位置相鄰的命名實(shí)體在同一句子或相鄰兩句子中,所述長間隔詞位關(guān)系表征文本位置相鄰的命名實(shí)體之間間隔了至少一個句子或至少一個段落;基于所述命名實(shí)體識別結(jié)果、所述文本位置關(guān)系以及預(yù)先建立好的語法規(guī)則集和/或預(yù)先訓(xùn)練好的第一關(guān)系抽取模型,對所述預(yù)處理后文本數(shù)據(jù)進(jìn)行實(shí)體間關(guān)系識別,包括:
3.根據(jù)權(quán)利要求2所述的社會治理知識圖譜構(gòu)建方法,其特征在于,每個第一關(guān)系和/或每個第二關(guān)系各自具有多個關(guān)系類型對應(yīng)的得分;基于得到的第一關(guān)系和/或第二關(guān)系以及預(yù)先建立的第三關(guān)系集合確定所述實(shí)體間關(guān)系識別結(jié)果,包括:
4.根據(jù)權(quán)利要求2所述的社會治理知識圖譜構(gòu)建方法,其特征在于,基于所述第三關(guān)系集合從確定出的第二目標(biāo)關(guān)系中確定可信關(guān)系,包括:
5.根據(jù)權(quán)利要求1所述的社會治理知識圖譜構(gòu)建方法,其特征在于,對預(yù)處理后文本數(shù)據(jù)進(jìn)行命名實(shí)體識別和主題詞識別,包括:
< ...【技術(shù)特征摘要】
1.一種社會治理知識圖譜構(gòu)建方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的社會治理知識圖譜構(gòu)建方法,其特征在于,所述文本位置關(guān)系包括近鄰詞位關(guān)系和/或長間隔詞位關(guān)系,所述近鄰詞位關(guān)系表征文本位置相鄰的命名實(shí)體在同一句子或相鄰兩句子中,所述長間隔詞位關(guān)系表征文本位置相鄰的命名實(shí)體之間間隔了至少一個句子或至少一個段落;基于所述命名實(shí)體識別結(jié)果、所述文本位置關(guān)系以及預(yù)先建立好的語法規(guī)則集和/或預(yù)先訓(xùn)練好的第一關(guān)系抽取模型,對所述預(yù)處理后文本數(shù)據(jù)進(jìn)行實(shí)體間關(guān)系識別,包括:
3.根據(jù)權(quán)利要求2所述的社會治理知識圖譜構(gòu)建方法,其特征在于,每個第一關(guān)系和/或每個第二關(guān)系各自具有多個關(guān)系類型對應(yīng)的得分;基于得到的第一關(guān)系和/或第二關(guān)系以及預(yù)先建立的第三關(guān)系集合確定所述實(shí)體間關(guān)系識別結(jié)果,包括:
4.根據(jù)權(quán)利要求2所述的社會治理知識圖譜構(gòu)建方法,其特征在于,基于所述第三關(guān)系集合從確定出的第二目標(biāo)關(guān)系中確定可信關(guān)系,包括:
5.根據(jù)權(quán)利要求1所述的社會治理知識圖譜構(gòu)建方法,其特征在于,對預(yù)處理后文本數(shù)...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:楊文皓,李勝利,
申請(專利權(quán))人:中電信數(shù)字城市科技有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。