System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 亚洲精品无码专区久久同性男,国产成人精品无码一区二区老年人 ,无码少妇一区二区三区浪潮AV
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    社會治理知識圖譜構(gòu)建方法及裝置制造方法及圖紙

    技術(shù)編號:44495082 閱讀:3 留言:0更新日期:2025-03-04 18:01
    本發(fā)明專利技術(shù)提供了一種社會治理知識圖譜構(gòu)建方法及裝置,先對社會治理領(lǐng)域的初始文本數(shù)據(jù)進(jìn)行預(yù)處理,再對預(yù)處理后文本數(shù)據(jù)進(jìn)行命名實(shí)體識別和主題詞識別,之后基于命名實(shí)體識別結(jié)果確定預(yù)處理后文本數(shù)據(jù)所包含命名實(shí)體間的文本位置關(guān)系,并基于命名實(shí)體識別結(jié)果、文本位置關(guān)系和主題詞識別結(jié)果對預(yù)處理后文本數(shù)據(jù)進(jìn)行實(shí)體間關(guān)系識別、實(shí)體與主題詞間關(guān)系識別和事件三元組識別,進(jìn)而基于實(shí)體間關(guān)系識別結(jié)果、實(shí)體與主題詞間關(guān)系識別結(jié)果和事件三元組識別結(jié)果生成初始文本數(shù)據(jù)對應(yīng)的知識圖譜。采用本發(fā)明專利技術(shù)可快速、準(zhǔn)確地從社會治理數(shù)據(jù)中挖掘出實(shí)體、主題詞和事件以及實(shí)體間關(guān)系和實(shí)體與主題詞間關(guān)系以構(gòu)建出知識圖譜。

    【技術(shù)實(shí)現(xiàn)步驟摘要】

    本專利技術(shù)涉及數(shù)據(jù)處理,尤其是涉及一種社會治理知識圖譜構(gòu)建方法及裝置


    技術(shù)介紹

    1、知識圖譜是人工智能領(lǐng)域中的一個重要分支,在現(xiàn)實(shí)中有著廣泛的應(yīng)用,例如人們?nèi)粘J褂玫乃阉饕妗㈦娚唐脚_等都運(yùn)用了知識圖譜。知識圖譜的應(yīng)用也可以擴(kuò)展到社會治理領(lǐng)域,例如城市管理、公共安全和社會服務(wù)等方面,構(gòu)建知識圖譜能夠有效組織和分析數(shù)據(jù),提升決策效率和服務(wù)質(zhì)量。然而,社會治理領(lǐng)域的數(shù)據(jù)往往呈現(xiàn)出不規(guī)則且內(nèi)容復(fù)雜的特點(diǎn),利用傳統(tǒng)的知識圖譜構(gòu)建技術(shù)從社會治理數(shù)據(jù)中挖掘?qū)嶓w及實(shí)體間關(guān)系時存在效率低下且不準(zhǔn)確的問題。


    技術(shù)實(shí)現(xiàn)思路

    1、有鑒于此,本專利技術(shù)的目的在于提供一種社會治理知識圖譜構(gòu)建方法及裝置,以緩解相關(guān)技術(shù)中存在的上述問題。

    2、第一方面,本專利技術(shù)實(shí)施例提供了一種社會治理知識圖譜構(gòu)建方法,包括:獲取社會治理領(lǐng)域的初始文本數(shù)據(jù),并對所述初始文本數(shù)據(jù)進(jìn)行預(yù)處理;其中,所述預(yù)處理包括以下中至少之一:清洗、分句、分詞、詞性標(biāo)注;對預(yù)處理后文本數(shù)據(jù)進(jìn)行命名實(shí)體識別和主題詞識別,并基于命名實(shí)體識別結(jié)果確定所述預(yù)處理后文本數(shù)據(jù)所包含命名實(shí)體間的文本位置關(guān)系;基于所述命名實(shí)體識別結(jié)果、所述文本位置關(guān)系以及預(yù)先建立好的語法規(guī)則集和/或預(yù)先訓(xùn)練好的第一關(guān)系抽取模型,對所述預(yù)處理后文本數(shù)據(jù)進(jìn)行實(shí)體間關(guān)系識別;基于所述命名實(shí)體識別結(jié)果、主題詞識別結(jié)果以及預(yù)先訓(xùn)練好的第二關(guān)系抽取模型和預(yù)設(shè)聚類算法,對所述預(yù)處理后文本數(shù)據(jù)進(jìn)行實(shí)體與主題詞間關(guān)系識別;基于所述命名實(shí)體識別結(jié)果、所述主題詞識別結(jié)果以及預(yù)設(shè)依存句法分析算法,對所述預(yù)處理后文本數(shù)據(jù)進(jìn)行事件三元組識別;基于實(shí)體間關(guān)系識別結(jié)果、實(shí)體與主題詞間關(guān)系識別結(jié)果和事件三元組識別結(jié)果,生成所述初始文本數(shù)據(jù)對應(yīng)的知識圖譜。

    3、第二方面,本專利技術(shù)實(shí)施例還提供一種社會治理知識圖譜構(gòu)建裝置,包括:預(yù)處理模塊,用于獲取社會治理領(lǐng)域的初始文本數(shù)據(jù),并對所述初始文本數(shù)據(jù)進(jìn)行預(yù)處理;其中,所述預(yù)處理包括以下中至少之一:清洗、分句、分詞、詞性標(biāo)注;第一識別模塊,用于對預(yù)處理后文本數(shù)據(jù)進(jìn)行命名實(shí)體識別和主題詞識別,并基于命名實(shí)體識別結(jié)果確定所述預(yù)處理后文本數(shù)據(jù)所包含命名實(shí)體間的文本位置關(guān)系;第二識別模塊,用于基于所述命名實(shí)體識別結(jié)果、所述文本位置關(guān)系以及預(yù)先建立好的語法規(guī)則集和/或預(yù)先訓(xùn)練好的第一關(guān)系抽取模型,對所述預(yù)處理后文本數(shù)據(jù)進(jìn)行實(shí)體間關(guān)系識別;第三識別模塊,用于基于所述命名實(shí)體識別結(jié)果、主題詞識別結(jié)果以及預(yù)先訓(xùn)練好的第二關(guān)系抽取模型和預(yù)設(shè)聚類算法,對所述預(yù)處理后文本數(shù)據(jù)進(jìn)行實(shí)體與主題詞間關(guān)系識別;第四識別模塊,用于基于所述命名實(shí)體識別結(jié)果、所述主題詞識別結(jié)果以及預(yù)設(shè)依存句法分析算法,對所述預(yù)處理后文本數(shù)據(jù)進(jìn)行事件三元組識別;生成模塊,用于基于實(shí)體間關(guān)系識別結(jié)果、實(shí)體與主題詞間關(guān)系識別結(jié)果和事件三元組識別結(jié)果,生成所述初始文本數(shù)據(jù)對應(yīng)的知識圖譜。

    4、本專利技術(shù)實(shí)施例提供的一種社會治理知識圖譜構(gòu)建方法及裝置,獲取社會治理領(lǐng)域的初始文本數(shù)據(jù),并對初始文本數(shù)據(jù)進(jìn)行預(yù)處理;對預(yù)處理后文本數(shù)據(jù)進(jìn)行命名實(shí)體識別和主題詞識別,并基于命名實(shí)體識別結(jié)果確定預(yù)處理后文本數(shù)據(jù)所包含命名實(shí)體間的文本位置關(guān)系;基于命名實(shí)體識別結(jié)果、文本位置關(guān)系以及預(yù)先建立好的語法規(guī)則集和/或預(yù)先訓(xùn)練好的第一關(guān)系抽取模型,對預(yù)處理后文本數(shù)據(jù)進(jìn)行實(shí)體間關(guān)系識別;基于命名實(shí)體識別結(jié)果、主題詞識別結(jié)果以及預(yù)先訓(xùn)練好的第二關(guān)系抽取模型和預(yù)設(shè)聚類算法,對預(yù)處理后文本數(shù)據(jù)進(jìn)行實(shí)體與主題詞間關(guān)系識別;基于命名實(shí)體識別結(jié)果、主題詞識別結(jié)果以及預(yù)設(shè)依存句法分析算法,對預(yù)處理后文本數(shù)據(jù)進(jìn)行事件三元組識別;基于實(shí)體間關(guān)系識別結(jié)果、實(shí)體與主題詞間關(guān)系識別結(jié)果和事件三元組識別結(jié)果,生成初始文本數(shù)據(jù)對應(yīng)的知識圖譜。采用上述技術(shù),可快速、準(zhǔn)確地從社會治理數(shù)據(jù)中挖掘出實(shí)體、主題詞和事件以及實(shí)體間關(guān)系和實(shí)體與主題詞間關(guān)系以構(gòu)建出知識圖譜,以便相關(guān)人員根據(jù)知識圖譜快速識別出關(guān)鍵信息和復(fù)雜關(guān)系進(jìn)而更有效地理解問題和制定相應(yīng)措施,從而提高公共服務(wù)效率。

    5、本專利技術(shù)的其他特征和優(yōu)點(diǎn)將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實(shí)施本專利技術(shù)而了解。本專利技術(shù)的目的和其他優(yōu)點(diǎn)在說明書、權(quán)利要求書以及附圖中所特別指出的結(jié)構(gòu)來實(shí)現(xiàn)和獲得。

    6、為使本專利技術(shù)的上述目的、特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉較佳實(shí)施例,并配合所附附圖,作詳細(xì)說明如下。

    本文檔來自技高網(wǎng)...

    【技術(shù)保護(hù)點(diǎn)】

    1.一種社會治理知識圖譜構(gòu)建方法,其特征在于,包括:

    2.根據(jù)權(quán)利要求1所述的社會治理知識圖譜構(gòu)建方法,其特征在于,所述文本位置關(guān)系包括近鄰詞位關(guān)系和/或長間隔詞位關(guān)系,所述近鄰詞位關(guān)系表征文本位置相鄰的命名實(shí)體在同一句子或相鄰兩句子中,所述長間隔詞位關(guān)系表征文本位置相鄰的命名實(shí)體之間間隔了至少一個句子或至少一個段落;基于所述命名實(shí)體識別結(jié)果、所述文本位置關(guān)系以及預(yù)先建立好的語法規(guī)則集和/或預(yù)先訓(xùn)練好的第一關(guān)系抽取模型,對所述預(yù)處理后文本數(shù)據(jù)進(jìn)行實(shí)體間關(guān)系識別,包括:

    3.根據(jù)權(quán)利要求2所述的社會治理知識圖譜構(gòu)建方法,其特征在于,每個第一關(guān)系和/或每個第二關(guān)系各自具有多個關(guān)系類型對應(yīng)的得分;基于得到的第一關(guān)系和/或第二關(guān)系以及預(yù)先建立的第三關(guān)系集合確定所述實(shí)體間關(guān)系識別結(jié)果,包括:

    4.根據(jù)權(quán)利要求2所述的社會治理知識圖譜構(gòu)建方法,其特征在于,基于所述第三關(guān)系集合從確定出的第二目標(biāo)關(guān)系中確定可信關(guān)系,包括:

    5.根據(jù)權(quán)利要求1所述的社會治理知識圖譜構(gòu)建方法,其特征在于,對預(yù)處理后文本數(shù)據(jù)進(jìn)行命名實(shí)體識別和主題詞識別,包括:

    <p>6.根據(jù)權(quán)利要求5所述的社會治理知識圖譜構(gòu)建方法,其特征在于,所述實(shí)體識別模型包括ELECTRA模型、Adapted-Transformer模型和線性分類器;采用預(yù)先訓(xùn)練好的實(shí)體識別模型對所述預(yù)處理后文本數(shù)據(jù)進(jìn)行命名實(shí)體識別,包括:

    7.根據(jù)權(quán)利要求5所述的社會治理知識圖譜構(gòu)建方法,其特征在于,所述主題識別模型采用LDA模型;采用預(yù)先訓(xùn)練好的主題識別模型對所述預(yù)處理后文本數(shù)據(jù)進(jìn)行主題詞識別,包括:

    8.根據(jù)權(quán)利要求1所述的社會治理知識圖譜構(gòu)建方法,其特征在于,基于所述命名實(shí)體識別結(jié)果、主題詞識別結(jié)果以及預(yù)先訓(xùn)練好的第二關(guān)系抽取模型和預(yù)設(shè)聚類算法,對所述預(yù)處理后文本數(shù)據(jù)進(jìn)行實(shí)體與主題詞間關(guān)系識別,包括:

    9.根據(jù)權(quán)利要求1所述的社會治理知識圖譜構(gòu)建方法,其特征在于,基于所述命名實(shí)體識別結(jié)果、所述主題詞識別結(jié)果以及預(yù)設(shè)依存句法分析算法,對所述預(yù)處理后文本數(shù)據(jù)進(jìn)行事件三元組識別,包括:

    10.一種社會治理知識圖譜構(gòu)建裝置,其特征在于,包括:

    ...

    【技術(shù)特征摘要】

    1.一種社會治理知識圖譜構(gòu)建方法,其特征在于,包括:

    2.根據(jù)權(quán)利要求1所述的社會治理知識圖譜構(gòu)建方法,其特征在于,所述文本位置關(guān)系包括近鄰詞位關(guān)系和/或長間隔詞位關(guān)系,所述近鄰詞位關(guān)系表征文本位置相鄰的命名實(shí)體在同一句子或相鄰兩句子中,所述長間隔詞位關(guān)系表征文本位置相鄰的命名實(shí)體之間間隔了至少一個句子或至少一個段落;基于所述命名實(shí)體識別結(jié)果、所述文本位置關(guān)系以及預(yù)先建立好的語法規(guī)則集和/或預(yù)先訓(xùn)練好的第一關(guān)系抽取模型,對所述預(yù)處理后文本數(shù)據(jù)進(jìn)行實(shí)體間關(guān)系識別,包括:

    3.根據(jù)權(quán)利要求2所述的社會治理知識圖譜構(gòu)建方法,其特征在于,每個第一關(guān)系和/或每個第二關(guān)系各自具有多個關(guān)系類型對應(yīng)的得分;基于得到的第一關(guān)系和/或第二關(guān)系以及預(yù)先建立的第三關(guān)系集合確定所述實(shí)體間關(guān)系識別結(jié)果,包括:

    4.根據(jù)權(quán)利要求2所述的社會治理知識圖譜構(gòu)建方法,其特征在于,基于所述第三關(guān)系集合從確定出的第二目標(biāo)關(guān)系中確定可信關(guān)系,包括:

    5.根據(jù)權(quán)利要求1所述的社會治理知識圖譜構(gòu)建方法,其特征在于,對預(yù)處理后文本數(shù)...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:楊文皓李勝利
    申請(專利權(quán))人:中電信數(shù)字城市科技有限公司
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 国产在线拍揄自揄拍无码| 无码AⅤ精品一区二区三区| 黄A无码片内射无码视频| 中文无码乱人伦中文视频在线V | 日韩精品无码Av一区二区| 亚洲中文字幕无码一久久区| 中文字幕AV无码一区二区三区| 色视频综合无码一区二区三区| 中文国产成人精品久久亚洲精品AⅤ无码精品 | 日韩a级无码免费视频| 免费A级毛片无码视频| 国产精品亚洲а∨无码播放不卡| 亚洲AV永久无码精品成人| 国产午夜无码片在线观看| 最新中文字幕av无码专区| 亚洲AV永久无码区成人网站| 精品久久久无码中字| 亚洲av无码偷拍在线观看| 无码一区二区三区免费| 国产成人无码区免费内射一片色欲| 亚洲AV无码一区二区三区牛牛| 无码精品久久久久久人妻中字| 亚洲Aⅴ无码一区二区二三区软件| 亚洲乱人伦中文字幕无码| 无码内射中文字幕岛国片| 波多野结衣AV无码久久一区| 小泽玛丽无码视频一区| 无码毛片一区二区三区视频免费播放| 无码aⅴ精品一区二区三区浪潮| 中出人妻中文字幕无码| 精品无码国产污污污免费网站国产 | 亚洲日韩看片无码电影| 曰韩人妻无码一区二区三区综合部 | 精品深夜AV无码一区二区老年| 少妇人妻无码精品视频| 日韩人妻无码精品久久久不卡 | 亚洲国产AV无码一区二区三区 | 亚洲AV无码精品国产成人| 无码爆乳护士让我爽| 波多野结衣VA无码中文字幕电影 | 中文字幕av无码无卡免费|