System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本申請(qǐng)涉及人工智能,尤其是一種回答文本生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
技術(shù)介紹
1、知識(shí)圖譜(knowledge?graph),作為一種數(shù)據(jù)表示和組織方式,能夠?qū)?fù)雜的關(guān)系和信息結(jié)構(gòu)化,從而為各種智能應(yīng)用提供更豐富的語義支持。
2、相關(guān)技術(shù)中,基于知識(shí)圖譜的問答系統(tǒng)是通過獲取用戶產(chǎn)生的查詢文本,理解用戶提出的問題,并通過知識(shí)推理以生成相應(yīng)的回答文本。然而,對(duì)于查詢關(guān)鍵詞少、定義廣泛、指向不清晰的查詢文本,基于知識(shí)圖譜的問答系統(tǒng)難以準(zhǔn)確理解用戶意圖并提供準(zhǔn)確的回答文本,且生成的回答文本無法與查詢文本對(duì)應(yīng)的領(lǐng)域的語言風(fēng)格相匹配,降低交互體驗(yàn)感。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)的目的是提供一種回答文本生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),通過對(duì)查詢文本進(jìn)行語義理解以及對(duì)生成的回答文本進(jìn)行風(fēng)格優(yōu)化,提升回答文本的準(zhǔn)確性和可讀性。
2、本申請(qǐng)實(shí)施例提供一種回答文本生成方法,包括:
3、獲取用戶輸入的查詢文本;
4、對(duì)所述查詢文本進(jìn)行實(shí)體抽取和關(guān)系抽取,得到所述查詢文本中的多個(gè)查詢實(shí)體和所述查詢實(shí)體兩兩之間的查詢實(shí)體關(guān)系;
5、對(duì)知識(shí)圖譜中的知識(shí)元組進(jìn)行搜索,得到若干候選知識(shí)元組;所述知識(shí)元組包括多個(gè)實(shí)體中的任一實(shí)體對(duì)和該所述實(shí)體對(duì)中實(shí)體兩兩之間的實(shí)體關(guān)系,所述候選知識(shí)元組為包括多個(gè)所述查詢實(shí)體中的任一查詢實(shí)體對(duì)和該所述查詢實(shí)體對(duì)中查詢實(shí)體兩兩之間的查詢實(shí)體關(guān)系的知識(shí)元組;
6、將所述查詢文本和所述候選知識(shí)元組輸入預(yù)訓(xùn)練的文本生成模
7、將所述預(yù)回答文本輸入預(yù)訓(xùn)練的風(fēng)格轉(zhuǎn)換模型,根據(jù)相應(yīng)的風(fēng)格提示詞,對(duì)所述預(yù)回答文本的文本風(fēng)格進(jìn)行轉(zhuǎn)換,得到目標(biāo)回答文本;所述文本生成模型和所述風(fēng)格轉(zhuǎn)換模型均為基于transformer架構(gòu)的語言模型訓(xùn)練得到。
8、在一些實(shí)施例中,所述對(duì)所述查詢文本進(jìn)行實(shí)體抽取和關(guān)系抽取,得到所述查詢文本中的多個(gè)查詢實(shí)體和所述查詢實(shí)體兩兩之間的查詢實(shí)體關(guān)系,包括:
9、對(duì)所述查詢文本進(jìn)行特征抽取,得到第一特征組合,所述第一特征組合包括所述查詢文本中每個(gè)特征字詞對(duì)應(yīng)的詞性、命名實(shí)體和依存關(guān)系;
10、將所述第一特征組合輸入到預(yù)訓(xùn)練的條件隨機(jī)場(chǎng)模型,得到所述條件隨機(jī)場(chǎng)模型的輸出結(jié)果;
11、根據(jù)所述條件隨機(jī)場(chǎng)模型的輸出結(jié)果,提取所述查詢文本中的多個(gè)查詢實(shí)體和所述查詢實(shí)體兩兩之間的查詢實(shí)體關(guān)系。
12、在一些實(shí)施例中,在所述對(duì)知識(shí)圖譜中的知識(shí)元組進(jìn)行搜索,得到若干候選知識(shí)元組之前,還包括:
13、獲取知識(shí)文本;
14、對(duì)所述知識(shí)文本進(jìn)行特征抽取,得到第二特征組合,所述第二特征組合包括所述知識(shí)文本中每個(gè)特征字詞對(duì)應(yīng)的詞性、命名實(shí)體和依存關(guān)系;
15、將所述第二特征組合輸入到預(yù)訓(xùn)練的條件隨機(jī)場(chǎng)模型,得到所述條件隨機(jī)場(chǎng)模型的輸出結(jié)果;
16、根據(jù)所述條件隨機(jī)場(chǎng)模型的輸出結(jié)果,提取所述知識(shí)文本中的多個(gè)實(shí)體和所述實(shí)體兩兩之間的實(shí)體關(guān)系;
17、對(duì)所述實(shí)體和所述實(shí)體關(guān)系進(jìn)行結(jié)構(gòu)化表示,得到所述知識(shí)元組。
18、在一些實(shí)施例中,所述對(duì)知識(shí)圖譜中的知識(shí)元組進(jìn)行搜索,得到若干候選知識(shí)元組,包括:
19、以所述實(shí)體和所述實(shí)體關(guān)系作為關(guān)鍵字,對(duì)所述知識(shí)元組進(jìn)行搜索,在所述知識(shí)元組所包括的一所述實(shí)體為其中一種所述查詢實(shí)體且所述實(shí)體關(guān)系為其中一種所述查詢實(shí)體關(guān)系時(shí),將該所述知識(shí)元組確定為所述候選知識(shí)元組。
20、在一些實(shí)施例中,所述將所述查詢文本和所述候選知識(shí)元組輸入預(yù)訓(xùn)練的文本生成模型,以進(jìn)行上下文語義關(guān)聯(lián)和文本內(nèi)容生成,得到預(yù)回答文本,包括:
21、將所述查詢文本和所述候選知識(shí)元組進(jìn)行拼接,得到查詢向量序列;
22、對(duì)所述查詢向量序列進(jìn)行位置編碼,得到位置嵌入向量序列;
23、對(duì)所述位置嵌入向量序列進(jìn)行線性變換處理,對(duì)線性變換處理后的詞向量進(jìn)行注意力權(quán)重運(yùn)算,得到第一上下文語義特征;所述第一上下文語義特征包括所述查詢文本和所述候選知識(shí)元組兩者的上下文語義信息;
24、根據(jù)所述第一上下文語義特征,以所述查詢文本和所述候選知識(shí)元組為基礎(chǔ),進(jìn)行上下文預(yù)測(cè),得到所述預(yù)回答文本。
25、在一些實(shí)施例中,所述將所述預(yù)回答文本輸入預(yù)訓(xùn)練的風(fēng)格轉(zhuǎn)換模型,根據(jù)相應(yīng)的風(fēng)格提示詞,對(duì)所述預(yù)回答文本的文本風(fēng)格進(jìn)行轉(zhuǎn)換,得到目標(biāo)回答文本,包括:
26、根據(jù)所述候選知識(shí)元組,生成所述風(fēng)格提示詞;
27、將所述預(yù)回答文本和所述風(fēng)格提示詞進(jìn)行拼接,得到預(yù)回答向量序列;
28、對(duì)所述預(yù)回答向量序列進(jìn)行線性變換處理,對(duì)線性變換處理后的詞向量進(jìn)行注意力權(quán)重運(yùn)算,得到第二上下文語義特征;所述第二上下文語義特征包括所述預(yù)回答文本和所述風(fēng)格提示詞兩者的上下文語義信息;
29、根據(jù)所述第二上下文語義特征,以所述預(yù)回答文本和所述風(fēng)格提示詞為基礎(chǔ),進(jìn)行上下文預(yù)測(cè),得到所述目標(biāo)回答文本。
30、在一些實(shí)施例中,所述根據(jù)所述候選知識(shí)元組,生成所述風(fēng)格提示詞,包括:
31、對(duì)所述候選知識(shí)元組進(jìn)行向量嵌入,得到所述候選知識(shí)元組向量序列;
32、對(duì)所述候選知識(shí)元組向量序列進(jìn)行線性變換處理,對(duì)線性變換處理后的詞向量進(jìn)行注意力權(quán)重運(yùn)算,得到第三上下文語義特征;所述第三上下文語義特征包括各所述候選知識(shí)元組兩者的上下文語義信息;
33、根據(jù)所述第三上下文語義特征,確定所述候選知識(shí)元組對(duì)應(yīng)的場(chǎng)景領(lǐng)域;
34、根據(jù)該所述場(chǎng)景領(lǐng)域,生成所述風(fēng)格提示詞。
35、本申請(qǐng)實(shí)施例還提供一種回答文本生成裝置,包括:
36、第一模塊,用于獲取用戶輸入的查詢文本;
37、第二模塊,對(duì)所述查詢文本進(jìn)行實(shí)體抽取和關(guān)系抽取,得到所述查詢文本中的多個(gè)查詢實(shí)體和所述查詢實(shí)體兩兩之間的查詢實(shí)體關(guān)系;
38、第三模塊,對(duì)知識(shí)圖譜中的知識(shí)元組進(jìn)行搜索,得到若干候選知識(shí)元組;所述知識(shí)元組包括多個(gè)實(shí)體中的任一實(shí)體對(duì)和該所述實(shí)體對(duì)中實(shí)體兩兩之間的實(shí)體關(guān)系,所述候選知識(shí)元組為包括多個(gè)所述查詢實(shí)體中的任一查詢實(shí)體對(duì)和該所述查詢實(shí)體對(duì)中查詢實(shí)體兩兩之間的查詢實(shí)體關(guān)系的知識(shí)元組;
39、第四模塊,將所述查詢文本和所述候選知識(shí)元組輸入預(yù)訓(xùn)練的文本生成模型,以進(jìn)行上下文語義關(guān)聯(lián)和文本內(nèi)容生成,得到預(yù)回答文本;
40、第五模塊,將所述預(yù)回答文本輸入預(yù)訓(xùn)練的風(fēng)格轉(zhuǎn)換模型,根據(jù)相應(yīng)的風(fēng)格提示詞,對(duì)所述預(yù)回答文本的文本風(fēng)格進(jìn)行轉(zhuǎn)換,得到目標(biāo)回答文本;所述文本生成模型和所述風(fēng)格轉(zhuǎn)換模型均為基于transformer架構(gòu)的語言模型訓(xùn)練得到。
41、本申請(qǐng)實(shí)施例還提供一種電子設(shè)備,所述電子設(shè)備包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述的回答文本生成方法。
42、本申請(qǐng)實(shí)施例還提供一種計(jì)本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種回答文本生成方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的回答文本生成方法,其特征在于,所述對(duì)所述查詢文本進(jìn)行實(shí)體抽取和關(guān)系抽取,得到所述查詢文本中的多個(gè)查詢實(shí)體和所述查詢實(shí)體兩兩之間的查詢實(shí)體關(guān)系,包括:
3.根據(jù)權(quán)利要求1所述的回答文本生成方法,其特征在于,在所述對(duì)知識(shí)圖譜中的知識(shí)元組進(jìn)行搜索,得到若干候選知識(shí)元組之前,還包括:
4.根據(jù)權(quán)利要求1所述的回答文本生成方法,其特征在于,所述對(duì)知識(shí)圖譜中的知識(shí)元組進(jìn)行搜索,得到若干候選知識(shí)元組,包括:
5.根據(jù)權(quán)利要求1所述的回答文本生成方法,其特征在于,所述將所述查詢文本和所述候選知識(shí)元組輸入預(yù)訓(xùn)練的文本生成模型,以進(jìn)行上下文語義關(guān)聯(lián)和文本內(nèi)容生成,得到預(yù)回答文本,包括:
6.根據(jù)權(quán)利要求1所述的回答文本生成方法,其特征在于,所述將所述預(yù)回答文本輸入預(yù)訓(xùn)練的風(fēng)格轉(zhuǎn)換模型,根據(jù)相應(yīng)的風(fēng)格提示詞,對(duì)所述預(yù)回答文本的文本風(fēng)格進(jìn)行轉(zhuǎn)換,得到目標(biāo)回答文本,包括:
7.根據(jù)權(quán)利要求6所述的回答文本生成方法,其特征在于,所述根據(jù)所述候選知識(shí)元組,生成所述風(fēng)格提
8.一種回答文本生成裝置,其特征在于,包括:
9.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)權(quán)利要求1至7任一項(xiàng)所述的回答文本生成方法。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至7中任一項(xiàng)所述的回答文本生成方法。
...【技術(shù)特征摘要】
1.一種回答文本生成方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的回答文本生成方法,其特征在于,所述對(duì)所述查詢文本進(jìn)行實(shí)體抽取和關(guān)系抽取,得到所述查詢文本中的多個(gè)查詢實(shí)體和所述查詢實(shí)體兩兩之間的查詢實(shí)體關(guān)系,包括:
3.根據(jù)權(quán)利要求1所述的回答文本生成方法,其特征在于,在所述對(duì)知識(shí)圖譜中的知識(shí)元組進(jìn)行搜索,得到若干候選知識(shí)元組之前,還包括:
4.根據(jù)權(quán)利要求1所述的回答文本生成方法,其特征在于,所述對(duì)知識(shí)圖譜中的知識(shí)元組進(jìn)行搜索,得到若干候選知識(shí)元組,包括:
5.根據(jù)權(quán)利要求1所述的回答文本生成方法,其特征在于,所述將所述查詢文本和所述候選知識(shí)元組輸入預(yù)訓(xùn)練的文本生成模型,以進(jìn)行上下文語義關(guān)聯(lián)和文本內(nèi)容生成,得到預(yù)回答文本,包括:
6.根...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:謝凡,陳賽霞,謝麗慧,
申請(qǐng)(專利權(quán))人:深圳市迪博企業(yè)風(fēng)險(xiǎn)管理技術(shù)有限公司,
類型:發(fā)明
國(guó)別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。