System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及自然語(yǔ)言理解,具體涉及一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法。
技術(shù)介紹
1、伴隨著如手機(jī)、平板、智能手表等智能電子設(shè)備的普及,依附于此類電子設(shè)備的網(wǎng)絡(luò)產(chǎn)品和應(yīng)用也逐漸發(fā)展至使用對(duì)話式的人機(jī)交互方式。
2、當(dāng)下,智能電子設(shè)備中通常內(nèi)置有聊天機(jī)器人,聊天機(jī)器人是指可以將用戶發(fā)出的文字、語(yǔ)音、圖片或做出的觸控操作等作為輸入數(shù)據(jù),理解輸入數(shù)據(jù)表達(dá)的用戶意圖,進(jìn)而實(shí)現(xiàn)人機(jī)交互的計(jì)算機(jī)程序或軟件,可以理解為一種根據(jù)用戶發(fā)出的內(nèi)容,自動(dòng)做出應(yīng)答的智能對(duì)話系統(tǒng)。聊天機(jī)器人在一定程度上可以取代真人進(jìn)行對(duì)話,可以被集成到對(duì)話系統(tǒng)中作為自動(dòng)在線助理,以用于例如智能聊天、客戶服務(wù)、信息詢問(wèn)等場(chǎng)景。在人機(jī)對(duì)話過(guò)程中,聊天機(jī)器人能否識(shí)別用戶的意圖,并且給出與用戶發(fā)起的對(duì)話相匹配的回答、或者執(zhí)行與用戶意圖匹配的操作指令,對(duì)提高人與機(jī)器之間的對(duì)話質(zhì)量有著重大的影響。
3、然而,在多輪會(huì)話過(guò)程中,用戶意圖在不同會(huì)話輪次的過(guò)程中隨時(shí)會(huì)發(fā)生變化,由于對(duì)話式搜索場(chǎng)景的多樣性和長(zhǎng)尾特性,這給對(duì)話過(guò)程中的知識(shí)檢索增加了難度,因此,亟待構(gòu)建一種基于用戶發(fā)起的對(duì)話,進(jìn)行用戶的意圖識(shí)別的技術(shù)方案。
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)的目的在于提供一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,解決以下技術(shù)問(wèn)題:
2、在多輪會(huì)話過(guò)程中,用戶意圖在不同會(huì)話輪次的過(guò)程中隨時(shí)會(huì)發(fā)生變化,由于對(duì)話式搜索場(chǎng)景的多樣性和長(zhǎng)尾特性,這給對(duì)話過(guò)程中的知識(shí)檢索增加了難度,因此,亟待構(gòu)建一種基于用戶發(fā)起的對(duì)話,進(jìn)行用戶的意
3、本專利技術(shù)的目的可以通過(guò)以下技術(shù)方案實(shí)現(xiàn):
4、一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,包括以下步驟:
5、s1,獲取當(dāng)前用戶首次的輸入文本并標(biāo)記為輸入文本y1,對(duì)所述輸入文本y1進(jìn)行文字過(guò)濾,對(duì)過(guò)濾后的輸入文本y1進(jìn)行語(yǔ)義分析,根據(jù)語(yǔ)義分析的結(jié)果確定輸入文本y1中各單詞對(duì)應(yīng)的意圖標(biāo)簽,根據(jù)所述意圖標(biāo)簽確定輸入文本y1對(duì)應(yīng)的相關(guān)領(lǐng)域;
6、s2,獲取當(dāng)前用戶第二次的輸入文本并標(biāo)記為輸入文本y2,獲取輸入文本y2對(duì)應(yīng)的相關(guān)領(lǐng)域,根據(jù)相關(guān)領(lǐng)域計(jì)算輸入文本y2與輸入文本y1的相似度,若相似度大于等于預(yù)設(shè)的相似度閾值,則通過(guò)預(yù)設(shè)llm模型和輸入文本y1對(duì)輸入文本y2進(jìn)行文本重寫,并根據(jù)文本重寫的結(jié)果確定合成文本y1,對(duì)所述合成文本y1進(jìn)行回復(fù);
7、s3,獲取當(dāng)前用戶第三次的輸入文本并標(biāo)記為輸入文本y3,獲取輸入文本y3對(duì)應(yīng)的相關(guān)領(lǐng)域,根據(jù)相關(guān)領(lǐng)域計(jì)算輸入文本y3與合成文本y1的相似度;
8、若相似度大于等于所述相似度閾值,則通過(guò)預(yù)設(shè)llm模型和合成文本y1對(duì)輸入文本y3進(jìn)行文本重寫,并根據(jù)文本重寫的結(jié)果確定合成文本y2,對(duì)所述合成文本y2進(jìn)行回復(fù)。
9、作為本專利技術(shù)進(jìn)一步的方案:所述s1中,文字過(guò)濾的具體過(guò)程為:
10、通過(guò)正則表達(dá)式去除所述文本中的特殊字符,并將所述特殊字符替換為空白字符串,所述特殊字符包括標(biāo)點(diǎn)符號(hào)和特殊控制字符;使用預(yù)定義的停用詞列表去除所述文本中的停用詞,所述停用詞包括“的”、“是”和“了”。
11、作為本專利技術(shù)進(jìn)一步的方案:所述s2中,還包括以下步驟:
12、若相似度小于預(yù)設(shè)的相似度閾值,則直接對(duì)輸入文本y2進(jìn)行回復(fù)。
13、作為本專利技術(shù)進(jìn)一步的方案:所述s2中,確定合成文本y1的具體過(guò)程為:
14、s11,獲取所有文本重寫的結(jié)果并標(biāo)記為假設(shè)文本b1,b2,...,ba,其中,a為正整數(shù),選取任一假設(shè)文本并進(jìn)行回復(fù),得到該假設(shè)文本對(duì)應(yīng)的假設(shè)文本回復(fù),得到所有假設(shè)文本回復(fù)并標(biāo)記為h1,h2,...,ha;
15、s12,獲取任一假設(shè)文本回復(fù)的非數(shù)值數(shù)據(jù),對(duì)非數(shù)值數(shù)據(jù)進(jìn)行編碼得到數(shù)值型數(shù)據(jù),將編碼后的假設(shè)文本回復(fù)轉(zhuǎn)化為若干個(gè)特征向量,生成每個(gè)假設(shè)文本回復(fù)的特征集;計(jì)算所有特征集之間的歐氏距離i,以歐氏距離i作為相似度度量進(jìn)行k-means聚類,得到目標(biāo)類別簇;
16、s13,以目標(biāo)類別簇中的任一特征集為中心,計(jì)算該特征集的聚合度并標(biāo)記為dp,將dp值最小的特征集對(duì)應(yīng)的假設(shè)文本標(biāo)定為合成文本y1;
17、dp的計(jì)算公式為:
18、;
19、其中,z為目標(biāo)類別簇內(nèi)的特征集數(shù)量,z0為中心特征集點(diǎn),v0為目標(biāo)類別簇內(nèi)的其他特征集點(diǎn)。
20、作為本專利技術(shù)進(jìn)一步的方案:所述s3中,還包括以下步驟:
21、若相似度小于所述相似度閾值,執(zhí)行以下步驟:
22、s21,計(jì)算輸入文本y3與輸入文本y1的相似度x1,并計(jì)算輸入文本y3與輸入文本y2的相似度x2;
23、s22,計(jì)算相似度x1與相似度x2的差值,若差值大于0,則通過(guò)llm模型和輸入文本y1對(duì)輸入文本y3進(jìn)行文本重寫,并根據(jù)文本重寫的結(jié)果確定合成文本y3,對(duì)所述合成文本y3進(jìn)行回復(fù);
24、若差值小于0,則通過(guò)llm模型和輸入文本y2對(duì)輸入文本y3進(jìn)行文本重寫,并根據(jù)文本重寫的結(jié)果確定合成文本y4,對(duì)所述合成文本y4進(jìn)行回復(fù);
25、若差值等于0,則通過(guò)llm模型、輸入文本y1和輸入文本y2對(duì)輸入文本y3進(jìn)行文本重寫,并根據(jù)文本重寫的結(jié)果確定合成文本y5,對(duì)所述合成文本y5進(jìn)行回復(fù)。
26、作為本專利技術(shù)進(jìn)一步的方案:所述s1中,根據(jù)所述意圖標(biāo)簽確定輸入文本y1對(duì)應(yīng)的相關(guān)領(lǐng)域的具體過(guò)程為:
27、建立數(shù)據(jù)庫(kù),所述數(shù)據(jù)庫(kù)內(nèi)存儲(chǔ)有已標(biāo)注領(lǐng)域的意圖標(biāo)簽,所述意圖標(biāo)簽同時(shí)與若干個(gè)領(lǐng)域相關(guān),生成所述意圖標(biāo)簽與不同領(lǐng)域相關(guān)度p,將輸入文本y1中所有單詞歸納為對(duì)應(yīng)的意圖標(biāo)簽,統(tǒng)計(jì)任一領(lǐng)域?qū)?yīng)涉及的意圖標(biāo)簽的相關(guān)度p1,p2,…,pq并根據(jù)計(jì)算公式計(jì)算得到該領(lǐng)域的總相關(guān)度x,若總相關(guān)度x大于等于預(yù)設(shè)的閾值,則將該領(lǐng)域標(biāo)定為輸入文本y1對(duì)應(yīng)的相關(guān)領(lǐng)域;若總相關(guān)度x小于預(yù)設(shè)的閾值,則將該領(lǐng)域不標(biāo)定為輸入文本y1對(duì)應(yīng)的相關(guān)領(lǐng)域。
28、作為本專利技術(shù)進(jìn)一步的方案:所述s2中,相似度的具體計(jì)算過(guò)程為:獲取輸入文本y2與輸入文本y1所對(duì)應(yīng)的相關(guān)領(lǐng)域,進(jìn)而獲取所有重合相關(guān)領(lǐng)域并標(biāo)記為l1,l2,...,ln,計(jì)算公式計(jì)算得到相似度c,其中,m為輸入文本y1所對(duì)應(yīng)的相關(guān)領(lǐng)域數(shù)量,n為重合相關(guān)領(lǐng)域數(shù)量。
29、本專利技術(shù)的有益效果:
30、本專利技術(shù)通過(guò)多輪對(duì)話的文本處理,通過(guò)計(jì)算相似度和文本重寫,能夠有效識(shí)別用戶輸入與之前輸入的相似性,來(lái)識(shí)別用戶意圖是否發(fā)生變化,避免重復(fù)回答或者不相關(guān)的回答。例如,如果用戶的輸入與之前的內(nèi)容高度相似,則通過(guò)文本重寫對(duì)用戶輸入文本進(jìn)行優(yōu)化,從而提供更加精準(zhǔn)和相關(guān)的內(nèi)容,通過(guò)對(duì)每次輸入文本的語(yǔ)義分析和意圖識(shí)別,能夠?qū)崟r(shí)調(diào)整對(duì)話流并根據(jù)需要進(jìn)行修改,能夠根據(jù)實(shí)際情況做出更加合理的響應(yīng)。使得對(duì)話更具上下文連貫性、個(gè)性化和適應(yīng)性。本專利技術(shù)降低了多輪對(duì)話過(guò)程中的知識(shí)檢索難度,提高了多輪對(duì)話的質(zhì)量和效率。
本文檔來(lái)自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,其特征在于,所述S1中,文字過(guò)濾的具體過(guò)程為:
3.根據(jù)權(quán)利要求1所述的一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,其特征在于,所述S2中,還包括以下步驟:
4.根據(jù)權(quán)利要求1所述的一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,其特征在于,所述S2中,確定合成文本Y1的具體過(guò)程為:
5.根據(jù)權(quán)利要求1所述的一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,其特征在于,所述S3中,還包括以下步驟:
6.根據(jù)權(quán)利要求1所述的一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,其特征在于,所述S1中,根據(jù)所述意圖標(biāo)簽確定輸入文本y1對(duì)應(yīng)的相關(guān)領(lǐng)域的具體過(guò)程為:
7.根據(jù)權(quán)利要求1所述的一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,其特征在于,所述S2中,相似度的具體計(jì)算過(guò)程為:獲取輸入文本y2與輸入文本y1所對(duì)應(yīng)的相關(guān)領(lǐng)域,進(jìn)而獲取所有重合相關(guān)領(lǐng)域并標(biāo)記為L(zhǎng)1,L2,...,LN,計(jì)算公式計(jì)算得到相似度C,其中,M為輸入文本y1所對(duì)應(yīng)的相關(guān)領(lǐng)域數(shù)
...【技術(shù)特征摘要】
1.一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,其特征在于,所述s1中,文字過(guò)濾的具體過(guò)程為:
3.根據(jù)權(quán)利要求1所述的一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,其特征在于,所述s2中,還包括以下步驟:
4.根據(jù)權(quán)利要求1所述的一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,其特征在于,所述s2中,確定合成文本y1的具體過(guò)程為:
5.根據(jù)權(quán)利要求1所述的一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,其特征在...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:唐科偉,陳聲鴻,
申請(qǐng)(專利權(quán))人:浙江孚臨科技有限公司,
類型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。