System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 亚洲AV区无码字幕中文色,中文无码制服丝袜人妻av,亚洲Av无码乱码在线播放
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法技術(shù)

    技術(shù)編號(hào):44324502 閱讀:5 留言:0更新日期:2025-02-18 20:33
    本發(fā)明專利技術(shù)公開了一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,屬于自然語(yǔ)言理解技術(shù)領(lǐng)域,具體包括:獲取當(dāng)前用戶首次的輸入文本y1,確定該輸入文本中各單詞對(duì)應(yīng)的意圖標(biāo)簽,根據(jù)意圖標(biāo)簽確定輸入文本y1對(duì)應(yīng)的相關(guān)領(lǐng)域;獲取當(dāng)前用戶第二次的輸入文本,計(jì)算輸入文本y2與輸入文本y1的相似度,若相似度大于等于預(yù)設(shè)的相似度閾值,則對(duì)輸入文本y2進(jìn)行重寫確定合成文本Y1并對(duì)所述合成文本Y1進(jìn)行回復(fù);計(jì)算輸入文本y3與合成文本Y1的相似度;若相似度大于等于所述相似度閾值,則對(duì)輸入文本y3進(jìn)行重寫確定合成文本Y2,對(duì)所述合成文本Y2進(jìn)行回復(fù);本發(fā)明專利技術(shù)提高了多輪對(duì)話中對(duì)話的質(zhì)量和效率。

    【技術(shù)實(shí)現(xiàn)步驟摘要】

    本專利技術(shù)涉及自然語(yǔ)言理解,具體涉及一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法


    技術(shù)介紹

    1、伴隨著如手機(jī)、平板、智能手表等智能電子設(shè)備的普及,依附于此類電子設(shè)備的網(wǎng)絡(luò)產(chǎn)品和應(yīng)用也逐漸發(fā)展至使用對(duì)話式的人機(jī)交互方式。

    2、當(dāng)下,智能電子設(shè)備中通常內(nèi)置有聊天機(jī)器人,聊天機(jī)器人是指可以將用戶發(fā)出的文字、語(yǔ)音、圖片或做出的觸控操作等作為輸入數(shù)據(jù),理解輸入數(shù)據(jù)表達(dá)的用戶意圖,進(jìn)而實(shí)現(xiàn)人機(jī)交互的計(jì)算機(jī)程序或軟件,可以理解為一種根據(jù)用戶發(fā)出的內(nèi)容,自動(dòng)做出應(yīng)答的智能對(duì)話系統(tǒng)。聊天機(jī)器人在一定程度上可以取代真人進(jìn)行對(duì)話,可以被集成到對(duì)話系統(tǒng)中作為自動(dòng)在線助理,以用于例如智能聊天、客戶服務(wù)、信息詢問(wèn)等場(chǎng)景。在人機(jī)對(duì)話過(guò)程中,聊天機(jī)器人能否識(shí)別用戶的意圖,并且給出與用戶發(fā)起的對(duì)話相匹配的回答、或者執(zhí)行與用戶意圖匹配的操作指令,對(duì)提高人與機(jī)器之間的對(duì)話質(zhì)量有著重大的影響。

    3、然而,在多輪會(huì)話過(guò)程中,用戶意圖在不同會(huì)話輪次的過(guò)程中隨時(shí)會(huì)發(fā)生變化,由于對(duì)話式搜索場(chǎng)景的多樣性和長(zhǎng)尾特性,這給對(duì)話過(guò)程中的知識(shí)檢索增加了難度,因此,亟待構(gòu)建一種基于用戶發(fā)起的對(duì)話,進(jìn)行用戶的意圖識(shí)別的技術(shù)方案。


    技術(shù)實(shí)現(xiàn)思路

    1、本專利技術(shù)的目的在于提供一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,解決以下技術(shù)問(wèn)題:

    2、在多輪會(huì)話過(guò)程中,用戶意圖在不同會(huì)話輪次的過(guò)程中隨時(shí)會(huì)發(fā)生變化,由于對(duì)話式搜索場(chǎng)景的多樣性和長(zhǎng)尾特性,這給對(duì)話過(guò)程中的知識(shí)檢索增加了難度,因此,亟待構(gòu)建一種基于用戶發(fā)起的對(duì)話,進(jìn)行用戶的意圖識(shí)別的技術(shù)方案。

    3、本專利技術(shù)的目的可以通過(guò)以下技術(shù)方案實(shí)現(xiàn):

    4、一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,包括以下步驟:

    5、s1,獲取當(dāng)前用戶首次的輸入文本并標(biāo)記為輸入文本y1,對(duì)所述輸入文本y1進(jìn)行文字過(guò)濾,對(duì)過(guò)濾后的輸入文本y1進(jìn)行語(yǔ)義分析,根據(jù)語(yǔ)義分析的結(jié)果確定輸入文本y1中各單詞對(duì)應(yīng)的意圖標(biāo)簽,根據(jù)所述意圖標(biāo)簽確定輸入文本y1對(duì)應(yīng)的相關(guān)領(lǐng)域;

    6、s2,獲取當(dāng)前用戶第二次的輸入文本并標(biāo)記為輸入文本y2,獲取輸入文本y2對(duì)應(yīng)的相關(guān)領(lǐng)域,根據(jù)相關(guān)領(lǐng)域計(jì)算輸入文本y2與輸入文本y1的相似度,若相似度大于等于預(yù)設(shè)的相似度閾值,則通過(guò)預(yù)設(shè)llm模型和輸入文本y1對(duì)輸入文本y2進(jìn)行文本重寫,并根據(jù)文本重寫的結(jié)果確定合成文本y1,對(duì)所述合成文本y1進(jìn)行回復(fù);

    7、s3,獲取當(dāng)前用戶第三次的輸入文本并標(biāo)記為輸入文本y3,獲取輸入文本y3對(duì)應(yīng)的相關(guān)領(lǐng)域,根據(jù)相關(guān)領(lǐng)域計(jì)算輸入文本y3與合成文本y1的相似度;

    8、若相似度大于等于所述相似度閾值,則通過(guò)預(yù)設(shè)llm模型和合成文本y1對(duì)輸入文本y3進(jìn)行文本重寫,并根據(jù)文本重寫的結(jié)果確定合成文本y2,對(duì)所述合成文本y2進(jìn)行回復(fù)。

    9、作為本專利技術(shù)進(jìn)一步的方案:所述s1中,文字過(guò)濾的具體過(guò)程為:

    10、通過(guò)正則表達(dá)式去除所述文本中的特殊字符,并將所述特殊字符替換為空白字符串,所述特殊字符包括標(biāo)點(diǎn)符號(hào)和特殊控制字符;使用預(yù)定義的停用詞列表去除所述文本中的停用詞,所述停用詞包括“的”、“是”和“了”。

    11、作為本專利技術(shù)進(jìn)一步的方案:所述s2中,還包括以下步驟:

    12、若相似度小于預(yù)設(shè)的相似度閾值,則直接對(duì)輸入文本y2進(jìn)行回復(fù)。

    13、作為本專利技術(shù)進(jìn)一步的方案:所述s2中,確定合成文本y1的具體過(guò)程為:

    14、s11,獲取所有文本重寫的結(jié)果并標(biāo)記為假設(shè)文本b1,b2,...,ba,其中,a為正整數(shù),選取任一假設(shè)文本并進(jìn)行回復(fù),得到該假設(shè)文本對(duì)應(yīng)的假設(shè)文本回復(fù),得到所有假設(shè)文本回復(fù)并標(biāo)記為h1,h2,...,ha;

    15、s12,獲取任一假設(shè)文本回復(fù)的非數(shù)值數(shù)據(jù),對(duì)非數(shù)值數(shù)據(jù)進(jìn)行編碼得到數(shù)值型數(shù)據(jù),將編碼后的假設(shè)文本回復(fù)轉(zhuǎn)化為若干個(gè)特征向量,生成每個(gè)假設(shè)文本回復(fù)的特征集;計(jì)算所有特征集之間的歐氏距離i,以歐氏距離i作為相似度度量進(jìn)行k-means聚類,得到目標(biāo)類別簇;

    16、s13,以目標(biāo)類別簇中的任一特征集為中心,計(jì)算該特征集的聚合度并標(biāo)記為dp,將dp值最小的特征集對(duì)應(yīng)的假設(shè)文本標(biāo)定為合成文本y1;

    17、dp的計(jì)算公式為:

    18、;

    19、其中,z為目標(biāo)類別簇內(nèi)的特征集數(shù)量,z0為中心特征集點(diǎn),v0為目標(biāo)類別簇內(nèi)的其他特征集點(diǎn)。

    20、作為本專利技術(shù)進(jìn)一步的方案:所述s3中,還包括以下步驟:

    21、若相似度小于所述相似度閾值,執(zhí)行以下步驟:

    22、s21,計(jì)算輸入文本y3與輸入文本y1的相似度x1,并計(jì)算輸入文本y3與輸入文本y2的相似度x2;

    23、s22,計(jì)算相似度x1與相似度x2的差值,若差值大于0,則通過(guò)llm模型和輸入文本y1對(duì)輸入文本y3進(jìn)行文本重寫,并根據(jù)文本重寫的結(jié)果確定合成文本y3,對(duì)所述合成文本y3進(jìn)行回復(fù);

    24、若差值小于0,則通過(guò)llm模型和輸入文本y2對(duì)輸入文本y3進(jìn)行文本重寫,并根據(jù)文本重寫的結(jié)果確定合成文本y4,對(duì)所述合成文本y4進(jìn)行回復(fù);

    25、若差值等于0,則通過(guò)llm模型、輸入文本y1和輸入文本y2對(duì)輸入文本y3進(jìn)行文本重寫,并根據(jù)文本重寫的結(jié)果確定合成文本y5,對(duì)所述合成文本y5進(jìn)行回復(fù)。

    26、作為本專利技術(shù)進(jìn)一步的方案:所述s1中,根據(jù)所述意圖標(biāo)簽確定輸入文本y1對(duì)應(yīng)的相關(guān)領(lǐng)域的具體過(guò)程為:

    27、建立數(shù)據(jù)庫(kù),所述數(shù)據(jù)庫(kù)內(nèi)存儲(chǔ)有已標(biāo)注領(lǐng)域的意圖標(biāo)簽,所述意圖標(biāo)簽同時(shí)與若干個(gè)領(lǐng)域相關(guān),生成所述意圖標(biāo)簽與不同領(lǐng)域相關(guān)度p,將輸入文本y1中所有單詞歸納為對(duì)應(yīng)的意圖標(biāo)簽,統(tǒng)計(jì)任一領(lǐng)域?qū)?yīng)涉及的意圖標(biāo)簽的相關(guān)度p1,p2,…,pq并根據(jù)計(jì)算公式計(jì)算得到該領(lǐng)域的總相關(guān)度x,若總相關(guān)度x大于等于預(yù)設(shè)的閾值,則將該領(lǐng)域標(biāo)定為輸入文本y1對(duì)應(yīng)的相關(guān)領(lǐng)域;若總相關(guān)度x小于預(yù)設(shè)的閾值,則將該領(lǐng)域不標(biāo)定為輸入文本y1對(duì)應(yīng)的相關(guān)領(lǐng)域。

    28、作為本專利技術(shù)進(jìn)一步的方案:所述s2中,相似度的具體計(jì)算過(guò)程為:獲取輸入文本y2與輸入文本y1所對(duì)應(yīng)的相關(guān)領(lǐng)域,進(jìn)而獲取所有重合相關(guān)領(lǐng)域并標(biāo)記為l1,l2,...,ln,計(jì)算公式計(jì)算得到相似度c,其中,m為輸入文本y1所對(duì)應(yīng)的相關(guān)領(lǐng)域數(shù)量,n為重合相關(guān)領(lǐng)域數(shù)量。

    29、本專利技術(shù)的有益效果:

    30、本專利技術(shù)通過(guò)多輪對(duì)話的文本處理,通過(guò)計(jì)算相似度和文本重寫,能夠有效識(shí)別用戶輸入與之前輸入的相似性,來(lái)識(shí)別用戶意圖是否發(fā)生變化,避免重復(fù)回答或者不相關(guān)的回答。例如,如果用戶的輸入與之前的內(nèi)容高度相似,則通過(guò)文本重寫對(duì)用戶輸入文本進(jìn)行優(yōu)化,從而提供更加精準(zhǔn)和相關(guān)的內(nèi)容,通過(guò)對(duì)每次輸入文本的語(yǔ)義分析和意圖識(shí)別,能夠?qū)崟r(shí)調(diào)整對(duì)話流并根據(jù)需要進(jìn)行修改,能夠根據(jù)實(shí)際情況做出更加合理的響應(yīng)。使得對(duì)話更具上下文連貫性、個(gè)性化和適應(yīng)性。本專利技術(shù)降低了多輪對(duì)話過(guò)程中的知識(shí)檢索難度,提高了多輪對(duì)話的質(zhì)量和效率。

    本文檔來(lái)自技高網(wǎng)...

    【技術(shù)保護(hù)點(diǎn)】

    1.一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,其特征在于,包括以下步驟:

    2.根據(jù)權(quán)利要求1所述的一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,其特征在于,所述S1中,文字過(guò)濾的具體過(guò)程為:

    3.根據(jù)權(quán)利要求1所述的一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,其特征在于,所述S2中,還包括以下步驟:

    4.根據(jù)權(quán)利要求1所述的一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,其特征在于,所述S2中,確定合成文本Y1的具體過(guò)程為:

    5.根據(jù)權(quán)利要求1所述的一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,其特征在于,所述S3中,還包括以下步驟:

    6.根據(jù)權(quán)利要求1所述的一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,其特征在于,所述S1中,根據(jù)所述意圖標(biāo)簽確定輸入文本y1對(duì)應(yīng)的相關(guān)領(lǐng)域的具體過(guò)程為:

    7.根據(jù)權(quán)利要求1所述的一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,其特征在于,所述S2中,相似度的具體計(jì)算過(guò)程為:獲取輸入文本y2與輸入文本y1所對(duì)應(yīng)的相關(guān)領(lǐng)域,進(jìn)而獲取所有重合相關(guān)領(lǐng)域并標(biāo)記為L(zhǎng)1,L2,...,LN,計(jì)算公式計(jì)算得到相似度C,其中,M為輸入文本y1所對(duì)應(yīng)的相關(guān)領(lǐng)域數(shù)量,N為重合相關(guān)領(lǐng)域數(shù)量。

    ...

    【技術(shù)特征摘要】

    1.一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,其特征在于,包括以下步驟:

    2.根據(jù)權(quán)利要求1所述的一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,其特征在于,所述s1中,文字過(guò)濾的具體過(guò)程為:

    3.根據(jù)權(quán)利要求1所述的一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,其特征在于,所述s2中,還包括以下步驟:

    4.根據(jù)權(quán)利要求1所述的一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,其特征在于,所述s2中,確定合成文本y1的具體過(guò)程為:

    5.根據(jù)權(quán)利要求1所述的一種在問(wèn)答中多輪對(duì)話的意圖識(shí)別方法,其特征在...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:唐科偉陳聲鴻
    申請(qǐng)(專利權(quán))人:浙江孚臨科技有限公司
    類型:發(fā)明
    國(guó)別省市:

    網(wǎng)友詢問(wèn)留言 已有0條評(píng)論
    • 還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

    1
    主站蜘蛛池模板: 亚洲中文字幕无码中文| 久久精品无码一区二区WWW| 国产高清无码二区| 国产羞羞的视频在线观看 国产一级无码视频在线 | 婷婷四虎东京热无码群交双飞视频| 亚洲av永久无码一区二区三区| 日韩电影无码A不卡| 99精品一区二区三区无码吞精| 无码AⅤ精品一区二区三区| 精品欧洲av无码一区二区14| 中文字幕人妻无码专区| 免费无码精品黄AV电影| 精品无码人妻一区二区三区品| 国产精品无码不卡一区二区三区| 国产精品久久久久无码av| 久久人妻av无码中文专区| 亚洲精品无码久久久久AV麻豆| 亚洲久热无码av中文字幕| 无码超乳爆乳中文字幕久久| 中文字幕无码一区二区免费| 国产综合无码一区二区色蜜蜜 | 18禁免费无码无遮挡不卡网站| 亚洲国产精品无码专区影院| 免费a级毛片无码a∨免费软件| 蜜臀AV无码一区二区三区 | 麻豆人妻少妇精品无码专区| 国产成人无码AV麻豆| 99热门精品一区二区三区无码 | 下载天堂国产AV成人无码精品网站| 精品无码国产污污污免费网站 | 无码喷水一区二区浪潮AV| 亚洲人片在线观看天堂无码| 无码av高潮喷水无码专区线| 无码国产精品一区二区免费| 无码专区人妻系列日韩精品少妇| 无码av免费网站| 亚洲综合久久精品无码色欲| 亚洲精品无码国产片| 国产莉萝无码AV在线播放| 国产午夜鲁丝片AV无码免费| 亚洲AV无码一区二三区|