System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 亚洲aⅴ天堂av天堂无码麻豆,国产精品午夜无码体验区,国产精品三级在线观看无码
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種結(jié)合ElasticSearch和AI的搜索問答方法及其系統(tǒng)技術(shù)方案

    技術(shù)編號(hào):44369784 閱讀:3 留言:0更新日期:2025-02-25 09:48
    本發(fā)明專利技術(shù)涉及數(shù)據(jù)搜索技術(shù)領(lǐng)域,具體公開了一種結(jié)合ElasticSearch和AI的搜索問答方法。包括:將問題進(jìn)行預(yù)先分類,接著獲取用戶輸入的問題,對(duì)問題進(jìn)行預(yù)處理,得到問題文本特征數(shù)據(jù),再對(duì)問題文本特征數(shù)據(jù)進(jìn)行計(jì)算,得到問題分類值,并判斷問題分類值是否處于預(yù)設(shè)閾值區(qū)間內(nèi),并對(duì)分類之后的問題進(jìn)行分類處理以回答用戶問題,本發(fā)明專利技術(shù)能夠利用BERT模型及其內(nèi)部神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)計(jì)算問題分類概率并確定最終分類結(jié)果,相對(duì)于RAG技術(shù)中相對(duì)簡(jiǎn)單的問題分類方式具有明顯優(yōu)勢(shì),RAG技術(shù)在分類時(shí)無法充分考慮問題的深層次語義關(guān)系,導(dǎo)致分類不準(zhǔn)確,進(jìn)而會(huì)出現(xiàn)難以回答或者答非所問的現(xiàn)象,可以有效提高用戶體驗(yàn),提高用戶粘性。

    【技術(shù)實(shí)現(xiàn)步驟摘要】

    本專利技術(shù)涉及數(shù)據(jù)搜索,尤其是一種結(jié)合elasticsearch和ai的搜索問答方法及其系統(tǒng)。


    技術(shù)介紹

    1、隨著人工智能技術(shù)的快速發(fā)展,ai在客戶服務(wù)領(lǐng)域的應(yīng)用日益廣泛。目前,基于站點(diǎn)內(nèi)容為用戶提供問答服務(wù)的ai客服系統(tǒng)通常采用檢索增強(qiáng)生成(rag)技術(shù)。然而,rag技術(shù)在應(yīng)用中仍存在一定的局限性。例如,對(duì)于需要基于時(shí)間范圍和特定領(lǐng)域知識(shí)(如“最近3個(gè)月有哪些新聞?”)的查詢,rag往往無法精準(zhǔn)應(yīng)答。這是因?yàn)閞ag通常依賴靜態(tài)知識(shí)庫進(jìn)行檢索,當(dāng)用戶提出超出數(shù)據(jù)庫既有信息范疇的問題時(shí),系統(tǒng)難以提供準(zhǔn)確、及時(shí)的回答,從而可能導(dǎo)致用戶對(duì)系統(tǒng)能力的質(zhì)疑和使用體驗(yàn)的降低。

    2、此外,現(xiàn)有基于rag的問答方法在處理用戶問題時(shí)往往只是將問題簡(jiǎn)單轉(zhuǎn)換為搜索詞進(jìn)行檢索,這種粗粒度的檢索方式無法充分捕捉用戶問題中蘊(yùn)含的語義層次和語境關(guān)系。當(dāng)用戶提出的請(qǐng)求無法通過直接搜索數(shù)據(jù)庫內(nèi)容獲得答案時(shí),系統(tǒng)容易出現(xiàn)回答不當(dāng)或答非所問的情況,嚴(yán)重影響用戶滿意度和使用粘性。

    3、因此,迫切需要一種新的技術(shù)方案,以突破現(xiàn)有rag技術(shù)的局限,提升ai客服系統(tǒng)對(duì)于多樣化問題的應(yīng)對(duì)能力和回答精準(zhǔn)度。


    技術(shù)實(shí)現(xiàn)思路

    1、本專利技術(shù)的目的在于提供一種結(jié)合elasticsearch和ai的搜索問答方法,包括:

    2、將問題進(jìn)行預(yù)先分類,其中問題類型分為:關(guān)于網(wǎng)站基本信息的問題a、與網(wǎng)站內(nèi)容相關(guān)的問題b以及通用問題c;

    3、獲取用戶輸入的問題文本,并對(duì)所述問題文本進(jìn)行預(yù)處理,得到處理問題文本;

    4、對(duì)處理問題文本進(jìn)行特征提取,得到問題文本特征;

    5、基于bert模型和神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)對(duì)問題文本特征數(shù)據(jù)進(jìn)行計(jì)算,得到問題分類值,并判斷問題分類值是否處于預(yù)設(shè)閾值區(qū)間內(nèi);

    6、若問題分類值處于預(yù)設(shè)閾值區(qū)間內(nèi),將其劃分到網(wǎng)站內(nèi)容相關(guān)的問題b;

    7、若問題分類值大于預(yù)設(shè)閾值區(qū)間最大值,將其劃分到網(wǎng)站基本信息的問題a;

    8、若問題分類值小于預(yù)設(shè)閾值區(qū)間最小值,將其劃分到通用問題c;

    9、對(duì)分類之后的問題類型進(jìn)行分類處理以回答用戶問題。

    10、進(jìn)一步的,所述對(duì)處理問題文本進(jìn)行特征提取,得到問題文本特征數(shù)據(jù)的步驟包括:

    11、將用戶輸入問題的轉(zhuǎn)化為one-hot編碼向量;

    12、假設(shè)輸入問題經(jīng)過分詞和去除停用詞后為n個(gè)單詞,表示第i個(gè)單詞(i=1,2,……n),index()表示單詞在詞表中的索引,則生成的one?-?hot編碼向量v的計(jì)算公式為:

    13、

    14、其中?j=0,1,2……,v-1。

    15、進(jìn)一步的,對(duì)問題文本特征數(shù)據(jù)進(jìn)行計(jì)算,得到問題分類值,并判斷問題分類值是否處于預(yù)設(shè)閾值區(qū)間內(nèi)的步驟包括:

    16、經(jīng)過前面的預(yù)處理步驟,問題已被轉(zhuǎn)化為模型可處理的格式,其中,將向量形狀設(shè)為?[序列長(zhǎng)度l,詞向量維度d];

    17、問題分類的計(jì)算公式為:

    18、

    19、s為問題分類值;

    20、對(duì)用戶輸入的問題所屬的類型進(jìn)行判斷;

    21、若,則最終分類結(jié)果為關(guān)于網(wǎng)站基本信息的問題a;

    22、若,則最終分類結(jié)果為網(wǎng)站內(nèi)容相關(guān)的問題b;

    23、若,則最終分類結(jié)果為通用問題c。

    24、進(jìn)一步的,對(duì)分類之后的問題類型進(jìn)行分類處理以回答用戶問題的步驟包括:

    25、對(duì)于類別?a,首先將問題與預(yù)設(shè)的信息庫中的問題模板或關(guān)鍵詞進(jìn)行匹配;

    26、接著,使用?llm根據(jù)檢索到的預(yù)設(shè)網(wǎng)站信息生成回答;

    27、最后,將生成的回答輸出給用戶;

    28、對(duì)于類別c,首先,在歷史聊天記錄數(shù)據(jù)庫中進(jìn)行檢索;

    29、接著,對(duì)檢索到的聊天記錄進(jìn)行篩選,優(yōu)先選擇近期的、與當(dāng)前用戶特征相似的用戶的聊天記錄,并生成預(yù)回答內(nèi)容;

    30、根據(jù)所述預(yù)回答內(nèi)容,對(duì)預(yù)回答進(jìn)行自檢,判斷是否存在錯(cuò)誤內(nèi)容;

    31、若存在錯(cuò)誤內(nèi)容,則對(duì)錯(cuò)誤內(nèi)容進(jìn)行糾正,并生成修訂回答內(nèi)容,再將修訂回答內(nèi)容輸出給用戶;

    32、若不存在錯(cuò)誤內(nèi)容,則直接將預(yù)回答內(nèi)容輸出給用戶。

    33、進(jìn)一步的,對(duì)分類之后的問題類型進(jìn)行分類處理以回答用戶問題的步驟還包括:

    34、對(duì)被提問的語言進(jìn)行識(shí)別,確定回復(fù)語言;

    35、對(duì)問題進(jìn)行搜索參數(shù)提取,其中,包括欄目、時(shí)間范圍、國(guó)家地區(qū)和關(guān)鍵詞;

    36、判斷用戶預(yù)期的回復(fù)類型,類型分為純搜索類和需深入閱讀的非純搜索類;

    37、調(diào)用elasticsearch進(jìn)行搜索,解決相關(guān)工程問題,所述工程問題包括國(guó)家地區(qū)轉(zhuǎn)換成標(biāo)簽、搜索參數(shù)改寫、多欄目搜索策略;

    38、根據(jù)用戶預(yù)期判斷結(jié)果,決定是否直接返回搜索列表或繼續(xù)處理。

    39、進(jìn)一步的,若為純搜索類則直接返回搜索列表;

    40、若為非純搜索則繼續(xù)以下步驟:

    41、獲取搜索結(jié)果的正文內(nèi)容;

    42、將正文和元數(shù)據(jù)信息組合成markdown格式;

    43、使用ai根據(jù)用戶問題對(duì)內(nèi)容進(jìn)行相關(guān)性判斷和摘要生成;

    44、去除不相關(guān)內(nèi)容;

    45、對(duì)ai總結(jié)的摘要列表進(jìn)行重排序;

    46、使用?ai?根據(jù)總結(jié)摘要結(jié)果列表,綜合回答用戶問題。

    47、本專利技術(shù)還公開了一種結(jié)合elasticsearch和ai的搜索問答系統(tǒng),包括:

    48、分類模塊,用于將問題進(jìn)行預(yù)先分類,其中問題類型分為:關(guān)于網(wǎng)站基本信息的問題a、與網(wǎng)站內(nèi)容相關(guān)的問題b以及通用問題c;

    49、獲取模塊,用于獲取用戶輸入的問題;

    50、轉(zhuǎn)化模塊,用于對(duì)問題進(jìn)行預(yù)處理,包括分詞、去除停用詞,并將文本轉(zhuǎn)化為模型處理的格式數(shù)據(jù);

    51、提取模塊,用于對(duì)模型處理的格式數(shù)據(jù)進(jìn)行特征提取;

    52、計(jì)算模塊,用于基于所提取的特征,通過bert模型以及通過內(nèi)部的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行計(jì)算和判斷,計(jì)算問題分類概率;

    53、判斷模塊,用于判斷用戶輸入問題的最終分類結(jié)果;

    54、處理模塊,用于對(duì)分類之后的問題類型進(jìn)行分類處理以回答用戶問題。

    55、進(jìn)一步的,所述處理模塊,包括:

    56、識(shí)別單元,用于對(duì)被提問的語言進(jìn)行識(shí)別,確定回復(fù)語言;

    57、提取單元,用于對(duì)問題進(jìn)行搜索參數(shù)提取,其中,包括欄目、時(shí)間范圍、國(guó)家地區(qū)和關(guān)鍵詞;

    58、判斷單元,用于判斷用戶預(yù)期的回復(fù)類型,類型分為純搜索類和需深入閱讀的非純搜索類;

    59、搜索單元,用于調(diào)用elasticsearch進(jìn)行搜索,解決相關(guān)工程問題,所述工程問題包括國(guó)家地區(qū)轉(zhuǎn)換成標(biāo)簽、搜索參數(shù)改寫、多欄目搜索策略;

    60、處理單元,用于根據(jù)用戶預(yù)期判斷結(jié)果,決定是否直接返回搜索列表或繼續(xù)處理。

    61、本申請(qǐng)還提供了一種計(jì)算機(jī)設(shè)備本文檔來自技高網(wǎng)...

    【技術(shù)保護(hù)點(diǎn)】

    1.一種結(jié)合ElasticSearch和AI的搜索問答方法,其特征在于,包括:

    2.根據(jù)權(quán)利要求1所述的一種結(jié)合ElasticSearch和AI的搜索問答方法,其特征在于,所述對(duì)處理問題文本進(jìn)行特征提取,得到問題文本特征數(shù)據(jù)的步驟包括:

    3.根據(jù)權(quán)利要求2所述的一種結(jié)合ElasticSearch和AI的搜索問答方法,其特征在于,對(duì)問題文本特征數(shù)據(jù)進(jìn)行計(jì)算,得到問題分類值,并判斷問題分類值是否處于預(yù)設(shè)閾值區(qū)間內(nèi)的步驟包括:

    4.根據(jù)權(quán)利要求1所述的一種結(jié)合ElasticSearch和AI的搜索問答方法,其特征在于,對(duì)分類之后的問題類型進(jìn)行分類處理以回答用戶問題的步驟包括:

    5.根據(jù)權(quán)利要求?1?所述的一種結(jié)合ElasticSearch和AI的搜索問答方法,其特征在于,對(duì)分類之后的問題類型進(jìn)行分類處理以回答用戶問題的步驟還包括:

    6.根據(jù)權(quán)利要求?5?所述的一種結(jié)合ElasticSearch和AI的搜索問答方法,其特征在于,

    7.一種結(jié)合ElasticSearch和AI的搜索問答系統(tǒng),其特征在于,包括:

    <p>8.根據(jù)權(quán)利要求7所述的一種結(jié)合ElasticSearch和AI的搜索問答系統(tǒng),其特征在于,所述處理模塊,包括:

    9.一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)權(quán)利要求1至6中任一項(xiàng)所述一種結(jié)合ElasticSearch和AI的搜索問答方法的步驟。

    10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至6中任一項(xiàng)所述一種結(jié)合ElasticSearch和AI的搜索問答方法的步驟。

    ...

    【技術(shù)特征摘要】

    1.一種結(jié)合elasticsearch和ai的搜索問答方法,其特征在于,包括:

    2.根據(jù)權(quán)利要求1所述的一種結(jié)合elasticsearch和ai的搜索問答方法,其特征在于,所述對(duì)處理問題文本進(jìn)行特征提取,得到問題文本特征數(shù)據(jù)的步驟包括:

    3.根據(jù)權(quán)利要求2所述的一種結(jié)合elasticsearch和ai的搜索問答方法,其特征在于,對(duì)問題文本特征數(shù)據(jù)進(jìn)行計(jì)算,得到問題分類值,并判斷問題分類值是否處于預(yù)設(shè)閾值區(qū)間內(nèi)的步驟包括:

    4.根據(jù)權(quán)利要求1所述的一種結(jié)合elasticsearch和ai的搜索問答方法,其特征在于,對(duì)分類之后的問題類型進(jìn)行分類處理以回答用戶問題的步驟包括:

    5.根據(jù)權(quán)利要求?1?所述的一種結(jié)合elasticsearch和ai的搜索問答方法,其特征在于,對(duì)分類之后的問題類型進(jìn)行分類處理以回答用...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:朱海東肖鳳生張沫付穎穎李莉羅井榮,
    申請(qǐng)(專利權(quán))人:杭州瑞歐科技有限公司,
    類型:發(fā)明
    國(guó)別省市:

    網(wǎng)友詢問留言 已有0條評(píng)論
    • 還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

    1
    主站蜘蛛池模板: 曰韩无码AV片免费播放不卡| 国产怡春院无码一区二区| 麻豆人妻少妇精品无码专区| 青春草无码精品视频在线观| 亚洲av永久无码精品秋霞电影影院 | 无码少妇一区二区浪潮免费| 国产精品一级毛片无码视频 | 精品国产V无码大片在线看| 亚洲GV天堂GV无码男同| 亚洲国产精品无码久久久蜜芽 | 在线看片无码永久免费aⅴ| 无码人妻精品一区二区三区东京热 | 久久精品中文字幕无码绿巨人| 乱人伦人妻中文字幕无码久久网| 亚洲精品无码久久久久久久| 丰满熟妇人妻Av无码区| AV无码精品一区二区三区宅噜噜| 人妻少妇精品无码专区| 亚洲av无码一区二区三区天堂古代 | av无码一区二区三区| 亚洲av永久无码精品网址| 无码国产精品一区二区免费模式| 一区二区三区无码视频免费福利| 日日摸日日碰人妻无码| 日韩毛片免费无码无毒视频观看| 免费无码一区二区三区| 人妻丰满AV无码久久不卡| 国产精品三级在线观看无码| 中文字幕无码第1页| 八戒理论片午影院无码爱恋| 亚洲一本大道无码av天堂| 亚洲高清无码在线观看| 一区二区三区无码高清视频| 亚洲精品无码成人片在线观看 | 亚洲AV永久无码精品放毛片| 亚洲av永久无码一区二区三区| 99久久人妻无码精品系列| 亚洲youwu永久无码精品| 精品无码黑人又粗又大又长| 亚洲精品无码成人片久久| 日日麻批免费40分钟无码|