System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本申請(qǐng)涉及智能問(wèn)答,尤其涉及一種安全領(lǐng)域智能問(wèn)答系統(tǒng)構(gòu)建方法及智能問(wèn)答系統(tǒng)。
技術(shù)介紹
1、大模型一般指參數(shù)數(shù)量龐大、擁有大量神經(jīng)元和層級(jí)結(jié)構(gòu)的深度學(xué)習(xí)模型,例如針對(duì)文本數(shù)據(jù)(也稱語(yǔ)料)的大型語(yǔ)言模型(large?language?model,llm)。大型語(yǔ)言模型通過(guò)大規(guī)模數(shù)據(jù)集的訓(xùn)練,能夠執(zhí)行各種自然語(yǔ)言處理(natural?language?processing,nlp)任務(wù)。
2、在基于大語(yǔ)言模型實(shí)現(xiàn)問(wèn)答系統(tǒng)時(shí),通常需要通過(guò)海量數(shù)據(jù)訓(xùn)練使得問(wèn)答系統(tǒng)獲得了廣泛的知識(shí),也就是說(shuō),問(wèn)答系統(tǒng)回答時(shí)所采用的知識(shí)基礎(chǔ)主要來(lái)源于訓(xùn)練數(shù)據(jù)。
3、但是,如果訓(xùn)練數(shù)據(jù)集中某一領(lǐng)域的信息不足,那么該問(wèn)答系統(tǒng)在面對(duì)這一領(lǐng)域的具體問(wèn)題時(shí),可能給出不準(zhǔn)確的回答甚至無(wú)法進(jìn)行回答。例如,在安全等高度專業(yè)化的領(lǐng)域,系統(tǒng)可能因?yàn)槿狈ψ銐蛏钊氲膶I(yè)知識(shí)而無(wú)法提供準(zhǔn)確解答。可見(jiàn),基于現(xiàn)有問(wèn)答系統(tǒng)構(gòu)建方法構(gòu)建出的問(wèn)答系統(tǒng),與真實(shí)應(yīng)用場(chǎng)景之間的聯(lián)系存在欠缺,實(shí)用性較差。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)實(shí)施例提供一種安全領(lǐng)域智能問(wèn)答系統(tǒng)構(gòu)建方法及智能問(wèn)答系統(tǒng),以解決現(xiàn)有問(wèn)答系統(tǒng)構(gòu)建方法構(gòu)建出的問(wèn)答系統(tǒng),與真實(shí)應(yīng)用場(chǎng)景之間的聯(lián)系存在欠缺的問(wèn)題。
2、第一方面,本申請(qǐng)實(shí)施例提供一種基于大模型的安全領(lǐng)域智能問(wèn)答系統(tǒng)構(gòu)建方法,包括:獲取訓(xùn)練數(shù)據(jù),訓(xùn)練數(shù)據(jù)至少包括智能問(wèn)答系統(tǒng)使用方提供的安全領(lǐng)域的歷史業(yè)務(wù)數(shù)據(jù),以及通過(guò)第一接口api從第三方安全平臺(tái)獲取的歷史業(yè)務(wù)數(shù)據(jù);基于訓(xùn)練數(shù)據(jù)構(gòu)建問(wèn)答大模型,以及
3、在一些可實(shí)現(xiàn)的方式中,構(gòu)建至少一個(gè)輕量化模型的步驟包括:基于使用方對(duì)目標(biāo)任務(wù)的任務(wù)需求,確定輕量化模型包括的目標(biāo)運(yùn)行節(jié)點(diǎn)及各個(gè)目標(biāo)運(yùn)行節(jié)點(diǎn)之間的排列關(guān)系;任務(wù)需求至少包括對(duì)業(yè)務(wù)數(shù)據(jù)的檢測(cè)分析需求、對(duì)數(shù)值的預(yù)測(cè)需求以及對(duì)業(yè)務(wù)數(shù)據(jù)的分類(lèi)需求;在建模界面中,基于排列關(guān)系對(duì)各個(gè)目標(biāo)運(yùn)行節(jié)點(diǎn)進(jìn)行排列,以及設(shè)置各個(gè)目標(biāo)運(yùn)行節(jié)點(diǎn)的模型參數(shù),以對(duì)輕量化模型建模;其中,當(dāng)目標(biāo)任務(wù)為周期性任務(wù)時(shí),目標(biāo)運(yùn)行節(jié)點(diǎn)中至少包括周期性節(jié)點(diǎn)。
4、在一些可實(shí)現(xiàn)的方式中,輕量化模型具體用于為實(shí)時(shí)業(yè)務(wù)數(shù)據(jù)打標(biāo)簽,得到標(biāo)簽結(jié)果數(shù)據(jù);基于問(wèn)答大模型及輕量化模型構(gòu)建智能問(wèn)答系統(tǒng)的步驟前,還包括:為問(wèn)答大模型構(gòu)建知識(shí)庫(kù),以使問(wèn)答大模型基于知識(shí)庫(kù)形成答案;知識(shí)庫(kù)中至少包括訓(xùn)練數(shù)據(jù)及以向量方式存儲(chǔ)的使用方提供的參考文檔;基于問(wèn)答大模型及輕量化模型構(gòu)建智能問(wèn)答系統(tǒng)的步驟后,還包括:在問(wèn)答大模型基于使用方的問(wèn)題形成答案后,將問(wèn)題及答案合并為問(wèn)答對(duì),并將問(wèn)答對(duì)保存至知識(shí)庫(kù)中,以使問(wèn)答大模型基于知識(shí)庫(kù)完成優(yōu)化;問(wèn)答對(duì)包括一個(gè)或多個(gè)問(wèn)答輪次的問(wèn)題及答案;和/或,在輕量化模型輸出標(biāo)簽結(jié)果數(shù)據(jù)后,將標(biāo)簽結(jié)果數(shù)據(jù)保存至知識(shí)庫(kù)中,以使問(wèn)答大模型基于知識(shí)庫(kù)完成優(yōu)化;以及,針對(duì)每個(gè)輕量化模型,按照第一預(yù)設(shè)周期集合其對(duì)應(yīng)的執(zhí)行狀態(tài),形成任務(wù)列表,并基于任務(wù)列表形成第一可視化界面,以管理輕量化模型;執(zhí)行狀態(tài)至少包括模型狀態(tài)、目標(biāo)任務(wù)的數(shù)量、輕量化模型打標(biāo)簽的準(zhǔn)確率、執(zhí)行目標(biāo)任務(wù)的耗時(shí)、累計(jì)執(zhí)行目標(biāo)任務(wù)的數(shù)量以及最后一次執(zhí)行目標(biāo)任務(wù)的時(shí)間。
5、在一些可實(shí)現(xiàn)的方式中,基于問(wèn)答大模型及輕量化模型構(gòu)建智能問(wèn)答系統(tǒng)的步驟后,還包括:基于標(biāo)簽結(jié)果數(shù)據(jù)修改輕量化模型的對(duì)應(yīng)的運(yùn)行節(jié)點(diǎn)的模型參數(shù)。
6、在一些可實(shí)現(xiàn)的方式中,基于問(wèn)答大模型及輕量化模型構(gòu)建智能問(wèn)答系統(tǒng)的步驟后,還包括:在將智能問(wèn)答系統(tǒng)部署在使用方的主機(jī)后,建立智能問(wèn)答系統(tǒng)與主機(jī)之間的通信通道;基于通信通道獲取實(shí)時(shí)業(yè)務(wù)數(shù)據(jù),并對(duì)實(shí)時(shí)業(yè)務(wù)數(shù)據(jù)進(jìn)行預(yù)處理,預(yù)處理的步驟至少包括將實(shí)時(shí)業(yè)務(wù)數(shù)據(jù)存儲(chǔ)為目標(biāo)格式。
7、第二方面,本申請(qǐng)實(shí)施例還提供一種基于大模型的安全領(lǐng)域智能問(wèn)答系統(tǒng),智能問(wèn)答系統(tǒng)是基于第一方面提供的基于大模型的安全領(lǐng)域智能問(wèn)答系統(tǒng)構(gòu)建方法及其各個(gè)實(shí)現(xiàn)方式構(gòu)建的;智能問(wèn)答系統(tǒng)包括問(wèn)答大模型及至少一個(gè)輕量化模型,問(wèn)答大模型用于針對(duì)使用方的問(wèn)題形成答案,輕量化模型用于基于使用方的實(shí)時(shí)業(yè)務(wù)數(shù)據(jù)執(zhí)行目標(biāo)任務(wù),目標(biāo)任務(wù)是由使用方發(fā)布的。
8、在一些可實(shí)現(xiàn)的方式中,智能問(wèn)答系統(tǒng)還包括知識(shí)庫(kù),知識(shí)庫(kù)是基于歷史業(yè)務(wù)數(shù)據(jù)及使用方提供的參考文檔構(gòu)建的;問(wèn)答大模型具體用于:基于使用方提出的問(wèn)題對(duì)知識(shí)庫(kù)進(jìn)行檢索,和/或,利用搜索引擎進(jìn)行檢索,得到多條候選文檔;基于使用方提出的問(wèn)題對(duì)知識(shí)庫(kù)進(jìn)行檢索的步驟至少包括對(duì)問(wèn)題進(jìn)行向量化轉(zhuǎn)換,并基于問(wèn)題對(duì)參考文檔進(jìn)行向量匹配;針對(duì)每一條候選文檔,計(jì)算第一相似度;按照第一相似度由大至小的順序,選取n個(gè)第一相似度對(duì)應(yīng)的候選文檔作為相關(guān)文檔,基于相關(guān)文檔形成答案,并將答案反饋至使用方;
9、第一相似度是基于以下公式計(jì)算的:
10、score=0.2*scorefuzzy+0.1*scorecosine+0.4*scorebm25+0.3*scorelevenshtein;
11、其中,score表示第一相似度;scorefuzzy表示問(wèn)題和候選文檔的fuzzy相似度算法的分?jǐn)?shù),scorecosine中表示問(wèn)題和候選文檔經(jīng)過(guò)向量化之后的余弦相似度計(jì)算的分?jǐn)?shù),scorebm25中表示問(wèn)題和候選文檔的bm25相似度算法的分?jǐn)?shù),scorelevenshtein中表示問(wèn)題和候選文檔的萊文斯坦距離相似度算法的分?jǐn)?shù),0.2、0.1、0.4及0.3表示加權(quán)系數(shù)。
12、在一些可實(shí)現(xiàn)的方式中,按照第一相似度由大至小的順序,選取n個(gè)第一相似度對(duì)應(yīng)的候選文檔形成答案,并將答案反饋至使用方的步驟后,問(wèn)答大模型還用于:計(jì)算準(zhǔn)確率、召回率及f1值;其中,計(jì)算準(zhǔn)確率的公式為:準(zhǔn)確率p=相關(guān)文檔的總數(shù)量/候選文檔的總數(shù)量*100%;計(jì)算召回率的公式為:召回率r=相關(guān)文檔的總數(shù)量/參考文檔的總數(shù)量*100%;計(jì)算f1值的公式為:p*r*2/(p+r);按照第二預(yù)設(shè)周期,將準(zhǔn)確率、召回率及f1值保存至數(shù)據(jù)庫(kù)。
13、在一些可實(shí)現(xiàn)的方式中,還包括模型調(diào)用模塊,具體用于:響應(yīng)于智能問(wèn)答系統(tǒng)使用方發(fā)布的目標(biāo)任務(wù),基于目標(biāo)任務(wù)的類(lèi)型確定目標(biāo)業(yè)務(wù)數(shù)據(jù)以及用于執(zhí)行目標(biāo)任務(wù)的目標(biāo)輕量化模型;調(diào)用目標(biāo)輕量化模型,以使目標(biāo)輕量化模型為實(shí)時(shí)業(yè)務(wù)數(shù)據(jù)打標(biāo)簽,得到標(biāo)簽結(jié)果數(shù)據(jù);基于標(biāo)簽結(jié)果數(shù)據(jù)形成第二可視化界面,并將第二可視化界面向使用方展示;以及,將標(biāo)簽結(jié)果數(shù)據(jù)保存至數(shù)據(jù)庫(kù)。
14、第三方面,本申請(qǐng)實(shí)施例還提供一種基于大模型的安全領(lǐng)域智能問(wèn)答系統(tǒng)構(gòu)建裝置,包括:獲取模塊,用于獲取訓(xùn)練數(shù)據(jù),訓(xùn)練數(shù)據(jù)至少包括智能問(wèn)答系統(tǒng)使用方提供的安全領(lǐng)域的歷史業(yè)務(wù)數(shù)據(jù),以及通過(guò)第一接口api從第三方安全平臺(tái)獲取的歷史業(yè)務(wù)數(shù)據(jù);第一構(gòu)建模塊,用于基于訓(xùn)練數(shù)據(jù)構(gòu)建問(wèn)答大模型,以及,構(gòu)建至少一個(gè)輕量化模型;其中,問(wèn)答大模型用于針對(duì)使用方的問(wèn)題形成答案,輕量化模型用于基于使用方的實(shí)時(shí)業(yè)務(wù)數(shù)據(jù)執(zhí)本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種基于大模型的安全領(lǐng)域智能問(wèn)答系統(tǒng)構(gòu)建方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基于大模型的安全領(lǐng)域智能問(wèn)答系統(tǒng)構(gòu)建方法,其特征在于,構(gòu)建至少一個(gè)輕量化模型的步驟包括:
3.根據(jù)權(quán)利要求1所述的基于大模型的安全領(lǐng)域智能問(wèn)答系統(tǒng)構(gòu)建方法,其特征在于,所述輕量化模型具體用于為所述實(shí)時(shí)業(yè)務(wù)數(shù)據(jù)打標(biāo)簽,得到標(biāo)簽結(jié)果數(shù)據(jù);
4.根據(jù)權(quán)利要求3所述的基于大模型的安全領(lǐng)域智能問(wèn)答系統(tǒng)構(gòu)建方法,其特征在于,基于所述問(wèn)答大模型及所述輕量化模型構(gòu)建智能問(wèn)答系統(tǒng)的步驟后,還包括:
5.根據(jù)權(quán)利要求1所述的基于大模型的安全領(lǐng)域智能問(wèn)答系統(tǒng)構(gòu)建方法,其特征在于,基于所述問(wèn)答大模型及所述輕量化模型構(gòu)建智能問(wèn)答系統(tǒng)的步驟后,還包括:
6.一種基于大模型的安全領(lǐng)域智能問(wèn)答系統(tǒng),其特征在于,所述智能問(wèn)答系統(tǒng)是基于權(quán)利要求1-5任一項(xiàng)所述的構(gòu)建方法構(gòu)建的;
7.根據(jù)權(quán)利要求6所述的基于大模型的安全領(lǐng)域智能問(wèn)答系統(tǒng),其特征在于,所述智能問(wèn)答系統(tǒng)還包括知識(shí)庫(kù),所述知識(shí)庫(kù)是基于歷史業(yè)務(wù)數(shù)據(jù)及使用方提供的參考文檔構(gòu)建的;
8.
9.根據(jù)權(quán)利要求6所述的基于大模型的安全領(lǐng)域智能問(wèn)答系統(tǒng),其特征在于,還包括模型調(diào)用模塊,具體用于:
10.一種基于大模型的安全領(lǐng)域智能問(wèn)答系統(tǒng)構(gòu)建裝置,其特征在于,包括:
...【技術(shù)特征摘要】
1.一種基于大模型的安全領(lǐng)域智能問(wèn)答系統(tǒng)構(gòu)建方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基于大模型的安全領(lǐng)域智能問(wèn)答系統(tǒng)構(gòu)建方法,其特征在于,構(gòu)建至少一個(gè)輕量化模型的步驟包括:
3.根據(jù)權(quán)利要求1所述的基于大模型的安全領(lǐng)域智能問(wèn)答系統(tǒng)構(gòu)建方法,其特征在于,所述輕量化模型具體用于為所述實(shí)時(shí)業(yè)務(wù)數(shù)據(jù)打標(biāo)簽,得到標(biāo)簽結(jié)果數(shù)據(jù);
4.根據(jù)權(quán)利要求3所述的基于大模型的安全領(lǐng)域智能問(wèn)答系統(tǒng)構(gòu)建方法,其特征在于,基于所述問(wèn)答大模型及所述輕量化模型構(gòu)建智能問(wèn)答系統(tǒng)的步驟后,還包括:
5.根據(jù)權(quán)利要求1所述的基于大模型的安全領(lǐng)域智能問(wèn)答系統(tǒng)構(gòu)建方法,其特征在于,基于所述問(wèn)答大模型及所述輕量化模型構(gòu)建智能問(wèn)答系統(tǒng)的步驟后,還包括:
6.一種基于大...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:崔曉文,高峰,張志超,軒曉荷,吳大明,
申請(qǐng)(專利權(quán))人:北京神州泰岳軟件股份有限公司,
類(lèi)型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。