System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及文本處理,特別是涉及一種用戶標(biāo)簽的確定方法、裝置、設(shè)備及介質(zhì)。
技術(shù)介紹
1、在現(xiàn)有的文本分類管理過程中,為了便于文本的統(tǒng)一存儲(chǔ)與查找,需對(duì)文本進(jìn)行分類管理,而在某些領(lǐng)域?qū)ξ谋咀址M(jìn)行處理時(shí),例如對(duì)電子病歷文本的處理,特征選取比較麻煩,因而會(huì)導(dǎo)致與分類標(biāo)簽的匹配不夠準(zhǔn)確,使得文本在文本庫中的分類比較雜亂,不易后續(xù)的文本查找,也影響文本調(diào)用后的參考準(zhǔn)確性。
2、目前,可通過貝葉斯網(wǎng)絡(luò)對(duì)文本進(jìn)行分類處理,貝葉斯網(wǎng)絡(luò)能夠通過基礎(chǔ)建模并利用眾多文本數(shù)據(jù)對(duì)基礎(chǔ)模型進(jìn)行優(yōu)化,且模型具有可解釋性,但貝葉斯網(wǎng)絡(luò)模型依賴結(jié)構(gòu)化輸入,無法處理自然語言輸入,且模型中包含的節(jié)點(diǎn)數(shù)受建模成本的限制,無法覆蓋眾多的文本詞語概念,召回率一般較低;而近年來興起的大語言模型可以理解自然語言,并能對(duì)所有的輸入情況作出響應(yīng),在用于文本分類時(shí)可以克服貝葉斯網(wǎng)絡(luò)的局限性,但其分類結(jié)果的準(zhǔn)確性無法保證,且大語言模型本身的可解釋性不足。
3、因此,如何利用上述模型并提高文本分類時(shí)標(biāo)簽篩選的準(zhǔn)確性和可靠性成為亟待解決的問題。
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)目的在于,提供一種用戶標(biāo)簽的確定方法、裝置、設(shè)備及介質(zhì),能夠使得到的目標(biāo)匹配程度更準(zhǔn)確可靠,進(jìn)而提高目標(biāo)類別標(biāo)簽篩選的準(zhǔn)確率。
2、根據(jù)本專利技術(shù)的第一方面,提供了一種用戶標(biāo)簽的確定方法,包括以下步驟:
3、接收目標(biāo)用戶輸入的用戶描述文本,從用戶描述文本中提取若干第一用戶關(guān)鍵詞,并將若干第一用戶關(guān)鍵詞輸入至預(yù)設(shè)貝葉斯
4、將所述用戶描述文本輸入至目標(biāo)大語言模型中進(jìn)行處理,獲取到若干第一用戶狀態(tài)信息,并將若干第一用戶狀態(tài)信息輸入至預(yù)設(shè)貝葉斯網(wǎng)絡(luò)模型中,獲取到目標(biāo)用戶與每一預(yù)設(shè)類別標(biāo)簽的第二匹配程度。
5、從歷史描述文本庫中確定出與若干第一用戶關(guān)鍵詞對(duì)應(yīng)的若干第一歷史描述文本,根據(jù)每一第一歷史描述文本對(duì)應(yīng)的實(shí)際類別標(biāo)簽,獲取每一預(yù)設(shè)類別標(biāo)簽對(duì)應(yīng)的第一標(biāo)簽權(quán)重。
6、采用目標(biāo)大語言模型對(duì)歷史描述文本庫中的每一歷史描述文本進(jìn)行處理,獲取與若干第一用戶狀態(tài)信息對(duì)應(yīng)的第二歷史描述文本,并根據(jù)每一第二歷史描述文本對(duì)應(yīng)的實(shí)際類別標(biāo)簽,獲取每一預(yù)設(shè)類別標(biāo)簽對(duì)應(yīng)的第二標(biāo)簽權(quán)重。
7、根據(jù)每一預(yù)設(shè)類別標(biāo)簽對(duì)應(yīng)的第一匹配程度、第二匹配程度、第一標(biāo)簽權(quán)重和第二標(biāo)簽權(quán)重,計(jì)算得到目標(biāo)用戶與每一預(yù)設(shè)類別標(biāo)簽的目標(biāo)匹配程度,并將對(duì)應(yīng)最大目標(biāo)匹配程度的預(yù)設(shè)類別標(biāo)簽確定為目標(biāo)用戶的目標(biāo)類別標(biāo)簽。
8、進(jìn)一步的,通過如下步驟獲取預(yù)設(shè)類別標(biāo)簽對(duì)應(yīng)的第一標(biāo)簽權(quán)重:
9、從歷史描述文本庫中的每一歷史描述文本中均提取到若干第二用戶關(guān)鍵詞,將歷史描述文本庫中對(duì)應(yīng)若干第二用戶關(guān)鍵詞與若干第一用戶關(guān)鍵詞相同的歷史描述文本確定為第一歷史文本。
10、針對(duì)任一預(yù)設(shè)類別標(biāo)簽,從若干第一歷史文本對(duì)應(yīng)的若干實(shí)際類別標(biāo)簽中篩選出與預(yù)設(shè)類別標(biāo)簽相同的若干實(shí)際類別標(biāo)簽。
11、將從若干第一歷史文本對(duì)應(yīng)的若干實(shí)際類別標(biāo)簽中篩選出的實(shí)際類別標(biāo)簽的數(shù)量占據(jù)若干第一歷史文本對(duì)應(yīng)的實(shí)際類別標(biāo)簽總數(shù)量的比例作為預(yù)設(shè)類別標(biāo)簽對(duì)應(yīng)的第一標(biāo)簽權(quán)重。
12、進(jìn)一步的,通過如下步驟獲取預(yù)設(shè)類別標(biāo)簽對(duì)應(yīng)的第二標(biāo)簽權(quán)重:
13、采用目標(biāo)大語言模型從歷史描述文本庫中的每一歷史描述文本中均獲取到若干第二用戶狀態(tài)信息,將歷史描述文本庫中對(duì)應(yīng)若干第二用戶狀態(tài)信息與若干第一用戶狀態(tài)信息語義相同的歷史描述文本確定為第二歷史文本。
14、針對(duì)任一預(yù)設(shè)類別標(biāo)簽,從若干第二歷史文本對(duì)應(yīng)的若干實(shí)際類別標(biāo)簽中篩選出與預(yù)設(shè)類別標(biāo)簽相同的若干實(shí)際類別標(biāo)簽。
15、將從若干第二歷史文本對(duì)應(yīng)的若干實(shí)際類別標(biāo)簽中篩選出的實(shí)際類別標(biāo)簽的數(shù)量占據(jù)若干第二歷史文本對(duì)應(yīng)的實(shí)際類別標(biāo)簽總數(shù)量的比例作為預(yù)設(shè)類別標(biāo)簽對(duì)應(yīng)的第二標(biāo)簽權(quán)重。
16、進(jìn)一步的,通過如下步驟計(jì)算得到目標(biāo)用戶對(duì)應(yīng)任一預(yù)設(shè)類別標(biāo)簽的目標(biāo)匹配程度:
17、針對(duì)任一預(yù)設(shè)類別標(biāo)簽,根據(jù)預(yù)設(shè)類別標(biāo)簽對(duì)應(yīng)的第一標(biāo)簽權(quán)重和預(yù)設(shè)類別標(biāo)簽對(duì)應(yīng)的第二標(biāo)簽權(quán)重,確定出預(yù)設(shè)貝葉斯網(wǎng)絡(luò)模型對(duì)應(yīng)的模型權(quán)重和目標(biāo)大語言模型對(duì)應(yīng)的模型權(quán)重。
18、根據(jù)預(yù)設(shè)類別標(biāo)簽的第一匹配程度、第二匹配程度以及預(yù)設(shè)貝葉斯網(wǎng)絡(luò)模型對(duì)應(yīng)的模型權(quán)重和目標(biāo)大語言模型對(duì)應(yīng)的模型權(quán)重,進(jìn)行加權(quán)和的計(jì)算得到目標(biāo)用戶與預(yù)設(shè)類別標(biāo)簽的目標(biāo)匹配程度。
19、進(jìn)一步的,所述方法還包括如下步驟:
20、將對(duì)應(yīng)目標(biāo)匹配程度大于預(yù)設(shè)匹配程度閾值的預(yù)設(shè)類別標(biāo)簽確定為關(guān)鍵類別標(biāo)簽。
21、獲取目標(biāo)用戶的至少一個(gè)當(dāng)前狀態(tài)特征信息。
22、根據(jù)每一當(dāng)前狀態(tài)特征對(duì)應(yīng)的若干檔預(yù)設(shè)數(shù)值區(qū)間,確定出獲取到的每一當(dāng)前狀態(tài)特征對(duì)應(yīng)的目標(biāo)數(shù)值區(qū)間。
23、將獲取到的每一目標(biāo)數(shù)值區(qū)間輸入至給定貝葉斯網(wǎng)絡(luò)模型中,獲取到目標(biāo)用戶對(duì)應(yīng)每一關(guān)鍵類別標(biāo)簽的第三匹配程度。
24、根據(jù)每一關(guān)鍵類別標(biāo)簽對(duì)應(yīng)的目標(biāo)匹配程度、第三匹配程度以及目標(biāo)匹配程度和第三匹配程度分別對(duì)應(yīng)的預(yù)設(shè)匹配程度權(quán)重,進(jìn)行加權(quán)和的計(jì)算得到目標(biāo)用戶對(duì)應(yīng)每一關(guān)鍵類別標(biāo)簽的最終匹配程度,并將對(duì)應(yīng)最大的最終匹配程度的關(guān)鍵類別標(biāo)簽確定為目標(biāo)用戶的最終類別標(biāo)簽。
25、進(jìn)一步的,所述方法還包括如下步驟:
26、根據(jù)目標(biāo)用戶的目標(biāo)類別標(biāo)簽,從預(yù)設(shè)文本庫中獲取目標(biāo)類別標(biāo)簽對(duì)應(yīng)的問詢文本并發(fā)送至用戶端。
27、從用戶端接收目標(biāo)用戶與問詢文本對(duì)應(yīng)的反饋文本,并將反饋文本作為新的用戶描述文本,返回執(zhí)行步驟所述從用戶描述文本中提取若干第一用戶關(guān)鍵詞,并將若干第一用戶關(guān)鍵詞輸入至預(yù)設(shè)貝葉斯網(wǎng)絡(luò)模型中,獲取到目標(biāo)用戶與每一預(yù)設(shè)類別標(biāo)簽的第一匹配程度,至獲取到新的目標(biāo)類別標(biāo)簽。
28、當(dāng)新的目標(biāo)類別標(biāo)簽與原始的目標(biāo)類別標(biāo)簽一致時(shí),確定新的目標(biāo)類別標(biāo)簽為用戶的類別標(biāo)簽;否則,基于新的目標(biāo)類別標(biāo)簽,返回執(zhí)行步驟所述根據(jù)目標(biāo)用戶的目標(biāo)類別標(biāo)簽,從預(yù)設(shè)文本庫中獲取目標(biāo)類別標(biāo)簽對(duì)應(yīng)的問詢文本并發(fā)送至用戶端,至再次獲取到新的目標(biāo)類別標(biāo)簽。
29、若再次獲取到的目標(biāo)類別標(biāo)簽與之前獲取到的任一目標(biāo)類別標(biāo)簽一致,將當(dāng)前的目標(biāo)類別標(biāo)簽作為用戶類別標(biāo)簽,否則,基于再次獲取到的新的目標(biāo)類別標(biāo)簽,繼續(xù)返回執(zhí)行步驟所述根據(jù)目標(biāo)用戶的目標(biāo)類別標(biāo)簽,從預(yù)設(shè)文本庫中獲取目標(biāo)類別標(biāo)簽對(duì)應(yīng)的問詢文本并發(fā)送至用戶端,直至確定出用戶類別標(biāo)簽。
30、根據(jù)本專利技術(shù)的第二方面,提供了一種用戶標(biāo)簽的確定裝置,所述裝置包括:
31、第一獲取模塊,用于接收目標(biāo)用戶輸入的用戶描述文本,從用戶描述文本中提取若干第一用戶關(guān)鍵詞,并將若干第一用戶關(guān)鍵詞輸入至預(yù)設(shè)貝葉斯網(wǎng)絡(luò)模型中,獲取到目標(biāo)用戶與每一預(yù)設(shè)類別標(biāo)簽的第一匹配程度;所述用戶描述文本是指描述目標(biāo)用戶異常狀態(tài)特征信息的文本。
32、第二獲取本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種用戶標(biāo)簽的確定方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的用戶標(biāo)簽的確定方法,其特征在于,通過如下步驟獲取預(yù)設(shè)類別標(biāo)簽對(duì)應(yīng)的第一標(biāo)簽權(quán)重:
3.根據(jù)權(quán)利要求1所述的用戶標(biāo)簽的確定方法,其特征在于,通過如下步驟獲取預(yù)設(shè)類別標(biāo)簽對(duì)應(yīng)的第二標(biāo)簽權(quán)重:
4.根據(jù)權(quán)利要求1所述的用戶標(biāo)簽的確定方法,其特征在于,通過如下步驟計(jì)算得到目標(biāo)用戶對(duì)應(yīng)任一預(yù)設(shè)類別標(biāo)簽的目標(biāo)匹配程度:
5.根據(jù)權(quán)利要求1所述的用戶標(biāo)簽的確定方法,其特征在于,所述方法還包括如下步驟:
6.根據(jù)權(quán)利要求1所述的用戶標(biāo)簽的確定方法,其特征在于,所述方法還包括如下步驟:
7.一種用戶標(biāo)簽的確定裝置,其特征在于,所述裝置包括:
8.根據(jù)權(quán)利要求7所述的用戶標(biāo)簽的確定裝置,其特征在于,所述第三獲取模塊包括:
9.根據(jù)權(quán)利要求7所述的用戶標(biāo)簽的確定裝置,其特征在于,所述第四獲取模塊包括:
10.根據(jù)權(quán)利要求7所述的用戶標(biāo)簽的確定裝置,其特征在于,所述第一確定模塊包括:
11.根據(jù)權(quán)利要求7所
12.根據(jù)權(quán)利要求7所述的用戶標(biāo)簽的確定裝置,其特征在于,所述裝置還包括第九確定模塊,所述第九確定模塊包括:
13.一種電子設(shè)備,包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至6中任意一項(xiàng)所述的用戶標(biāo)簽的確定方法。
14.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至6中任意一項(xiàng)所述的用戶標(biāo)簽的確定方法。
...【技術(shù)特征摘要】
1.一種用戶標(biāo)簽的確定方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的用戶標(biāo)簽的確定方法,其特征在于,通過如下步驟獲取預(yù)設(shè)類別標(biāo)簽對(duì)應(yīng)的第一標(biāo)簽權(quán)重:
3.根據(jù)權(quán)利要求1所述的用戶標(biāo)簽的確定方法,其特征在于,通過如下步驟獲取預(yù)設(shè)類別標(biāo)簽對(duì)應(yīng)的第二標(biāo)簽權(quán)重:
4.根據(jù)權(quán)利要求1所述的用戶標(biāo)簽的確定方法,其特征在于,通過如下步驟計(jì)算得到目標(biāo)用戶對(duì)應(yīng)任一預(yù)設(shè)類別標(biāo)簽的目標(biāo)匹配程度:
5.根據(jù)權(quán)利要求1所述的用戶標(biāo)簽的確定方法,其特征在于,所述方法還包括如下步驟:
6.根據(jù)權(quán)利要求1所述的用戶標(biāo)簽的確定方法,其特征在于,所述方法還包括如下步驟:
7.一種用戶標(biāo)簽的確定裝置,其特征在于,所述裝置包括:
8.根據(jù)權(quán)利要求7所述的用戶標(biāo)簽的確定裝置,其特征在于,所述第三獲取模塊包括:
9.根據(jù)權(quán)...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:俞鋒鋒,方毅,王志豪,陶信東,
申請(qǐng)(專利權(quán))人:每日互動(dòng)股份有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。