System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本申請(qǐng)涉及人工智能,尤其涉及一種音頻轉(zhuǎn)文本處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
技術(shù)介紹
1、在用戶(hù)通過(guò)電話(huà)辦理業(yè)務(wù)時(shí),客服人員通常需要將用戶(hù)的用戶(hù)訴求記錄到工單系統(tǒng)中,以便于進(jìn)行下一步的處理。
2、在現(xiàn)有技術(shù)中,常通過(guò)語(yǔ)音識(shí)別技術(shù)對(duì)用戶(hù)的電話(huà)錄音進(jìn)行識(shí)別處理,生成相應(yīng)的文字文本內(nèi)容,進(jìn)而根據(jù)文字文本內(nèi)容在工單系統(tǒng)中生成相應(yīng)的工單。
3、然而,現(xiàn)有技術(shù)中的方案,存在生成的文字文本內(nèi)容不準(zhǔn)確的問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)?zhí)峁┮环N音頻轉(zhuǎn)文本處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),用以解決現(xiàn)有技術(shù)中的方案所生成的文字文本內(nèi)容不準(zhǔn)確的問(wèn)題。
2、第一方面,本申請(qǐng)?zhí)峁┮环N音頻轉(zhuǎn)文本處理方法,包括:獲取用戶(hù)音頻信息、用戶(hù)語(yǔ)速信息和邏輯校驗(yàn)信息;其中所述用戶(hù)音頻信息表征用戶(hù)在通過(guò)電話(huà)語(yǔ)音客服辦理業(yè)務(wù)時(shí),通過(guò)語(yǔ)音輸入的用戶(hù)信息;所述用戶(hù)語(yǔ)速信息表征所述用戶(hù)在通過(guò)語(yǔ)音輸入所述用戶(hù)信息時(shí)的說(shuō)話(huà)速度;所述邏輯校驗(yàn)信息表征所述用戶(hù)信息的內(nèi)容特征;根據(jù)所述用戶(hù)語(yǔ)速信息和業(yè)務(wù)特征標(biāo)識(shí),對(duì)所述用戶(hù)音頻信息分割和/或合并處理,以得到初始文本信息;其中所述業(yè)務(wù)特征標(biāo)識(shí)用于指示具有業(yè)務(wù)特征的詞語(yǔ);根據(jù)所述初始文本信息,得到用戶(hù)地區(qū)信息;其中,所述用戶(hù)地區(qū)信息用于指示所述用戶(hù)的用戶(hù)所在地區(qū);根據(jù)所述用戶(hù)地區(qū)信息,確定一般性語(yǔ)音特征信息;其中所述一般性語(yǔ)音特征信息表征所述用戶(hù)所在地區(qū)對(duì)應(yīng)的地區(qū)性口音特征;根據(jù)所述一般性語(yǔ)音特征信息和參考語(yǔ)音特征信息,生成校準(zhǔn)調(diào)整信息;其中所述參考語(yǔ)音特征信息表
3、在一種可能的設(shè)計(jì)中,所述根據(jù)所述一般性語(yǔ)音特征信息和參考語(yǔ)音特征信息,生成校準(zhǔn)調(diào)整信息,包括:根據(jù)待辦業(yè)務(wù)信息,生成前置參考信息,所述待辦業(yè)務(wù)信息表征所述用戶(hù)所要辦理的業(yè)務(wù)的目標(biāo)業(yè)務(wù)特征,所述前置參考信息表征所述目標(biāo)業(yè)務(wù)特征對(duì)應(yīng)的參考內(nèi)容;響應(yīng)于所述用戶(hù)根據(jù)所述前置參考信息上傳的用戶(hù)驗(yàn)證信息,生成用戶(hù)語(yǔ)音特征信息,所述用戶(hù)驗(yàn)證信息表征所述參考內(nèi)容對(duì)應(yīng)的音頻內(nèi)容,所述用戶(hù)語(yǔ)音特征信息表征所述用戶(hù)的個(gè)人口音特征;根據(jù)所述用戶(hù)語(yǔ)音特征信息、所述一般性語(yǔ)音特征信息和所述參考語(yǔ)音特征信息,生成所述校準(zhǔn)調(diào)整信息。
4、在一種可能的設(shè)計(jì)中,所述根據(jù)所述基礎(chǔ)文本信息和所述邏輯校驗(yàn)信息,得到目標(biāo)文本信息,包括:根據(jù)所述初始文本信息,得到用戶(hù)身份信息,所述用戶(hù)身份信息表征所述用戶(hù)的用戶(hù)身份特征,所述用戶(hù)身份特征包括用戶(hù)年齡、用戶(hù)性別;根據(jù)所述基礎(chǔ)文本信息和所述邏輯校驗(yàn)信息,得到第一校驗(yàn)通過(guò)信息,所述第一校驗(yàn)通過(guò)信息表征所述基礎(chǔ)文本信息的文本內(nèi)容與所述用戶(hù)信息的內(nèi)容特征相匹配;根據(jù)所述基礎(chǔ)文本信息、所述用戶(hù)身份信息和所述第一校驗(yàn)通過(guò)信息,得到第二校驗(yàn)通過(guò)信息,所述第二校驗(yàn)通過(guò)信息表征所述基礎(chǔ)文本信息的文本內(nèi)容與所述用戶(hù)的用戶(hù)身份特征相匹配;根據(jù)所述基礎(chǔ)文本信息和所述第二校驗(yàn)通過(guò)信息,得到所述目標(biāo)文本信息。
5、在一種可能的設(shè)計(jì)中,所述根據(jù)所述基礎(chǔ)文本信息和所述邏輯校驗(yàn)信息,得到目標(biāo)文本信息,包括:將所述基礎(chǔ)文本信息和第一預(yù)設(shè)標(biāo)識(shí)輸入至n個(gè)信息提取模型,得到n個(gè)文本提取信息,所述文本提取信息表征基于所述第一預(yù)設(shè)標(biāo)識(shí)所提取的文本內(nèi)容,所述n為大于等于3的奇數(shù);根據(jù)所述n個(gè)文本提取信息,確定目標(biāo)提取信息,所述目標(biāo)提取信息用于指示基于投票結(jié)果,從所述n個(gè)文本提取信息中確定的得票數(shù)最多的文本提取信息;根據(jù)所述目標(biāo)提取信息和所述邏輯校驗(yàn)信息,得到所述目標(biāo)文本信息。
6、在一種可能的設(shè)計(jì)中,所述根據(jù)所述目標(biāo)提取信息和所述邏輯校驗(yàn)信息,得到所述目標(biāo)文本信息,包括:根據(jù)所述目標(biāo)提取信息,從所述n個(gè)信息提取模型中確定目標(biāo)信息提取模型;將所述基礎(chǔ)文本信息和第二預(yù)設(shè)標(biāo)識(shí)輸入至所述目標(biāo)信息提取模型,得到全量提取信息,所述全量提取信息表征基于所述第二預(yù)設(shè)標(biāo)識(shí)所提取的文本內(nèi)容;根據(jù)所述全量提取信息和所述邏輯校驗(yàn)信息,得到所述目標(biāo)文本信息。
7、在一種可能的設(shè)計(jì)中,所述方法還包括:對(duì)用戶(hù)聲音信息和/或所述用戶(hù)語(yǔ)速信息進(jìn)行量化處理,得到用戶(hù)情緒信息,所述用戶(hù)聲音信息用于指示所述用戶(hù)在通過(guò)語(yǔ)音輸入所述用戶(hù)信息時(shí)的音量大小和/或音調(diào)高低,所述用戶(hù)情緒信息表征所述用戶(hù)對(duì)所述辦理業(yè)務(wù)的關(guān)注程度;基于所述用戶(hù)情緒信息匹配預(yù)設(shè)分級(jí)信息,確定目標(biāo)分級(jí)標(biāo)識(shí),所述預(yù)設(shè)分級(jí)信息表征處理用戶(hù)訴求時(shí)的處理優(yōu)先級(jí),所述目標(biāo)分級(jí)標(biāo)識(shí)用于指示所述用戶(hù)訴求工單對(duì)應(yīng)的目標(biāo)處理優(yōu)先級(jí);基于所述目標(biāo)分級(jí)標(biāo)識(shí)對(duì)所述目標(biāo)文本信息進(jìn)行標(biāo)記,生成分級(jí)文本信息,所述分級(jí)文本信息用于指示可用于生成所述用戶(hù)訴求工單的、且?guī)в兴瞿繕?biāo)處理優(yōu)先級(jí)的文本內(nèi)容。
8、第二方面,本申請(qǐng)?zhí)峁┮环N音頻轉(zhuǎn)文本處理裝置,包括:
9、獲取模塊,用于獲取用戶(hù)音頻信息、用戶(hù)語(yǔ)速信息和邏輯校驗(yàn)信息;其中所述用戶(hù)音頻信息表征用戶(hù)在通過(guò)電話(huà)語(yǔ)音客服辦理業(yè)務(wù)時(shí),通過(guò)語(yǔ)音輸入的用戶(hù)信息;所述用戶(hù)語(yǔ)速信息表征所述用戶(hù)在通過(guò)語(yǔ)音輸入所述用戶(hù)信息時(shí)的說(shuō)話(huà)速度;所述邏輯校驗(yàn)信息表征所述用戶(hù)信息的內(nèi)容特征;
10、第一處理模塊,用于根據(jù)所述用戶(hù)語(yǔ)速信息和業(yè)務(wù)特征標(biāo)識(shí),對(duì)所述用戶(hù)音頻信息分割和/或合并處理,以得到初始文本信息;其中所述業(yè)務(wù)特征標(biāo)識(shí)用于指示具有業(yè)務(wù)特征的詞語(yǔ);
11、第二處理模塊,用于根據(jù)所述初始文本信息,得到用戶(hù)地區(qū)信息;其中,所述用戶(hù)地區(qū)信息用于指示所述用戶(hù)的用戶(hù)所在地區(qū);根據(jù)所述用戶(hù)地區(qū)信息,確定一般性語(yǔ)音特征信息;其中所述一般性語(yǔ)音特征信息表征所述用戶(hù)所在地區(qū)對(duì)應(yīng)的地區(qū)性口音特征;根據(jù)所述一般性語(yǔ)音特征信息和參考語(yǔ)音特征信息,生成校準(zhǔn)調(diào)整信息;其中所述參考語(yǔ)音特征信息表征參考性的語(yǔ)音發(fā)音特征;所述校準(zhǔn)調(diào)整信息表征在對(duì)所述初始文本信息進(jìn)行校準(zhǔn)調(diào)整時(shí)的校準(zhǔn)調(diào)整特征;
12、所述第二處理模塊,還用于根據(jù)所述初始文本信息和所述校準(zhǔn)調(diào)整信息,生成基礎(chǔ)文本信息;
13、確定模塊,用于根據(jù)所述基礎(chǔ)文本信息和所述邏輯校驗(yàn)信息,得到目標(biāo)文本信息,所述邏輯校驗(yàn)信息表征所述用戶(hù)信息的內(nèi)容特征,所述目標(biāo)文本信息用于指示可用于生成用戶(hù)訴求工單的文本內(nèi)容;
14、輸出模塊,用于輸出所述目標(biāo)文本信息。
15、在一種可能的設(shè)計(jì)中,所述第二處理模塊在根據(jù)所述一般性語(yǔ)音特征信息和參考語(yǔ)音特征信息,生成校準(zhǔn)調(diào)整信息時(shí),具體用于:根據(jù)待辦業(yè)務(wù)信息,生成前置參考信息,所述待辦業(yè)務(wù)信息表征所述用戶(hù)所要辦理的業(yè)務(wù)的目標(biāo)業(yè)務(wù)特征,所述前置參考信息表征所述目標(biāo)業(yè)務(wù)特征對(duì)應(yīng)的參考內(nèi)容;響應(yīng)于所述用戶(hù)根據(jù)所述前置參考信息上傳的用戶(hù)驗(yàn)證信息,生成用戶(hù)語(yǔ)音特征信息,所述用戶(hù)驗(yàn)證信息表征所述參考內(nèi)容對(duì)應(yīng)的音頻內(nèi)容,所述用戶(hù)語(yǔ)音特征信息表征所述用戶(hù)的個(gè)人口音特征;根據(jù)所述用戶(hù)語(yǔ)音特征本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種音頻轉(zhuǎn)文本處理方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述一般性語(yǔ)音特征信息和參考語(yǔ)音特征信息,生成校準(zhǔn)調(diào)整信息,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述基礎(chǔ)文本信息和所述邏輯校驗(yàn)信息,得到目標(biāo)文本信息,包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述基礎(chǔ)文本信息和所述邏輯校驗(yàn)信息,得到目標(biāo)文本信息,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述目標(biāo)提取信息和所述邏輯校驗(yàn)信息,得到所述目標(biāo)文本信息,包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
7.一種音頻轉(zhuǎn)文本處理裝置,其特征在于,包括:
8.一種電子設(shè)備,其特征在于,包括:處理器,以及與所述處理器通信連接的存儲(chǔ)器;
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)執(zhí)行指令,所述計(jì)算機(jī)執(zhí)行指令被處理器執(zhí)行時(shí)用于實(shí)現(xiàn)如權(quán)利要求1-6中任一項(xiàng)所述的方法。
10.一種計(jì)算機(jī)程序產(chǎn)品,其
...【技術(shù)特征摘要】
1.一種音頻轉(zhuǎn)文本處理方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述一般性語(yǔ)音特征信息和參考語(yǔ)音特征信息,生成校準(zhǔn)調(diào)整信息,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述基礎(chǔ)文本信息和所述邏輯校驗(yàn)信息,得到目標(biāo)文本信息,包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述基礎(chǔ)文本信息和所述邏輯校驗(yàn)信息,得到目標(biāo)文本信息,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述目標(biāo)提取信息和所述邏輯校驗(yàn)信息,得到所述目標(biāo)文本信...
【專(zhuān)利技術(shù)屬性】
技術(shù)研發(fā)人員:炊向軍,郭敏鴻,范會(huì)善,羅賢桂,趙新陽(yáng),董勁麟,
申請(qǐng)(專(zhuān)利權(quán))人:中國(guó)建設(shè)銀行股份有限公司,
類(lèi)型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。