System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及智能語音對話,具體涉及一種面向對話場景的語義分析方法及系統。
技術介紹
1、智能對話機器人作為近年來熱門科技之一,用于很多主流電商平臺和聊天軟件中,智能對話機器人所提供的服務,不僅僅增加了使用者的便捷性,更可以幫助公司有效的減少成本以及提升企業運行效率,智能對話機器人可以幫助企業過濾掉大量相同的問題,并且把重復性高的以及常見的問題預先交給智能對話機器人來預先做出回答,而剩下的一些冷門少見的問題由智能對話機器人轉交給此企業的服務人員來處理,這樣,不僅對于使用者來說減少了大量的時間來等待服務,而且提升了用戶滿意程度和服務認同度。
2、而智能對話通過獲取文本語義以研究文本信息所包含的真實意義,文本語義分析通過建立模型使計算機能夠模擬人類對自然語言的深層語義進行理解,識別信息中所包含的真實含義,獲取文本的真實語義有助于提高各種自然語言處理頂層任務的處理效果,如機器翻譯、問答系統、對話機器人等。
3、現有的用于智能機器人交互的語義分析方法還存在以下缺點:
4、第一、現有智能語音交互系統大多采用深度學習模型處理用戶提出的文本數據,無法解決系統未經處理過的新問題,且對于用戶提出的上下文信息沒有追蹤功能,導致在深度學習模型中需要處理的文本信息量較大,訓練難度大,比較容易出現語法錯誤;
5、第二、現有的智能語音對話系統需要結合語境回答用戶問題,但是現有的語義分析模型,很難實時記錄交談過程中的語言環境,主要是通過詞向量將對話表示出來,容易在長對話中出現詞不達意的情況,無法根據個人化信息建
技術實現思路
1、本專利技術的目的在于提供面向對話場景的語義分析方法,以解決現有技術中現有模型無法回答系統未經處理過的新問題,且訓練難度大,無法結合語義答復的技術問題。
2、為解決上述技術問題,本專利技術具體提供下述技術方案:
3、本專利技術的第一個方面,提供了一種面向對話場景的語義分析方法,包括以下步驟:
4、獲取某一時段內智能客服對話場景下的文本信息,提取所述文本信息對應的特征矩陣,將所述特征矩陣向量化生成對話知識庫;
5、采用多層關系樹結構擴充所述對話知識庫,將所述對話知識庫采用bert模型生成特征向量,采用milvus開源向量對所述特征向量進行存儲和檢索,獲取所述特征向量訓練樣本集;
6、將所述訓練樣本集包含的文本信息使用bert模型嵌入原始文本數據,獲取基于所述原始文本數據的低緯度密集型詞嵌入矩陣,對所述詞嵌入矩陣采用隱藏狀態可逆計算策略構架基于gru雙向循環神經網絡模型;
7、訓練由所述基于gru雙向循環神經網絡模型獲取的語義分析數據集,采用優化策略測試所述語義分析數據集,獲取深度優化的語義分析數據。
8、作為本專利技術的一種優選方案,提取所述文本信息對應的特征矩陣,包括:
9、采用crafl模型依次訓練所述文本信息,將所述文本信息按序列寫成文本序列,獲取序列型數據;
10、將所述序列型數據作為神經單元循環的輸入文本,采用所述crafl模型的詞嵌入層分布式詞向量訓練文本信息,將訓練好的文本信息轉化為向量矩陣;
11、對所述向量矩陣采取融合注意力機制操作,通過所述融合注意力機制的卷積層從所述向量矩陣中獲取文本信息局部特征,將所述局部特征降維后表示為特征矩陣;
12、對所述特征矩陣通過損失函數對文本語義特征進行分類識別,將識別后的特征矩陣文本信息生成對話知識庫。
13、作為本專利技術的一種優選方案,對所述對話知識庫采用多層關系樹結構進行擴充,包括:
14、將所述對話知識庫按數據集模式分為兩組,且兩組之間通過文本關系相關聯,將兩組數據集分別輸入bert預訓練模型中,通過bert預訓練模型對所述兩組數據集的語音進行微調獲取句子的語義特征矩陣;
15、將所述語義特征矩陣通過特征融合層將所述向量矩陣融合到bilstm中,獲取所述語義特征矩陣中前后語義之間的關系特征矩陣;
16、通過所述bilstm對所述語義特征矩陣進行特征篩選后提取語義特征,并將提取后的語義特征送入所述bert預訓練模型中的關系樹,通過所述關系樹的樹結構分類器對特征語音進行關系識別,并將所述關系識別結果擴充到所述對話知識庫中,輸出對應語義句間關系的特征向量。
17、作為本專利技術的一種優選方案,所述特征向量進行存儲和檢索獲取所述特征向量訓練樣本集,包括:
18、獲取所述特征向量并將所述特征向量擴充至所述對話知識庫中,生成帶有問答的語義問題集合,將所述語義問題集合作為標準問題集,采用所述bert預訓練模型把所述標準問題集內的問題轉化成問題集向量,并將所述問題集向量存儲在milvus中,通過所述milvus中的開源向量對所述問題集向量逐一分配id;
19、將對應所述問題集向量的id與相應的答案存儲在數據庫中,當檢測到對話場景下用戶問題時,通過所述bert預訓練模型將相應的用戶問題轉化為對應的問題集向量,將所述問題集向量在milvus中計算相似度,獲取用戶問題最近似的一個標準問題id,根據所述標準問題id對應所述數據庫中相應的答案。
20、作為本專利技術的一種優選方案,將所述標準問題id通過bert模型對應所述特征向量訓練樣本集,通過所述bert模型的詞嵌入模塊將所述特征向量訓練樣本集的文本信息向量化,采用神經卷積網絡注意力層計算嵌入向量的隱藏狀態,分析所述隱藏狀態間的疊加注意力機制與語義上下文和目標詞之間的交互性,基于所述交互性程度構架基于gru雙向循環神經網絡模型。
21、作為本專利技術的一種優選方案,所述基于gru雙向循環神經網絡模型,包括:
22、采用注意力函數描述語義文本從查詢到一系列鍵值對應的映射關系,獲取語義文本上下文間的目標詞;
23、對所述目標詞使用疊加注意力層將影響語義文本的情感詞進行分類,并通過laplacian概率函數將位置權重添加到所述目標詞對應的詞向量中,獲取詞向量和上下文信息之間的交互;
24、通過gru雙選循環邏輯單元處理詞向量間的交互關系,獲取基于詞向量的隱形語義狀態,將隱形語義狀態以集合形式表示為語義分析數據集,并反饋給線性層進行映射。
25、作為本專利技術的一種優選方案,對所述語義分析數據集采用優化策略進行測試,包括:
26、采用注意力機制的seq結構將所述語義分析數據集生成能夠表達原文重要信息的抽象摘要,通過所述bert模型中的編碼模塊將所述抽象摘要編碼后輸入長短時記憶網絡,對所述抽象摘要進一步提煉,獲取包含深層語義的特征矩陣;
27、將所述包含深層語義的特征矩陣輸入bert模型的解碼模塊進行摘要生成,采用多個網絡進行循環解碼依次生成文本詞匯,獲取文本摘要信息。
28、作為本專利技術的一種優選方案,所述循環解碼在解碼過程中,通過不斷地將前一個時刻的輸出作為后一個時刻本文檔來自技高網...
【技術保護點】
1.一種面向對話場景的語義分析方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的一種面向對話場景的語義分析方法,其特征在于,
3.根據權利要求2所述的一種面向對話場景的語義分析方法,其特征在于,
4.根據權利要求3所述的一種面向對話場景的語義分析方法,其特征在于,
5.根據權利要求4所述的一種面向對話場景的語義分析方法,其特征在于,
6.根據權利要求5所述的一種面向對話場景的語義分析方法,其特征在于,
7.根據權利要求6所述的一種面向對話場景的語義分析方法,其特征在于,
8.根據權利要求7所述的一種面向對話場景的語義分析方法,其特征在于,
9.一種面向對話場景的語義分析方法的系統,其特征在于,
【技術特征摘要】
1.一種面向對話場景的語義分析方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的一種面向對話場景的語義分析方法,其特征在于,
3.根據權利要求2所述的一種面向對話場景的語義分析方法,其特征在于,
4.根據權利要求3所述的一種面向對話場景的語義分析方法,其特征在于,
5.根據權利要求4所述的一種面...
【專利技術屬性】
技術研發人員:蘇茂才,林仁輝,廖峪,
申請(專利權)人:諾比侃人工智能科技成都股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。