System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
所屬的技術人員知道,本申請可以實現為系統、方法或計算機程序產品。因此,本公開可以具體實現為以下形式,即:可以是完全的硬件、也可以是完全的軟件(包括固件、駐留軟件、微代碼等),還可以是硬件和軟件結合的形式,本文一般稱為“電路”、“模塊”或“系統”。此外,在一些實施例中,本申請還可以實現為在一個或多個計算機可讀介質中的計算機程序產品的形式,該計算機可讀介質中包含計算機可讀的程序代碼。可以采用一個或多個計算機可讀的介質的任意組合。計算機可讀介質可以是計算機可讀信號介質或者計算機可讀存儲介質。計算機可讀存儲介質例如可以是一一但不限于——電、磁、光、電磁、紅外線、或半導體的系統、裝置或器件,或者任意以上的組合。計算機可讀存儲介質的更具體的例子(非窮舉的列表)包括:具有一個或多個導線的電連接、便攜式計算機磁盤、硬盤、隨機存取存儲器(ram),只讀存儲器(rom)、可擦式可編程只讀存儲器(eprom或閃存)、光纖、便攜式緊湊磁盤只讀存儲器(cd-rom)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。在本文件中,計算機可讀存儲介質可以是任何包含或存儲程序的有形介質,該程序可以被指令執行系統、裝置或者器件使用或者與其結合使用。盡管上面已經示出和描述了本申請的實施例,可以理解的是,上述實施例是示例性的,不能理解為對本申請的限制,本領域的普通技術人員在本申請的范圍內可以對上述實施例進行變化、修改、替換和變型。在此基礎上,可以對本申請進行多種替換和改進,這些均落入本申請的保護范圍內。
技術介紹
1、傳統意圖識別采用nlp的方式來進行意圖識別,使用
2、1.語言的多樣性和復雜性:
3、1.1口音和方言問題:不同地區的人有不同的口音、方言和語言習慣,這會導致語音的發音、語調、語速等方面存在差異,增加了識別的難度。例如,一些南方地區的方言在發音和用詞上與普通話有較大差異,可能導致模型對這些地區用戶的聲音意圖識別準確率下降。對于一些小眾的方言或特定地區的語言變體,模型的訓練數據可能不足,難以準確理解和識別。
4、1.2語言表達的多樣性:人們對于同一個意圖可能有多種不同的表達方式,而且語言表達往往具有靈活性和創造性,這給模型的學習和理解帶來了挑戰。例如,“我想吃飯”“我餓了,想吃點東西”“我要找點吃的”等不同的表述都可能表達的是相同的吃飯意圖,但在文本上有很大的差異,模型需要能夠準確地理解這些不同的表達方式并識別出其背后的意圖。
5、1.3語義理解的困難:語言中存在著一詞多義、多詞一義、隱喻、反諷等復雜的語義現象,這使得準確理解句子的真正含義變得困難。例如,“我今天有點冷”,既可能是單純地表達身體感覺冷的意思,也可能是一種委婉的表達,暗示需要關心或其他隱含的意圖,nlp模型在理解這種具有歧義的表述時可能會出現錯誤。
6、2.數據質量和數量的限制:
7、2.1數據偏差:訓練nlp模型的數據可能存在偏差,導致模型對某些特定群體或場景的意圖識別不準確。例如,如果訓練數據主要來自于城市地區的用戶,那么對于農村地區用戶的聲音意圖可能識別效果不佳。此外,數據集中可能存在某些類型的意圖被過度代表,而其他類型的意圖則被忽視,這會影響模型的泛化能力。
8、2.2數據標注的準確性:準確的標注對于nlp模型的訓練至關重要,但數據標注過程可能存在錯誤或不一致性。人工標注數據需要耗費大量的時間和精力,而且標注人員的主觀理解和判斷也可能導致標注結果的差異。如果標注數據不準確,模型就會學習到錯誤的模式,從而影響意圖識別的準確性。
9、2.3數據量的不足:對于一些特定領域或罕見的意圖,可能缺乏足夠的訓練數據。nlp模型需要大量的數據來學習語言的模式和規律,如果數據量不足,模型就無法充分學習到相關的特征,導致對這些罕見意圖的識別能力較差。
技術實現思路
1、本申請提供了一種基于聲音的多元意圖識別方法及系統,用以在面向復雜語言語義的場景下提高意圖識別的準確性。
2、第一方面,提供了一種基于聲音的多元意圖識別方法,包括以下步驟:
3、對用戶聲音流進行轉換,得到語音文本;
4、對所述語音文本進行多元意圖識別,得到多元意圖識別結果。
5、在上述技術方案中,通過對用戶聲音流進行轉換,得到語音文本;對所述語音文本進行多元意圖識別,得到多元意圖識別結果;對比使用nlp進行語義意圖識別,采用大模型技術將語義按照目標意圖,動作意圖,參數意圖,情感意圖,潛在意圖等分類模型將用戶意圖多元識別分析后將更準確的識別用戶意圖;意圖識別大模型技術解決了nlp因缺乏足夠的訓練數據,數據標注不準導致的理解偏差帶來的問題。
6、在一個具體可實施方案中,對用戶聲音流進行轉換,得到語音文本的步驟,具體為:
7、通過語音識別模型對用戶聲音流進行轉換,得到所述語音文本。
8、在一個具體可實施方案中,對所述語音文本進行多元意圖識別,得到多元意圖識別結果的步驟,具體為:
9、通過意圖識別多元模型對所述語音文本進行多元意圖識別,得到所述多元意圖識別結果。
10、在一個具體可實施方案中,還包括:
11、對用戶的語音進行采集,得到所述用戶聲音流。
12、在一個具體可實施方案中,還包括:
13、對所述多元意圖識別結果進行輸出。
14、在一個具體可實施方案中,所述多元意圖識別結果包括目標意圖,動作意圖,參數意圖、情感意圖和潛在意圖。
15、在一個具體可實施方案中,所述語音識別模型包括隱馬爾可夫模型。
16、在一個具體可實施方案中,所述意圖識別多元模型包括基于大模型的意圖識別多元模型。
17、在一個具體可實施方案中,所述大模型包括大語言模型。
18、第二方面,提供了一種基于聲音的多元意圖識別系統,包括:
19、輸入模塊,用于對用戶的語音進行采集,得到所述用戶聲音流;
20、文字模塊,用于對用戶聲音流進行轉換,得到語音文本;
21、識別模塊,用于對所述語音文本進行多元意圖識別,得到多元意圖識別結果;
22、輸出模塊,用于對所述多元意圖識別結果進行輸出。
23、在上述技術方案中,通過對用戶聲音流進行轉換,得到語音文本;對所述語音文本進行多元意圖識別,得到多元意圖識別結果;對比使用nlp進行語義意圖識別,采用大模型技術將語義按照目標意圖,動作意圖,參數意圖,情感意圖,潛在意圖等分類模型將用戶意圖多元識別分析后將更準確的識別用戶意圖;意圖識別大模型技術解決了nlp因缺乏足夠的訓練數據,數據標注不準導致的理解偏差帶來的問題。
本文檔來自技高網...【技術保護點】
1.一種基于聲音的多元意圖識別方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的基于聲音的多元意圖識別方法,其特征在于,對用戶聲音流進行轉換,得到語音文本的步驟,具體為:
3.根據權利要求2所述的基于聲音的多元意圖識別方法,其特征在于,對所述語音文本進行多元意圖識別,得到多元意圖識別結果的步驟,具體為:
4.根據權利要求3所述的基于聲音的多元意圖識別方法,其特征在于,還包括:
5.根據權利要求4所述的基于聲音的多元意圖識別方法,其特征在于,還包括:
6.根據權利要求5所述的基于聲音的多元意圖識別方法,其特征在于,所述多元意圖識別結果包括目標意圖,動作意圖,參數意圖、情感意圖和潛在意圖。
7.根據權利要求6所述的基于聲音的多元意圖識別方法,其特征在于,所述語音識別模型包括隱馬爾可夫模型。
8.根據權利要求7所述的基于聲音的多元意圖識別方法,其特征在于,所述意圖識別多元模型包括基于大模型的意圖識別多元模型。
9.根據權利要求8所述的基于聲音的多元意圖識別方法,其特征在于,所述大模型
10.一種基于聲音的多元意圖識別系統,其特征在于,包括:
...【技術特征摘要】
1.一種基于聲音的多元意圖識別方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的基于聲音的多元意圖識別方法,其特征在于,對用戶聲音流進行轉換,得到語音文本的步驟,具體為:
3.根據權利要求2所述的基于聲音的多元意圖識別方法,其特征在于,對所述語音文本進行多元意圖識別,得到多元意圖識別結果的步驟,具體為:
4.根據權利要求3所述的基于聲音的多元意圖識別方法,其特征在于,還包括:
5.根據權利要求4所述的基于聲音的多元意圖識別方法,其特征在于,還包括:
6.根據權利要求5...
【專利技術屬性】
技術研發人員:呂文博,石權利,張存,
申請(專利權)人:陽光數智科技有限責任公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。