System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及數據處理,尤其涉及一種意圖識別的訓練集構建方法、裝置、設備及介質。
技術介紹
1、在產品的意圖識別場景,當用戶在特定產品中輸入關鍵詞或問題時,該特定產品內置的系統能夠根據用戶需求進行意圖識別,并基于識別出的意圖跳轉到相應頁面或修改配置,從而提升產品的智能化水平。例如,當用戶輸入“我想購買xxx”時,系統可以直接跳轉到xxx商品的搜索頁面;當用戶輸入“修改昵稱為xxx”時,系統會自動調用修改昵稱的api,幫助用戶完成昵稱修改。意圖識別的準確率決定了用戶使用產品的體驗和產品的智能化程度,然而開源或閉源的大模型直接應用在意圖識別效果較差。
2、為提升意圖識別的精確度,需針對特定訓練集對模型進行微調或專項訓練。傳統做法依賴于純手工標注來構建樣本識別信息,雖然數據質量可靠,但效率較低。特別是在構建大規模樣本識別信息時,不僅工作量大且重復度高,還可能因不同業務人員遵循的評估標準不一,導致樣本識別信息較為單一,且對應的意圖與真實意圖之間存在偏差,進而影響對模型訓練的準確性。
技術實現思路
1、本申請實施例提供了一種意圖識別的訓練集構建方法、裝置、設備及介質,用于解決相關技術中人工構建大規模樣本識別信息時,樣本識別信息較為單一,且對應的意圖與真實意圖之間存在偏差,進而影響對模型訓練的準確性的問題。
2、第一方面,本申請實施例提供了一種意圖識別的訓練集構建方法,所述方法包括:
3、接收構建完成的每個識別信息和所述每個識別信息的標注意圖;獲取預先保存的每個
4、將獲取到的所述每個識別信息及對應的標注意圖、預先保存的每個意圖及對應的描述信息、以及預設的任一命令語句輸入第一大語言模型中,獲取所述第一大語言模型輸出的每個樣本識別信息和所述每個樣本識別信息對應的目標標注意圖,其中,該命令語句用于提示所述第一大語言模型基于所述每個識別信息和對應的標注意圖構建樣本識別信息;
5、將所述每個樣本識別信息和所述每個樣本識別信息對應的目標標注意圖添加到訓練集中并保存。
6、第二方面,本申請實施例還提供了一種意圖識別的訓練集構建裝置,所述裝置包括:
7、接收獲取模塊,用于接收構建完成的每個識別信息和所述每個識別信息的標注意圖;獲取預先保存的每個意圖和所述每個意圖的描述信息;
8、處理模塊,用于將獲取到的所述每個識別信息及對應的標注意圖、預先保存的每個意圖及對應的描述信息、以及預設的任一命令語句輸入第一大語言模型中,獲取所述第一大語言模型輸出的每個樣本識別信息和所述每個樣本識別信息對應的目標標注意圖,其中,該命令語句用于提示所述第一大語言模型基于所述每個識別信息和對應的標注意圖構建樣本識別信息;將所述每個樣本識別信息和所述每個樣本識別信息對應的目標標注意圖添加到訓練集中并保存。
9、第三方面,本申請實施例還提供了一種電子設備,包括:
10、存儲器,用于存儲程序指令;
11、處理器,用于調用所述存儲器中存儲的程序指令,按照獲得的程序指令執行上述任一項所述意圖識別的訓練集構建的方法包括的步驟。
12、第四方面,本申請實施例還提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序包括程序指令,所述程序指令當被計算機執行時,使所述計算機執行如上述任一項所述意圖識別的訓練集構建的方法。
13、在本申請實施例中,電子設備接收構建完成的每個識別信息和每個識別信息的標注意圖;獲取預先保存的每個意圖和每個意圖的描述信息;將獲取到的每個識別信息及對應的標注意圖、預先保存的每個意圖及對應的描述信息、以及預設的任一命令語句輸入第一大語言模型中,獲取第一大語言模型輸出的每個樣本識別信息和每個樣本識別信息對應的目標標注意圖,其中,該命令語句用于提示第一大語言模型基于每個識別信息和對應的標注意圖構建樣本識別信息;將每個樣本識別信息和每個樣本識別信息對應的目標標注意圖添加到訓練集中并保存。由于在本申請實施例中,電子設備基于準確的識別信息和對應的標注意圖,以及大語言模型進行樣本識別信息的構建,可以提高樣本識別信息和對應的目標標注意圖的準確性,且,大語言模型基于預先保存的每個意圖和每個意圖的描述信息,進行樣本識別信息的構建,可以提高大語言模型對意圖的理解,進而提高樣本識別信息和對應的目標標注意圖的準確性,從而可以提高模型訓練的準確性。
本文檔來自技高網...【技術保護點】
1.一種意圖識別的訓練集構建方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述獲取所述第一大語言模型輸出的每個樣本識別信息和所述每個樣本識別信息對應的目標標注意圖之后,所述將所述每個樣本識別信息和所述每個樣本識別信息對應的目標標注意圖添加到訓練集中并保存之前,所述方法還包括:
3.根據權利要求1所述的方法,其特征在于,所述將獲取到的所述每個識別信息及對應的標注意圖、預先保存的每個意圖及對應的描述信息、以及預設的任一命令語句輸入第一大語言模型中之前,所述方法還包括:
4.根據權利要求1所述的方法,其特征在于,所述方法還包括:
5.根據權利要求4所述的方法,其特征在于,若所述標準識別意圖和該樣本識別信息對應的目標標注意圖不同,所述方法還包括:
6.根據權利要求1所述的方法,其特征在于,所述接收構建完成的每個識別信息和所述每個識別信息的標注意圖之后,所述將獲取到的所述每個識別信息及對應的標注意圖、預先保存的每個意圖及對應的描述信息、以及預設的任一命令語句輸入第一大語言模型中之前,所述方法還包括:<
...【技術特征摘要】
1.一種意圖識別的訓練集構建方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述獲取所述第一大語言模型輸出的每個樣本識別信息和所述每個樣本識別信息對應的目標標注意圖之后,所述將所述每個樣本識別信息和所述每個樣本識別信息對應的目標標注意圖添加到訓練集中并保存之前,所述方法還包括:
3.根據權利要求1所述的方法,其特征在于,所述將獲取到的所述每個識別信息及對應的標注意圖、預先保存的每個意圖及對應的描述信息、以及預設的任一命令語句輸入第一大語言模型中之前,所述方法還包括:
4.根據權利要求1所述的方法,其特征在于,所述方法還包括:
5.根據權利要求4所述的方法,其特征在于,若所述標準識別意圖和該樣本識別信息對應的目標標注意圖不同,所述方法還包括:
6.根據權利要求1所述的方法,其特征在于,所述接收構建完成的每...
【專利技術屬性】
技術研發人員:侯召祥,
申請(專利權)人:新奧新智科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。