壞例挖掘方法、裝置和存儲介質制造方法及圖紙

技術編號：38558215 閱讀：24 留言：0更新日期：2023-08-22 21:00

本公開提供了壞例挖掘方法、裝置和存儲介質，涉及人工智能技術領域，具體涉及無人駕駛、車聯網、語音語義等技術領域。獲取數據樣本，所述數據樣本包括歷史輸入至交互設備的至少一個指令數據以及所述交互設備確定出的所述指令數據的線上分類結果；確定指令分類信息，所述指令分類信息用于對指令數據進行分類；將所述至少一個指令數據和所述指令分類信息輸入至大語言模型，以使得所述大語言模型基于所述指令分類信息確定出所述至少一個指令數據分別對應的AI分類結果；基于所述指令數據的AI分類結果與所述指令數據對應的線上分類結果挖掘壞例。本公開的方法中壞例挖掘的準確性和效率均較高。率均較高。率均較高。

全部詳細技術資料下載

【技術實現步驟摘要】
壞例挖掘方法、裝置和存儲介質

[0001]本公開涉及人工智能
，具體涉及無人駕駛、車聯網、語音語義等技術，尤其涉及一種壞例挖掘方法、裝置和存儲介質。

技術介紹

[0002]用戶與交互設備進行人機交互時通常會出現設備無法正確解析用戶的輸入指令(如語音輸入)的情況，這類輸入樣例被稱為壞例(badcase)。
[0003]相關技術中，通常需要挖掘出壞例，以便后續可以基于所挖掘出的壞例來進一步優化設備對于輸入指令的解析能力，提升用戶體驗。

技術實現思路

[0004]本公開提供了一種壞例挖掘方法及其裝置。
[0005]根據本公開的第一方面，提供了一種壞例挖掘方法，包括：
[0006]獲取數據樣本，所述數據樣本包括歷史輸入至交互設備的至少一個指令數據以及所述交互設備確定出的所述指令數據的線上分類結果；
[0007]確定指令分類信息，所述指令分類信息用于對指令數據進行分類；
[0008]將所述至少一個指令數據和所述指令分類信息輸入至大語言模型，以使得所述大語言模型基于所述指令分類信息確定出所述至少一個指令數據分別對應的AI分類結果；
[0009]基于所述指令數據的AI分類結果與所述指令數據對應的線上分類結果挖掘壞例。
[0010]根據本公開的第二方面，提供了一種壞例挖掘裝置，包括：
[0011]獲取模塊，用于獲取數據樣本，所述數據樣本包括歷史輸入至交互設備的至少一個指令數據以及所述交互設備確定出的所述指令數據的線上分類結果；
[0012]...

【技術保護點】

【技術特征摘要】
1.一種壞例挖掘方法，其特征在于，包括：獲取數據樣本，所述數據樣本包括歷史輸入至交互設備的至少一個指令數據以及所述交互設備確定出的所述指令數據的線上分類結果；確定指令分類信息，所述指令分類信息用于對指令數據進行分類；將所述至少一個指令數據和所述指令分類信息輸入至大語言模型，以使得所述大語言模型基于所述指令分類信息確定出所述至少一個指令數據分別對應的AI分類結果；基于所述指令數據的AI分類結果與所述指令數據對應的線上分類結果挖掘壞例。2.根據權利要求1所述的方法，其特征在于，所述大語言模型的訓練數據可實時更新。3.根據權利要求1或2所述的方法，其特征在于，所述指令分類信息包括以下至少之一：至少一個指令類別；每個指令類別對應的類別描述；所述類別描述用于描述屬于所述指令類別的指令數據所對應的特征；每個指令類別對應的至少一個示例指令。4.根據權利要求1或2所述的方法，其特征在于，所述基于所述指令數據的AI分類結果與所述指令數據對應的線上分類結果挖掘壞例，包括：確定所述指令數據的AI分類結果與所述指令數據對應的線上分類結果是否一致；響應于所述指令數據的AI分類結果與所述指令數據對應的線上分類結果一致，確定所述指令數據為非壞例；響應于所述指令數據的AI分類結果與所述指令數據對應的線上分類結果不一致，確定所述指令數據為壞例。5.根據權利要求1或2所述的方法，其特征在于，所述獲取數據樣本，包括：從數據日志中獲取原始數據；對所述原始數據進行數據清洗以得到至少一個指令數據；從所述原始數據中選擇出各個指令數據對應的線上分類結果；將所述至少一個指令數據以及所述至少一個指令數據對應的線上分類結果確定為數據樣本。6.根據權利要求5所述的方法，其特征在于，所述方法還包括：將所述線上分類結果和所述AI分類結果分別轉換為可被識別字符。7.根據權利要求6所述的方法，其特征在于，所述基于所述指令數據的AI分類結果與所述指令數據對應的線上分類結果挖掘壞例，包括：確定所述指令數據的AI分類結果對應的可被識別字符與所述指令數據對應的線上分類結果所對應的可被識別字符是否一致；響應于所述指令數據的AI分類結果對應的可被識別字符與所述指令數據對應的線上分類結果所對應的可被識別字符一致，確定所述指令數據為非壞例；響應于所述指令數據的AI分類結果對應的可被識別字符與所述指令數據對應的線上分類結果所對應的可被識別字符不一致，確定所述指令數據為壞例。8.一種壞例挖掘裝置，其特征在于，包括：獲取模塊，用于獲取數據樣本，所述數據樣本包括歷史輸入至交互設備的至少一個指令數據以及所述交互設備確定出的所述指令數據的線上分類結果；
確定模塊，用于確定指令分類信息，所述指令分類信息用于對指令數據進行分類；輸入模塊，用于將所述至少一個...

【專利技術屬性】
技術研發人員：王雪如，陳婧妍，
申請(專利權)人：阿波羅智聯北京科技有限公司，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術