模型微調方法、裝置、設備及存儲介質制造方法及圖紙

技術編號：43544735 閱讀：8 留言：0更新日期：2024-12-03 12:25

本公開涉及一種模型微調方法、裝置、設備及存儲介質。獲取至少一條密文微調數據；密文微調數據為數據方利用密碼本對明文微調數據進行替換得到的密文數據；每條明文微調數據包括第一明文輸入和第一明文輸出，每條密文微調數據包括利用密碼本對第一明文輸入進行替換后得到的第一密文輸入和利用密碼本對第一明文輸出進行替換后的第一密文輸出；利用至少一條密文微調數據微調語言模型；其中，以使語言模型對第一密文輸入進行處理得到的輸出與第一密文輸出之間的差異減小為目標調整語言模型。由此，模型方在不接觸數據方的明文微調數據的情況下即可實現微調，從而可以在保護數據隱私的同時使得微調后模型能夠匹配數據方的垂類場景。

全部詳細技術資料下載

【技術實現步驟摘要】

本公開涉及計算機計算和數據加密，特別是涉及一種模型微調方法、裝置、設備及存儲介質。

技術介紹

1、隨著人工智能技術的快速發(fā)展，大語言模型(large?language?model，llm)在多種應用場景中發(fā)揮著重要作用。隨著大語言模型應用場景的不斷擴展，基于基礎大語言模型利用垂類場景的業(yè)務數據進行模型微調，從而將微調后的模型應用于垂類場景，解決垂類場景的業(yè)務問題，成為業(yè)務首選的解決方案。

2、應用場景的業(yè)務數據轉化為微調數據后進一步訓練大語言模型成為提升業(yè)務效果的關鍵步驟，而應用場景的業(yè)務數據一般都包含部分商業(yè)機密，不愿意公開或者提供給第三方。所以微調數據的隱私保護成為一個關鍵問題，特別是在醫(yī)療、社交、軍事等場景中，微調數據隱私保護成為大語言模型繼續(xù)發(fā)展的挑戰(zhàn)。

3、目前，很多企業(yè)有l(wèi)lm技術能力，但是沒有業(yè)務數據；而很多企業(yè)有業(yè)務數據，比如醫(yī)院等，但沒有l(wèi)lm技術，無法利用llm挖掘業(yè)務數據的價值；兩者是矛盾的。而很多業(yè)務數據是有隱私要求的，不可能輕易提供給外部企業(yè)。所以，有技術的公司和有數據的公司合作，也會有很多限制，無法基于llm對數據進行有效的利用。而在使用原始開源模型時，業(yè)務效果和、垂類場景無法完全匹配，影響用戶體驗。

4、因此，需要一種能夠解決微調數據隱私問題的模型微調方案。

技術實現思路

1、本公開要解決的一個技術問題是，如何解決微調數據隱私問題。

2、根據本公開的第一個方面，提供了一種模型微調方法，包括：獲取至少一條密

3、可選地，所述密碼本包括第一密碼本，所述第一密碼本用于表征語言模型的詞元列表中的各個詞元與第一密文之間的對應關系，所述第一密文輸入由所述第一明文輸入中的各個詞元所對應的第一密文組成，所述第一密文輸出由所述第一明文輸出中的各個詞元所對應的第一密文組成；或者所述密碼本包括第二密碼本，所述第二密碼本用于表征語言模型的詞元編碼列表中的各個詞元編碼與第二密文之間的對應關系，所述第一密文輸入由所述第一明文輸入中的各個詞元的詞元編碼所對應的第二密文組成，所述第一密文輸出由所述第一明文輸出中的各個詞元的詞元編碼所對應的第二密文組成。

4、可選地，對于所述詞元列表中的任意一個詞元，與該詞元對應的第一密文為所述詞元列表中不同于該詞元的詞元。

5、可選地，所述第一密碼本是通過人為定義的方式得到的；或者所述第一密碼本是通過迭代執(zhí)行如下流程得到的：遍歷所述詞元列表，針對當前遍歷到的詞元，隨機挑選所述詞元列表中未被挑選過且不同于該詞元的詞元，作為與該詞元對應的第一密文。

6、可選地，對于所述詞元列表中的任意一個詞元，與該詞元對應的第一密文為利用哈希算法對該詞元進行哈希處理得到的哈希值，或者與該詞元對應的第一密文為利用加密算法對該詞元進行加密處理得到的加密結果。

7、可選地，對于所述詞元編碼列表中的任意一個詞元編碼，與該詞元編碼對應的第二密文為所有詞元編碼中不同于該詞元編碼的詞元編碼。

8、可選地，所述第二密碼本是通過人為定義的方式得到的；或者所述第二密碼本是通過迭代執(zhí)行如下流程得到的：遍歷所述詞元編碼列表，針對當前遍歷到的詞元編碼，隨機挑選所述詞元編碼列表中未被挑選過且不同于該詞元編碼的詞元編碼，作為與該詞元編碼對應的第二密文。

9、可選地，對于所述詞元編碼列表中的任意一個詞元編碼，與該詞元編碼對應的第二密文是利用哈希算法對該詞元編碼進行哈希處理得到的哈希值，或者與該詞元編碼對應的第二密文是利用加密算法對該詞元編碼進行加密處理得到的加密結果。

10、可選地，該方法還包括：獲取第二密文輸入，所述第二密文輸入為所述數據方利用所述第一密碼本或所述第二密碼本對第二明文輸入進行替換得到的密文數據；所述第二密文輸入由所述第二明文輸入中的各個詞元所對應的第一密文組成，或者所述第二密文輸入由所述第二明文輸入中各個詞元的詞元編碼所對應的第二密文組成；利用微調后的語言模型對所述第二密文輸入進行處理，得到與所述第二密文輸入對應的第二密文輸出；將所述第二密文輸出發(fā)送給所述數據方。

11、根據本公開的第二個方面，提供了一種模型微調方法，包括：針對語言模型構造密碼本；利用所述密碼本將至少一條明文微調數據替換為對應的密文微調數據；每條所述明文微調數據包括第一明文輸入和第一明文輸出，每條所述密文微調數據包括利用所述密碼本對所述第一明文輸入進行替換后得到的第一密文輸入和利用所述密碼本對所述第一明文輸出進行替換后的第一密文輸出；將所述密文微調數據發(fā)送給模型方，以由所述模型方基于所述密文微調數據微調所述語言模型。

12、可選地，所述密碼本包括第一密碼本，所述第一密碼本用于表征所述語言模型的詞元列表中的各個詞元與第一密文之間的對應關系，所述第一密文輸入由所述第一明文輸入中的各個詞元所對應的第一密文組成，所述第一密文輸出由所述第一明文輸出中的各個詞元所對應的第一密文組成；或者，所述密碼本包括第二密碼本，所述第二密碼本用于表征所述語言模型的詞元編碼列表中的各個詞元編碼與第二密文之間的對應關系，所述第一密文輸入由所述第一明文輸入中的各個詞元的詞元編碼所對應的第二密文組成，所述第一密文輸出由所述第一明文輸出中的各個詞元的詞元編碼所對應的第二密文組成。

13、可選地，對于所述詞元列表中的任意一個詞元，與該詞元對應的第一密文為所述詞元列表中不同于該詞元的詞元。

14、可選地，針對語言模型構造密碼本的步驟包括：通過人為定義的方式得到所述第一密碼本；或者通過迭代執(zhí)行如下流程得到所述第一密碼本：遍歷所述詞元列表，針對當前遍歷到的詞元，隨機挑選所述詞元列表中未被挑選過且不同于該詞元的詞元，作為與該詞元對應的第一密文。

15、可選地，針對語言模型構造密碼本的步驟包括：針對所述詞元列表中的任意一個詞元，將利用哈希算法對該詞元進行哈希處理得到的哈希值作為與該詞元對應的第一密文，或者將利用加密算法對該詞元進行加密處理得到的加密結果作為與該詞元對應的第一密文。

16、可選地，對于所述詞元編碼列表中的任意一個詞元編碼，與該詞元編碼對應的第二密文為所有詞元編碼中不同于該詞元編碼的詞元編碼。

17、可選地，針對語言模型構造密碼本的步驟包括：通過人為定義的方式得到所述第二密碼本；或者通過迭代執(zhí)行如下流程得到所述第二密碼本：遍歷所述詞元編碼列表，針對當前遍歷到的詞元編碼，隨機挑選所述詞元編碼列表中未被挑選過且不同于該詞元編碼的本文檔來自技高網...

【技術保護點】

1.一種模型微調方法，其特征在于，包括：

2.根據權利要求1所述的方法，其特征在于，

3.一種模型微調方法，其特征在于，包括：

4.根據權利要求3所述的方法，其特征在于，

5.根據權利要求4所述的方法，其特征在于，還包括：

6.一種模型微調裝置，其特征在于，包括：

7.一種模型微調裝置，其特征在于，包括：

8.一種計算設備，包括：

9.一種計算機程序產品，包括可執(zhí)行代碼，當所述可執(zhí)行代碼被電子設備的處理器執(zhí)行時，使所述處理器執(zhí)行如權利要求1至5中任何一項所述的方法。

10.一種非暫時性機器可讀存儲介質，其上存儲有可執(zhí)行代碼，當所述可執(zhí)行代碼被電子設備的處理器執(zhí)行時，使所述處理器執(zhí)行如權利要求1至5中任何一項所述的方法。

【技術特征摘要】

1.一種模型微調方法，其特征在于，包括：

2.根據權利要求1所述的方法，其特征在于，

3.一種模型微調方法，其特征在于，包括：

4.根據權利要求3所述的方法，其特征在于，

5.根據權利要求4所述的方法，其特征在于，還包括：

6.一種模型微調裝置，其特征在于，包括：

7.一種模型微調裝置，其特征在...

【專利技術屬性】
技術研發(fā)人員：黃春剛，
申請(專利權)人：第四范式北京技術有限公司，
類型：發(fā)明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

發(fā)布您的意見

相關領域技術