System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于人工智能,具體涉及一種基于大語言模型和范文模板的文章智能生成方法。
技術介紹
1、隨著人工智能(artificial?intelligence,ai)技術的發展,ai輔助寫作技術越來越被廣泛應用,現有的ai輔助寫作技術主要依賴于大語言模型的自由創作能力,主要有兩種技術實現方式:
2、一種是用戶用自然語言描述標題和寫作要求,然后根據大語言模型本身的編碼轉化能力,自動完成寫作任務,另一種是人機交互式的聯想寫作,在用戶寫作的過程中,算法模型根據用戶已經輸入的上下文信息,根據馬爾科夫鏈等概率統計模型或深度學習模型,進行自動語義聯想,推薦后續的詞匯、語句或段落。
3、然而,采用這樣的方式,由于通過大語言模型自動生成的文字內容往往會有信息“幻覺”,即不符合實際情況或違背常識,且生成的文字內容缺少,文章生成內容的字數規模和深度不夠,同時由于ai輔助寫作主要是基于一般常識生成文字內容,對現有業務活動中的經驗和思維模型難以充分借鑒和繼承,生成的內容往往與業務不一致,且如果生成文字段落過長,會導致“主題漂移”等問題,生成的文字內容質量會降低。
技術實現思路
1、本專利技術的目的是提供一種基于大語言模型和范文模板的文章智能生成方法,用以解決現有技術中存在的ai輔助寫作生成的內容字數規模和深度不夠以及內容質量差的問題。
2、為了實現上述目的,本專利技術采用以下技術方案:
3、第一方面,本專利技術提供了一種基于大語言模型和范文模板的文章智能生成方
4、基于待生成文章的文章標題和文章類型,從范文模板庫中匹配出與所述文章類型相同且與所述文章標題匹配的多個范文模板;
5、對于所述待生成文章的任一級標題,基于所述任一級標題與各范文模板中各層級標題的匹配度,確定出用于生成所述任一級標題的下一級標題的候選參考標題;
6、基于所述候選參考標題的下一級標題,生成所述任一級標題的下一級標題;
7、從文檔資料庫中查找出與所述待生成文章的各級葉子標題匹配的文檔素材,其中葉子標題為所述待生成文章的所有標題中最低層級的標題;
8、基于各級葉子標題匹配的文檔素材,通過大語言模型生成各級葉子標題的正文內容;
9、將所述待生成文章的各級標題以及各級葉子標題的正文內容組合,得到所述待生成文章的文章內容。
10、基于上述公開的內容,本專利技術通過基于待生成文章的文章標題和文章類型,從范文模板庫中匹配出與文章類型相同且與文章標題匹配的多個范文模板;對于待生成文章的任一級標題,基于任一級標題與各范文模板中各層級標題的匹配度,確定出用于生成任一級標題的下一級標題的候選參考標題;基于候選參考標題的下一級標題,生成任一級標題的下一級標題;從文檔資料庫中查找出與待生成文章的各級葉子標題匹配的文檔素材;基于各級葉子標題匹配的文檔素材,通過大語言模型生成各級葉子標題的正文內容;將待生成文章的各級標題以及各級葉子標題的正文內容組合,得到待生成文章的文章內容。如此,在ai輔助寫作時,能夠參考標范文模板的寫作框架進行參考和學習,使得文章內容結構符合業務要求,同時基于同類型的文檔素材分別生成各級標題下的內容,使得生成的文章內容的字數規模和深度滿足要求,此外ai輔助寫作的范文模板與待生成文章的文章類型相同且文章標題匹配,使得生成的內容與用戶的業務保持一致,消除了寫作內容的“幻覺”。
11、在一個可能的設計中,所述方法還包括:
12、基于非葉子標題的下級標題的內容,通過大語言模型生成非葉子標題的摘要;
13、所述將所述待生成文章的各級標題以及各級葉子標題的正文內容組合,得到所述待生成文章的文章內容,包括:
14、將所述待生成文章的各級標題、各級葉子標題的正文內容以及非葉子標題的摘要組合,得到所述待生成文章的文章內容。
15、在一個可能的設計中,所述方法還包括:
16、響應用戶發起的精簡操作,通過大語言模型對所述文章內容中被選取的內容進行自動精簡。
17、在一個可能的設計中,所述方法還包括:
18、響應用戶發起的詞匯替換操作,通過大語言模型推薦并確認出被選取詞匯的同義詞或近義詞;
19、利用被選取詞匯的同義詞或近義詞替換掉被選取詞匯。
20、在一個可能的設計中,所述方法還包括:
21、檢測所述文章內容中是否存在禁用詞;
22、如果所述文章內容中存在禁用詞,則對所述文章內容中的禁用詞進行標注;
23、檢測所述文章內容中是否存在ai固化表達內容;
24、如果所述文章內容中存在ai固化表達內容,則刪除所述ai固化表達內容或通過大語言模型調整所述ai固化表達內容的表述方式。
25、在一個可能的設計中,當所述任一級標題為文章標題時,所述任一級標題與范文模板中對應層級標題的匹配度為:
26、score(vi,vj)=sim(vi,vj);
27、當所述任一級標題為文章標題外的其余標題時,所述任一級標題與范文模板中待匹配的候選標題的匹配度為:
28、score(vi,vj)=score(vp(i),vp(j))×sim(vi,vj);
29、其中,score(vi,vj)表示所述待生成文章的任一級標題i與范文模板中待匹配的候選標題j之間的匹配度,sim(vi,vj)表示所述待生成文章的任一級標題i與范文模板中待匹配的候選標題j之間的語義相似度,score(vp(i),vp(j))表示所述任一級標題i的上一級標題與范文模板中待匹配的候選標題j的上一級標題之間的匹配度。
30、在一個可能的設計中,所述從文檔資料庫中查找出與所述待生成文章的各級葉子標題匹配的文檔素材,包括:
31、對于所述待生成文章的任一級葉子標題,將所述任一級葉子標題與所述任一級葉子標題的所有上級標題進行組合,得到所述任一級葉子標題所對應的字符串組合;
32、將所述任一級葉子標題所對應的字符串組合與文檔資料庫中各文檔素材的文檔塊進行語義相似度匹配,得到與所述任一級葉子標題匹配的文檔素材;
33、其中,文檔資料庫中的每個文檔素材均按照預設長度劃分為多個文檔塊。
34、在一個可能的設計中,所述基于各級葉子標題匹配的文檔素材,通過大語言模型生成各級葉子標題的正文內容,包括:
35、根據各級葉子標題的標題內容生成任務提示詞;
36、以各級葉子標題匹配的文檔素材為參考依據,通過大語言生成與各級葉子標題所對應任務提示詞相關的正文內容。
37、第二方面,本專利技術提供了一種基于大語言模型和范文模板的文章智能生成裝置,包括:
38、匹配單元,用于基于待生成文章的文章標題和文章類型,從范文模板庫中匹配出與所述文章類型相同且與所述文章標題匹配的多個范文模板;
39、確定單元,用于對于所述待生成文章的本文檔來自技高網...
【技術保護點】
1.一種基于大語言模型和范文模板的文章智能生成方法,其特征在于,包括:
2.根據權利要求1所述的基于大語言模型和范文模板的文章智能生成方法,其特征在于,所述方法還包括:
3.根據權利要求1所述的基于大語言模型和范文模板的文章智能生成方法,其特征在于,所述方法還包括:
4.根據權利要求1所述的基于大語言模型和范文模板的文章智能生成方法,其特征在于,所述方法還包括:
5.根據權利要求1所述的基于大語言模型和范文模板的文章智能生成方法,其特征在于,所述方法還包括:
6.根據權利要求1所述的基于大語言模型和范文模板的文章智能生成方法,其特征在于,當所述任一級標題為文章標題時,所述任一級標題與范文模板中待匹配的候選標題的匹配度為:
7.根據權利要求1所述的基于大語言模型和范文模板的文章智能生成方法,其特征在于,所述從文檔資料庫中查找出與所述待生成文章的各級葉子標題匹配的文檔素材,包括:
8.根據權利要求1所述的基于大語言模型和范文模板的文章智能生成方法,其特征在于,所述基于各級葉子標題匹配的文檔素材,通過大
9.一種基于大語言模型和范文模板的文章智能生成裝置,其特征在于,包括:
10.一種計算機程序產品,包括計算機程序或指令,其特征在于,所述計算機程序或所述指令在被計算機執行時實現如權利要求1~8任意一項所述的基于大語言模型和范文模板的文章智能生成方法。
...【技術特征摘要】
1.一種基于大語言模型和范文模板的文章智能生成方法,其特征在于,包括:
2.根據權利要求1所述的基于大語言模型和范文模板的文章智能生成方法,其特征在于,所述方法還包括:
3.根據權利要求1所述的基于大語言模型和范文模板的文章智能生成方法,其特征在于,所述方法還包括:
4.根據權利要求1所述的基于大語言模型和范文模板的文章智能生成方法,其特征在于,所述方法還包括:
5.根據權利要求1所述的基于大語言模型和范文模板的文章智能生成方法,其特征在于,所述方法還包括:
6.根據權利要求1所述的基于大語言模型和范文模板的文章智能生成方法,其特征在于,當所述任一級標題為文章標題時,所述任一級標題與范文模...
【專利技術屬性】
技術研發人員:劉通,陳夢曦,
申請(專利權)人:數易達北京科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。