System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及自動化文檔布局生成,具體地說是一種利用大語言模型快速生成雜志封面或內頁布局的方法。
技術介紹
1、在出版和內容創作領域,自動化文檔布局生成技術可以顯著提高內容生產的效率和個性化程度,尤其在設計要求多樣化和精確化的雜志封面和內頁生成中具有重要應用價值。文檔生成系統旨在通過計算機自動化創建符合特定主題、風格和元素要求的頁面布局描述,使內容創作者能夠在短時間內獲得具有一致性和視覺美感的頁面設計。
2、傳統的頁面設計和排版生成通常依賴于手工設計的模板和靜態的布局規則。模板驅動的布局生成方法要求用戶填充預定義框架中的文本和圖像元素,靈活性較差,難以適應動態內容布局和元素之間的精確排布需求。此外,模板生成的內容往往缺少細節上的精確度,尤其在元素位置、大小和屬性方面,難以滿足復雜文檔生成的要求。隨著大語言模型的快速發展,基于自然語言生成的自動化內容生成方法逐漸成為新的趨勢。大語言模型通過從大量文本和視覺數據中學習語言結構和視覺語義的關系,能夠自動生成語義連貫、內容豐富的文檔描述,尤其適用于包含豐富信息和多層次布局的頁面生成任務。例如,通過設定主題、元素類型(如背景、文字、圖表)和特定要求(如位置和大小)等條件,大語言模型可以生成包含具體頁面描述的文檔布局,涵蓋背景、圖形、文本等元素的精確位置和排布。
3、然而,現有大語言模型在生成細粒度的頁面布局描述時仍存在局限性。尤其是,直接生成帶有標簽的內容(即包含弱標簽的數據)極具挑戰性,因為復雜布局和多種元素的關系處理需要高度一致和精確的描述,而大語言模型在生成這
技術實現思路
1、本專利技術的目的是針對現有技術的不足而提供的一種基于大語言模型生成雜志封面或內頁布局的方法,采用包括:具備布局可控、元素多樣和帶有弱標注等方法,利用大語言模型批量生成雜志頁面上的元素、位置坐標的文本描述,根據描述內容使用hyper-sd將元素逐個生成,對于單個物體的生成圖,使用pp-liteseg進行弱監督標注,按照生成的元素位置描述,將單個元素組合成一張完整的雜志頁面,同時組合他們的弱監督標簽,使用自標注數據集矯正過的segformor對生成標注進行驗證,基于眾包對打標簽的生成數據進行評估。該方法能夠根據預設要求生成包含多種元素的文檔頁面描述,通過靈活可控的布局和多樣化的元素生成,彌補了當前帶標簽數據稀缺的不足,為模型訓練和內容生成提供了更豐富的數據支持,能夠在滿足用戶自定義需求的前提下,精確生成頁面布局和元素描述,從而為數據生成過程提供基礎性弱標注信息,不僅在布局和元素設計上提供了高度的靈活性,也顯著減少了后續標注的工作量,提升了生成內容的適用性和質量。具有生成速度快、生成圖像帶有準確標注、生成圖像滿足人類審美等優點以及良好的應用前景。
2、實現本專利技術目的具體技術方案是:一種基于大語言模型生成雜志封面或內頁布局的方法,其特點是該方法具體包括以下步驟:
3、步驟1:利用大語言模型批量生成雜志頁面的文本描述,包括元素及其位置
4、關系,具體包括:
5、1.1:定義描述模板和約束
6、設置大語言模型生成內容的模板,需要限定元素數量符合實際;對生成圖像的元素類別進行文字約束,使得生成的雜志頁面或內頁布局具有多樣性,而不僅僅是單一類別元素;確保頁面包含?figure、text、table、chart?中的至少兩種元素;確保頁面內必須含有background?元素(可以是空白背景)。
7、1.2:指導模型輸出格式
8、向模型提供規范化的描述輸出要求,包括元素的類別、位置(x,?y坐標)、大小(像素值)、層級關系等字段,以便后續處理。
9、步驟2:根據描述內容使用?hyper-sd?將描述中的單個元素進行高效的生成,具體包括:
10、2.1:基于描述使用?hyper-sd?模型逐個生成元素
11、按照步驟?1?的描述信息,利用?hyper-sd?對頁面中的每個元素進行單獨生成,包括背景、人物、圖表、文本等內容。
12、步驟3:對于單個物體的生成圖,使用pp-liteseg進行弱監督標注,具體包括:
13、3.1:物體檢測與分割前處理
14、對每個生成的單一物體圖像進行預處理,包括調整對比度、分辨率,以確保?pp-liteseg?的分割效果更精確,特別是在識別復雜邊界和微小細節上。
15、3.2:弱監督分割標注
16、將每個經過預處理的物體圖像輸入?pp-liteseg?模型。pp-liteseg?采用弱監督方法標注圖像,使每個物體獲得精確的分割輪廓和標簽,包括邊界信息和形狀屬性。
17、3.3:生成多種格式的標注文件
18、保存標注信息,包括分割的邊界坐標、物體類別和其他屬性,并生成?json?或?xml等多種標注文件格式,以便后續數據存儲和分析使用。
19、步驟4:按照生成的元素位置描述將多個元素布局在一張圖中,形成完整的一張雜志頁面或內頁布局,具體包括:
20、4.1:元素位置匹配與布局構建
21、根據步驟?1?中的描述文件,將每個生成的元素圖像根據精確的?x,?y?坐標定位,確保每個元素放置在預定位置,避免位置偏移或重疊。
22、4.2:圖層調整與背景合成
23、根據元素的層級關系(如背景在最底層,文本在前景),將圖層進行排序和疊加,確保頁面布局清晰且符合預期的視覺層次。
24、4.3:邊緣處理與色彩協調
25、對每個元素的邊緣進行抗鋸齒處理,確保邊緣清晰、平滑,避免粗糙的拼接感。此外,調整每個元素的色彩,使其與頁面整體風格一致,避免各元素間的色差過大影響視覺效果。
26、步驟5:手工標注一個數據集并改進segformer及用戶后續驗證標簽質量,具體包括:
27、5.1:雜志頁面或內頁布局的數據標注
28、引入傳統輔助方法對雜志頁面或內頁布局進行細粒度的數據標注,標注的語義類型包括:figure、text、table、chart?和?background,確保每種類型的語義信息明確,以支持模型在不同類別上的分割性能。標注過程中結合二值化切割和前景-背景分割,預先處理復雜區域,并通過遞進分割細化邊緣,為標注提供輔助支持。
29、5.2:特征融合
30、在segformer?語義分割模型中加入了?afpan(adaptive?feature?pyramidattention?network)模塊,用于在多尺度上自適應地融合特征。
31、5.3:高頻特征分量的提取本文檔來自技高網...
【技術保護點】
1.一種基于大語言模型生成雜志封面或內頁布局的方法,其特征在于,該方法具體包括以下步驟:
2.根據權利要求1所述的基于大語言模型生成雜志封面或內頁布局的方法,其特征在于,所述步驟1具體包括:
3.根據權利要求1所述的基于大語言模型生成雜志封面或內頁布局的方法,其特征在于,所述步驟2具體包括:
4.根據權利要求1所述的基于大語言模型生成雜志封面或內頁布局的方法,其特征在于,所述步驟3具體包括:
5.根據權利要求1所述的基于大語言模型生成雜志封面或內頁布局的方法,其特征在于,所述步驟4具體包括:
6.根據權利要求1所述的基于大語言模型生成雜志封面或內頁布局的方法,其特征在于,所述步驟5具體包括:
7.根據權利要求1所述的基于大語言模型生成雜志封面或內頁布局的方法,其特征在于,所述步驟6具體包括:
【技術特征摘要】
1.一種基于大語言模型生成雜志封面或內頁布局的方法,其特征在于,該方法具體包括以下步驟:
2.根據權利要求1所述的基于大語言模型生成雜志封面或內頁布局的方法,其特征在于,所述步驟1具體包括:
3.根據權利要求1所述的基于大語言模型生成雜志封面或內頁布局的方法,其特征在于,所述步驟2具體包括:
4.根據權利要求1所述的基于大語言模型生成雜志封面或內頁...
【專利技術屬性】
技術研發人員:馬天龍,陳熙迪,吳興蛟,董道國,何峻,賀樑,
申請(專利權)人:華東師范大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。