System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 精品无码一级毛片免费视频观看,精品无码专区亚洲,99久久人妻无码精品系列蜜桃
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    基于多模態大模型的科技論文表格知識抽取方法技術

    技術編號:43474973 閱讀:15 留言:0更新日期:2024-11-27 13:14
    本發明專利技術公開了基于多模態大模型的科技論文表格知識抽取方法,涉及多模態信息處理技術領域,該方法包括:針對待抽取任務,構建知識抽取任務數據集;搭建通用表格大模型;使用知識抽取任務數據集,對通用表格大模型進行微調訓練,獲得論文表格大模型;基于論文表格大模型進行知識抽取,獲得標準知識多元組。本發明專利技術解決了現有技術中傳統科技論文知識抽取方法無法處理表格等形式的內容,提取的知識可能存在信息缺失,無法全面反映研究內容的深度和廣度的技術問題,達到了通過集成圖像識別和數據分析技術,構建論文表格大模型進行科技論文知識抽取,提升知識提取的深度和質量的技術效果。

    【技術實現步驟摘要】

    本專利技術涉及多模態信息處理,具體涉及基于多模態大模型的科技論文表格知識抽取方法


    技術介紹

    1、科技論文作為學術研究的重要載體,其內容不僅包含豐富的文本信息,還涵蓋了大量的表格數據。表格以其直觀、易于理解的特點,能夠有效地傳遞復雜的數據關系和實驗結果,成為論文中不可或缺的組成部分。然而,傳統的知識抽取技術主要集中于文本內容的分析,往往未能充分挖掘和利用表格中蘊含的豐富信息資源,這在一定程度上限制了知識提取的完整性和準確性。

    2、傳統的知識抽取方法主要依賴于自然語言處理技術,通過算法對文本數據進行處理,以提取關鍵信息和知識。這些方法在處理純文本數據時表現出色,但在面對表格等形式的內容時則顯得力不從心。由于表格中的數據未能得到有效解析,導致從科技論文中提取的知識可能存在信息缺失,無法全面反映研究內容的深度和廣度。


    技術實現思路

    1、本申請提供了基于多模態大模型的科技論文表格知識抽取方法,用于針對解決現有技術中傳統科技論文知識抽取方法無法處理表格等形式的內容,提取的知識可能存在信息缺失,無法全面反映研究內容的深度和廣度的技術問題。

    2、鑒于上述問題,本申請提供了基于多模態大模型的科技論文表格知識抽取方法。

    3、第一方面,本申請提供了基于多模態大模型的科技論文表格知識抽取方法,所述方法包括:針對待抽取任務,進行任務數據提取,構建知識抽取任務數據集;搭建多模態大模型架構,所述多模態大模型架構包括視覺編碼器、文本編碼器、特征變換模塊以及解碼器;基于通用表格數據集,對所述多模態大模型架構進行初始化,獲得通用表格大模型;將所述知識抽取任務數據集進行數據劃分,獲得微調數據集和知識抽取數據集,其中,所述微調數據集包含多個微調數據;使用所述微調數據集,對所述通用表格大模型進行微調訓練,獲得論文表格大模型;將所述知識抽取數據集作為輸入,基于所述論文表格大模型進行知識抽取,獲得標準知識多元組。

    4、第二方面,一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,所述處理器執行所述計算機程序時實現第一方面內方法的步驟。

    5、第三方面,一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行時實現第一方面內方法的步驟。

    6、本申請中提供的一個或多個技術方案,至少具有如下技術效果或優點:

    7、本申請實施例提供的基于多模態大模型的科技論文表格知識抽取方法,涉及多模態信息處理
    ,通過構建一個論文表格大模型,該模型能夠同時處理表格圖像信息和文本信息,通過視覺編碼器、特征變換、文本編碼器和解碼器,將這兩種類型的信息有效融合,補充對表格中信息關聯方式的理解,從而生成符合預定義知識模式的多元組輸出,解決了現有技術中傳統科技論文知識抽取方法無法處理表格等形式的內容,提取的知識可能存在信息缺失,無法全面反映研究內容的深度和廣度的技術問題,實現了通過集成圖像識別和數據分析技術,構建論文表格大模型進行科技論文知識抽取,提升知識提取的深度和質量的技術效果。

    本文檔來自技高網...

    【技術保護點】

    1.基于多模態大模型的科技論文表格知識抽取方法,其特征在于,所述方法包括:

    2.如權利要求1所述的基于多模態大模型的科技論文表格知識抽取方法,其特征在于,針對待抽取任務,進行任務數據提取,構建知識抽取任務數據集,包括:

    3.如權利要求2所述的基于多模態大模型的科技論文表格知識抽取方法,其特征在于,所述知識模式包括多元組文本結構、多元組實體類型、多元組實體順序。

    4.如權利要求1所述的基于多模態大模型的科技論文表格知識抽取方法,其特征在于,基于通用表格數據集,對所述多模態大模型架構進行初始化,包括:

    5.如權利要求1所述的基于多模態大模型的科技論文表格知識抽取方法,其特征在于,使用所述微調數據集,對所述通用表格大模型進行微調訓練,獲得論文表格大模型,包括:

    6.如權利要求1所述的基于多模態大模型的科技論文表格知識抽取方法,其特征在于,將所述知識抽取數據集作為輸入,基于所述論文表格大模型進行知識抽取,獲得標準知識多元組,包括:

    7.如權利要求6所述的基于多模態大模型的科技論文表格知識抽取方法,其特征在于,基于所述視覺編碼器進行圖像信息轉換,生成視覺Embedding,包括:

    8.一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,其特征在于,所述處理器執行所述計算機程序時實現權利要求1至7中任一項所述的方法的步驟。

    9.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1至7中任一項所述的方法的步驟。

    ...

    【技術特征摘要】

    1.基于多模態大模型的科技論文表格知識抽取方法,其特征在于,所述方法包括:

    2.如權利要求1所述的基于多模態大模型的科技論文表格知識抽取方法,其特征在于,針對待抽取任務,進行任務數據提取,構建知識抽取任務數據集,包括:

    3.如權利要求2所述的基于多模態大模型的科技論文表格知識抽取方法,其特征在于,所述知識模式包括多元組文本結構、多元組實體類型、多元組實體順序。

    4.如權利要求1所述的基于多模態大模型的科技論文表格知識抽取方法,其特征在于,基于通用表格數據集,對所述多模態大模型架構進行初始化,包括:

    5.如權利要求1所述的基于多模態大模型的科技論文表格知識抽取方法,其特征在于,使用所述微調數據集,對所述通用表格大模型進行微調訓練,獲...

    【專利技術屬性】
    技術研發人員:胡懋地宋東桓錢力
    申請(專利權)人:中國科學院文獻情報中心
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 无码尹人久久相蕉无码| 精品欧洲av无码一区二区三区| 亚洲AV无码之国产精品| 天堂无码在线观看| 特级无码毛片免费视频尤物| 亚洲av成人无码网站…| 中文字幕乱偷无码AV先锋| 亚洲国产精品无码中文lv| 国产精品无码一区二区三区在 | 一本久道中文无码字幕av| 国产精品亚洲а∨无码播放| 中字无码av电影在线观看网站| 国产午夜无码专区喷水| 色国产色无码色欧美色在线| 亚洲热妇无码AV在线播放| 国产精品无码久久久久久久久久| 精品无码国产污污污免费网站| 台湾无码AV一区二区三区| 亚洲私人无码综合久久网| 无码精品一区二区三区在线| 中出人妻中文字幕无码| 久久久精品无码专区不卡| 久久久无码精品午夜| 久久AV无码精品人妻糸列| 亚洲AV无码AV男人的天堂| 国产乱子伦精品无码码专区| 无码AV动漫精品一区二区免费| 无码毛片内射白浆视频| 亚洲中文字幕久久精品无码A| 97精品人妻系列无码人妻| 免费A级毛片无码A∨中文字幕下载| 伊人久久无码中文字幕| 亚洲精品~无码抽插| 国产乱子伦精品无码码专区| 国产色无码精品视频免费| 中文字幕日韩精品无码内射| 国产50部艳色禁片无码| 日韩欧精品无码视频无删节 | 亚洲国产成人无码av在线播放| 国产成人精品无码播放| 无码精品A∨在线观看|