System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 中文字幕无码精品亚洲资源网久久,亚洲无码高清在线观看,亚洲av无码专区在线播放
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基于大語言模型的問答系統(tǒng)技術(shù)方案

    技術(shù)編號(hào):41194145 閱讀:25 留言:0更新日期:2024-05-07 22:23
    本發(fā)明專利技術(shù)涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,公開了一種基于大語言模型的問答系統(tǒng),具體包括用戶端模塊,用于獲取用戶的問題并生成問題文本;多模態(tài)轉(zhuǎn)換模塊,用于將文本文件轉(zhuǎn)換為文本類型為純文字文檔;數(shù)據(jù)處理模塊,用于將文本拆分成若干個(gè)文本塊,還用于將文本塊轉(zhuǎn)換為數(shù)據(jù)向量;數(shù)據(jù)庫,用于存儲(chǔ)文本塊、數(shù)據(jù)向量和數(shù)據(jù)文件;應(yīng)答輸出模塊,用于判斷數(shù)據(jù)向量的相似度,調(diào)取文本塊并生成自然語言文本;本發(fā)明專利技術(shù)通過通過設(shè)置多模態(tài)轉(zhuǎn)換模塊,支持多模態(tài)知識(shí)錄入,允許用戶以不同的方式輸入知識(shí),同時(shí)結(jié)合大語言模型通過對知識(shí)數(shù)據(jù)向量化,實(shí)現(xiàn)自動(dòng)化知識(shí)點(diǎn)拆分和向量化知識(shí)庫構(gòu)建,大幅提升了系統(tǒng)的知識(shí)檢索效率和準(zhǔn)確率。

    【技術(shù)實(shí)現(xiàn)步驟摘要】

    本專利技術(shù)涉及數(shù)據(jù)處理,具體地說,涉及一種基于大語言模型的問答系統(tǒng)。


    技術(shù)介紹

    1、在信息爆炸的時(shí)代,我們每天都會(huì)都通過互聯(lián)網(wǎng)接收到海量的信息,無論是來自個(gè)人工作過程中的知識(shí)積累、社交媒體的信息傳遞、團(tuán)隊(duì)內(nèi)部的知識(shí)共享還是其他渠道,同時(shí)我們存儲(chǔ)、傳遞和獲取知識(shí)信息的能力變得前所未有地強(qiáng)大,但如何高效地管理和利用這些海量的知識(shí)也成為巨大的挑戰(zhàn)。

    2、在現(xiàn)有技術(shù)中,知識(shí)管理通常僅限于單一模態(tài),如文本、圖片或表格等,而且往往缺乏自動(dòng)化和智能化的處理能力,對于導(dǎo)入和識(shí)別的知識(shí)內(nèi)容,需要大量的人工操作和干預(yù),這大大降低了知識(shí)管理的效率和效果;同時(shí),現(xiàn)有的知識(shí)庫構(gòu)建方法通常基于傳統(tǒng)的數(shù)據(jù)庫或文件系統(tǒng),這使得知識(shí)檢索的效率和準(zhǔn)確率受到限制。


    技術(shù)實(shí)現(xiàn)思路

    1、本專利技術(shù)提供了一種基于大語言模型的問答系統(tǒng),其能夠克服現(xiàn)有技術(shù)的某種或某些缺陷。

    2、為實(shí)現(xiàn)以上目的,本專利技術(shù)通過以下技術(shù)方案予以實(shí)現(xiàn),其包括:

    3、用戶端模塊,用于獲取用戶手動(dòng)輸入的問題文字并生成問題文本,問題文本輸入預(yù)訓(xùn)練大語言模型并輸出包含文本數(shù)據(jù)特征的第一數(shù)據(jù)向量;

    4、多模態(tài)轉(zhuǎn)換模塊,用于識(shí)別問題文本和從外部采集的源數(shù)據(jù)文件的文件類型,將問題文本和源數(shù)據(jù)文件分別轉(zhuǎn)換為文本類型為純文字文檔的第一文本和第二文本;

    5、數(shù)據(jù)處理模塊,用于將第一文本和第二文本按照預(yù)設(shè)文本長度分別拆分成若干個(gè)第一文本塊和第二文本塊,源數(shù)據(jù)文件的鏈接嵌入第二文本塊中,按照順序給每個(gè)文本塊標(biāo)記序號(hào);還用于將文本塊輸入預(yù)訓(xùn)練的大語言模型并輸出包含文本數(shù)據(jù)特征的第二數(shù)據(jù)向量,其中,文本塊和第二數(shù)據(jù)向量互為對應(yīng)關(guān)系;

    6、數(shù)據(jù)庫,用于存儲(chǔ)第二文本塊、第二數(shù)據(jù)向量、元數(shù)據(jù)文件和源數(shù)據(jù)文件,元數(shù)據(jù)文件包含第二數(shù)據(jù)向量在數(shù)據(jù)庫中的文件位置信息和文件名稱;

    7、應(yīng)答輸出模塊,用于查詢在數(shù)據(jù)庫中與第一數(shù)據(jù)向量最相似的第二數(shù)據(jù)向量,計(jì)算第一數(shù)據(jù)向量和第二數(shù)據(jù)向量的相似度并判斷相似度是否超過預(yù)設(shè)相似度第一閾值,若是,則依據(jù)元數(shù)據(jù)文件調(diào)取第二數(shù)據(jù)向量對應(yīng)的第二文本塊以及第二文本塊序號(hào)順序前后的文本塊輸入所述的預(yù)訓(xùn)練大語言模型并生成自然語言文本,自然語言文本與源數(shù)據(jù)文件的鏈接傳輸至用戶端模塊,否則反饋無搜索結(jié)果至用戶端模塊。

    8、作為優(yōu)選,多模態(tài)處理模塊還包括用于轉(zhuǎn)換文件文本類型的文本轉(zhuǎn)換單元,文本轉(zhuǎn)換單元獲取數(shù)據(jù)類型并執(zhí)行以下命令:

    9、a.若文件的類型為文本,則提取源數(shù)據(jù)文件中的文本信息并生成文字文本,剔除文字文本中的空格、停用詞和標(biāo)點(diǎn)符號(hào)并獲得若干個(gè)關(guān)鍵句,利用分詞算法對關(guān)鍵句進(jìn)行分詞處理得到若干個(gè)關(guān)鍵詞并生成文本;

    10、b.若文件的類型為圖片,則利用ocr技術(shù)識(shí)別并提取源數(shù)據(jù)文件中的文本信息并執(zhí)行a命令;

    11、c.若文件的類型為語音,則利用語音識(shí)別技術(shù)將源數(shù)據(jù)文件中的語音內(nèi)容轉(zhuǎn)換為文本信息并執(zhí)行a命令;

    12、d.若文件的類型為視頻,則將源數(shù)據(jù)文件拆分為音頻數(shù)據(jù)文件和視頻數(shù)據(jù)文件,音頻數(shù)據(jù)執(zhí)行c命令,視頻數(shù)據(jù)拆分為若干幀圖像執(zhí)行b命令;

    13、e.若文件的類型無法識(shí)別,則停止執(zhí)行命令。

    14、作為優(yōu)選,用戶手動(dòng)輸入的問題文字并生成問題文本,問題文本輸入預(yù)訓(xùn)練大語言模型的過程還包括:

    15、將文字文本中的終止符號(hào)替換為空格,對每兩個(gè)空格間的文字進(jìn)行分詞處理并生成若干個(gè)目標(biāo)詞,目標(biāo)詞逐個(gè)輸入預(yù)訓(xùn)練大語言模型。

    16、作為優(yōu)選,用戶端模塊還包括可視化頁面,可視化頁面用于接收應(yīng)答輸出模塊中的自然語言文本并顯示于可視化頁面上,還用于接收源數(shù)據(jù)文件的鏈接并根據(jù)類型以顯示、播放或二者組合的方式響應(yīng)。

    17、作為優(yōu)選,預(yù)訓(xùn)練的大語言模型的訓(xùn)練方法為:

    18、以chatgpt作為大語言模型的基礎(chǔ)模型,利用預(yù)先采集的語料數(shù)據(jù)對初始模型預(yù)訓(xùn)練。

    19、作為優(yōu)選,還包括迭代訓(xùn)練方法:

    20、在用戶端模塊設(shè)置用于用戶反饋準(zhǔn)確率的選項(xiàng),獲取問題文本,采集自然語言文本,將問題文本內(nèi)容和自然語言文本內(nèi)容構(gòu)成映射關(guān)系,并以選項(xiàng)中的準(zhǔn)確率作為權(quán)重系數(shù)對大語言模型進(jìn)行深度學(xué)習(xí)。

    21、作為優(yōu)選,計(jì)算相似度的方法為利用余弦相似度計(jì)算第一數(shù)據(jù)向量和第二數(shù)據(jù)向量的相似度,若相似度超過預(yù)設(shè)相似度第一閾值,設(shè)定序號(hào)長度為x,標(biāo)記第二數(shù)據(jù)向量對應(yīng)的第二文本塊為目標(biāo)文本塊,獲取目標(biāo)文本塊前后各x個(gè)文本塊,計(jì)算每個(gè)文本塊對應(yīng)數(shù)據(jù)向量的相似度,剔除相似度低于預(yù)設(shè)相似度第二閾值的數(shù)據(jù)向量及其對應(yīng)的文本塊并整合輸入預(yù)訓(xùn)練大語言模型。

    22、與現(xiàn)有技術(shù)相比,本專利技術(shù)的有益效果是:通過設(shè)置多模態(tài)轉(zhuǎn)換模塊,支持多模態(tài)知識(shí)錄入,允許用戶以不同的方式輸入知識(shí)或需要檢索的問題,如通過鍵盤輸入文字、通過語音輸入、上傳圖片或視頻等;同時(shí)結(jié)合大語言模型通過對知識(shí)數(shù)據(jù)向量化,實(shí)現(xiàn)自動(dòng)化知識(shí)點(diǎn)拆分和向量化知識(shí)庫構(gòu)建,大幅提升了系統(tǒng)的知識(shí)檢索效率和準(zhǔn)確率。

    本文檔來自技高網(wǎng)...

    【技術(shù)保護(hù)點(diǎn)】

    1.一種基于大語言模型的問答系統(tǒng),其特征在于,包括:

    2.根據(jù)權(quán)利要求1所述的一種基于大語言模型的問答系統(tǒng),其特征在于,多模態(tài)處理模塊還包括用于轉(zhuǎn)換文件文本類型的文本轉(zhuǎn)換單元,文本轉(zhuǎn)換單元獲取數(shù)據(jù)類型并執(zhí)行以下命令:

    3.根據(jù)權(quán)利要求1所述的一種基于大語言模型的問答系統(tǒng),其特征在于,用戶手動(dòng)輸入的問題文字并生成問題文本,問題文本輸入預(yù)訓(xùn)練大語言模型的過程還包括:

    4.根據(jù)權(quán)利要求1所述的一種基于大語言模型的問答系統(tǒng),其特征在于,用戶端模塊還包括可視化頁面,可視化頁面用于接收應(yīng)答輸出模塊中的自然語言文本并顯示于可視化頁面上,還用于接收源數(shù)據(jù)文件的鏈接并根據(jù)類型以顯示、播放或二者組合的方式響應(yīng)。

    5.根據(jù)權(quán)利要求1所述的一種基于大語言模型的問答系統(tǒng),其特征在于,預(yù)訓(xùn)練的大語言模型的訓(xùn)練方法為:

    6.根據(jù)權(quán)利要求4所述的一種基于大語言模型的問答系統(tǒng),其特征在于,還包括迭代訓(xùn)練方法:

    7.根據(jù)權(quán)利要求1所述的一種基于大語言模型的問答系統(tǒng),其特征在于,計(jì)算相似度的方法為利用余弦相似度計(jì)算第一數(shù)據(jù)向量和第二數(shù)據(jù)向量的相似度,若相似度超過預(yù)設(shè)相似度第一閾值,設(shè)定序號(hào)長度為X,標(biāo)記第二數(shù)據(jù)向量對應(yīng)的第二文本塊為目標(biāo)文本塊,獲取目標(biāo)文本塊前后各X個(gè)文本塊,計(jì)算每個(gè)文本塊對應(yīng)數(shù)據(jù)向量的相似度,剔除相似度低于預(yù)設(shè)相似度第二閾值的數(shù)據(jù)向量及其對應(yīng)的文本塊并整合輸入預(yù)訓(xùn)練大語言模型。

    ...

    【技術(shù)特征摘要】

    1.一種基于大語言模型的問答系統(tǒng),其特征在于,包括:

    2.根據(jù)權(quán)利要求1所述的一種基于大語言模型的問答系統(tǒng),其特征在于,多模態(tài)處理模塊還包括用于轉(zhuǎn)換文件文本類型的文本轉(zhuǎn)換單元,文本轉(zhuǎn)換單元獲取數(shù)據(jù)類型并執(zhí)行以下命令:

    3.根據(jù)權(quán)利要求1所述的一種基于大語言模型的問答系統(tǒng),其特征在于,用戶手動(dòng)輸入的問題文字并生成問題文本,問題文本輸入預(yù)訓(xùn)練大語言模型的過程還包括:

    4.根據(jù)權(quán)利要求1所述的一種基于大語言模型的問答系統(tǒng),其特征在于,用戶端模塊還包括可視化頁面,可視化頁面用于接收應(yīng)答輸出模塊中的自然語言文本并顯示于可視化頁面上,還用于接收源數(shù)據(jù)文件的鏈接并根據(jù)類型以顯示、播放或二者組合的...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:韓璐鑫
    申請(專利權(quán))人:北京易華錄信息技術(shù)股份有限公司
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會(huì)獲得科技券。

    1
    主站蜘蛛池模板: 国产99久久九九精品无码| 日韩夜夜高潮夜夜爽无码| 亚洲爆乳无码专区| 无码精品一区二区三区免费视频| 亚洲av永久无码嘿嘿嘿| 亚洲AV无码乱码在线观看牲色| 亚洲AV无码码潮喷在线观看| 高清无码一区二区在线观看吞精| 亚洲AV无码成人精品区蜜桃| 成人免费a级毛片无码网站入口| 国产a级理论片无码老男人| 精品无码国产污污污免费| a级毛片免费全部播放无码| 色综合无码AV网站| 精品无码国产自产拍在线观看| 亚洲精品无码专区久久同性男| 在线观看无码AV网址| 亚洲av无码国产精品夜色午夜 | 老司机亚洲精品影院无码| av色欲无码人妻中文字幕| 18精品久久久无码午夜福利| 国精无码欧精品亚洲一区| 国产成人无码免费网站| 国产av无码专区亚洲av毛片搜| 亚洲国产精品无码久久九九大片| 久久久久亚洲AV无码永不| 久久久久亚洲AV成人无码网站| 中文字幕无码AV波多野吉衣| 国产在线观看无码免费视频| 亚洲av无码不卡私人影院| 亚洲区日韩区无码区| 久久精品无码一区二区app| 无码人妻久久一区二区三区蜜桃| 小12箩利洗澡无码视频网站| 成年男人裸j照无遮挡无码| 国产在线拍揄自揄拍无码视频| 性色AV无码中文AV有码VR| 国产午夜激无码av毛片| 久久久久久国产精品无码下载| 精品无码三级在线观看视频| 亚洲大尺度无码专区尤物 |