System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及知識(shí)圖譜構(gòu)建領(lǐng)域,具體涉及基于glm-4(generalized?linearmodel-4,廣義線性-4模型)的無(wú)標(biāo)注課程知識(shí)點(diǎn)圖譜構(gòu)建方法及系統(tǒng)。
技術(shù)介紹
1、在將知識(shí)圖譜技術(shù)與課程內(nèi)容融合的方案中,現(xiàn)存的知識(shí)點(diǎn)圖譜在粒度上過(guò)于細(xì)化。這種過(guò)于細(xì)化的粒度雖然能夠展現(xiàn)更多的知識(shí)點(diǎn)細(xì)節(jié),但也可能導(dǎo)致學(xué)生在學(xué)習(xí)過(guò)程把重點(diǎn)放在繁瑣的知識(shí)點(diǎn)碎片上,難以形成對(duì)知識(shí)的理解。過(guò)多的細(xì)節(jié)容易分散學(xué)習(xí)者的注意力,使其難以抓住核心概念,進(jìn)而影響對(duì)知識(shí)的深層次理解和應(yīng)用能力。
2、公開(kāi)號(hào)為cn117668239a的現(xiàn)有專利技術(shù)專利申請(qǐng)文獻(xiàn)《一種基于知識(shí)圖譜的知識(shí)點(diǎn)動(dòng)態(tài)推薦與教學(xué)反饋系統(tǒng)及其實(shí)現(xiàn)方法》,該現(xiàn)有系統(tǒng)的知識(shí)點(diǎn)子圖模塊包含用戶與系統(tǒng)交互產(chǎn)生的數(shù)據(jù),以及構(gòu)建的知識(shí)圖譜結(jié)合形成的子圖,用戶完成答題,與題目鏈接的知識(shí)點(diǎn)構(gòu)成知識(shí)點(diǎn)子圖,反映用戶當(dāng)前掌握知識(shí)點(diǎn)狀態(tài)。知識(shí)點(diǎn)推薦模塊根據(jù)用戶答題情況,將推薦分為鞏固推薦與拓展推薦。鞏固推薦從知識(shí)點(diǎn)子圖內(nèi),根據(jù)知識(shí)點(diǎn)子圖模塊中記錄的推薦權(quán)重進(jìn)行知識(shí)點(diǎn)推薦,拓展推薦從外部鄰域內(nèi),根據(jù)知識(shí)點(diǎn)推薦權(quán)重進(jìn)行知識(shí)點(diǎn)推薦,最終獲得推薦知識(shí)點(diǎn)。習(xí)題推薦與可視化模塊根據(jù)推薦知識(shí)點(diǎn),從習(xí)題庫(kù)中進(jìn)行匹配抽取,將匹配到的習(xí)題與知識(shí)子圖可視化呈現(xiàn)給用戶,實(shí)現(xiàn)知識(shí)點(diǎn)推薦與可視化。然而,前述現(xiàn)有技術(shù)未利用大模型的理解能力,構(gòu)建知識(shí)圖譜的精確度及效率不高。同時(shí),在知識(shí)圖譜構(gòu)建過(guò)程中,前述現(xiàn)有技術(shù)的知識(shí)圖譜獲取知識(shí)點(diǎn)作為實(shí)體,定義關(guān)系構(gòu)建圖譜,這樣構(gòu)建的知識(shí)圖譜缺少層級(jí)關(guān)系,且對(duì)知識(shí)點(diǎn)的定位不夠明確。
4、現(xiàn)有公開(kāi)文獻(xiàn)《大語(yǔ)言模型在學(xué)科知識(shí)圖譜自動(dòng)化構(gòu)建上的應(yīng)用》,該現(xiàn)有文獻(xiàn)中,利用大語(yǔ)言模型進(jìn)行高校學(xué)科知識(shí)圖譜自動(dòng)化構(gòu)建。通過(guò)融合llm(large?languagemodel,大語(yǔ)言模型)的優(yōu)勢(shì),設(shè)計(jì)一種優(yōu)化的自動(dòng)化構(gòu)建流程。以高校的學(xué)科為例,自動(dòng)提取基于教材、幻燈片、教學(xué)大綱的知識(shí)實(shí)體和知識(shí)關(guān)系,形成最終的學(xué)科知識(shí)體系,通過(guò)梳理學(xué)科知識(shí)框架,幫助學(xué)生了解各個(gè)專業(yè)課程之間的知識(shí)點(diǎn)關(guān)聯(lián),快速掌握課程知識(shí)要點(diǎn),并且能夠精準(zhǔn)回溯知識(shí)學(xué)習(xí)脈絡(luò),查漏補(bǔ)缺。然而,前述現(xiàn)有文獻(xiàn)直接將教學(xué)大綱納入知識(shí)圖譜,該方式容易引入更多冗余信息。該現(xiàn)有技術(shù)簡(jiǎn)單地將教學(xué)大綱納入知識(shí)圖譜,難以篩選出與教學(xué)大綱緊密相關(guān)的知識(shí)點(diǎn),難以避免冗余信息和無(wú)關(guān)內(nèi)容的干擾。該現(xiàn)有文獻(xiàn)未對(duì)文本數(shù)據(jù)進(jìn)行分片處理,這樣會(huì)導(dǎo)致提供給大語(yǔ)言模型的數(shù)據(jù)過(guò)多,易產(chǎn)生大量噪聲。
5、綜上,現(xiàn)有技術(shù)存在知識(shí)點(diǎn)圖譜在粒度上過(guò)于細(xì)化,導(dǎo)致知識(shí)難以理解的技術(shù)問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)所要解決的技術(shù)問(wèn)題在于:如何解決現(xiàn)有技術(shù)中知識(shí)點(diǎn)圖譜在粒度上過(guò)于細(xì)化,導(dǎo)致知識(shí)難以理解的技術(shù)問(wèn)題。
2、本專利技術(shù)是采用以下技術(shù)方案解決上述技術(shù)問(wèn)題的:基于glm-4的無(wú)標(biāo)注課程知識(shí)點(diǎn)圖譜構(gòu)建方法包括:
3、s1、進(jìn)行框架生成操作,從文檔的目錄中提取課程內(nèi)容層次結(jié)構(gòu),作為知識(shí)點(diǎn)圖譜的第一層次結(jié)構(gòu);
4、s2、獲取文檔中的各個(gè)章節(jié)以及下屬各級(jí)標(biāo)題,根據(jù)第一層次結(jié)構(gòu),對(duì)章節(jié)及下屬各級(jí)標(biāo)題進(jìn)行文檔分割操作,得到章節(jié)獨(dú)立單元、分級(jí)標(biāo)題獨(dú)立單元;
5、s3、對(duì)章節(jié)獨(dú)立單元、分級(jí)標(biāo)題獨(dú)立單元進(jìn)行數(shù)據(jù)清洗操作,得到預(yù)處理章節(jié)獨(dú)立單元、預(yù)處理標(biāo)題獨(dú)立單元;
6、s4、進(jìn)行知識(shí)點(diǎn)獲取操作,調(diào)用glm-4模型的應(yīng)用程序編程接口api(applicationprogramming?interface),并給定prompt指令,從預(yù)處理章節(jié)獨(dú)立單元、預(yù)處理標(biāo)題獨(dú)立單元中,提取得到符合大綱知識(shí)點(diǎn);
7、s5、進(jìn)行噪聲去除操作,將符合大綱知識(shí)點(diǎn),送入glm-4模型進(jìn)行處理,以去除噪聲、補(bǔ)充缺損數(shù)據(jù),得到去噪數(shù)據(jù);
8、s6、進(jìn)行數(shù)據(jù)核對(duì)操作,通過(guò)余弦相似度算法將去噪數(shù)據(jù)與大綱的內(nèi)容進(jìn)行比對(duì),使大綱中的所有知識(shí)點(diǎn)被提取,得到核對(duì)后數(shù)據(jù);
9、s7、進(jìn)行知識(shí)圖譜構(gòu)建,利用python工具批量處理核對(duì)后數(shù)據(jù),并存儲(chǔ)至neo4j數(shù)據(jù)庫(kù),以構(gòu)建得到知識(shí)點(diǎn)圖譜。
10、本專利技術(shù)所構(gòu)建的知識(shí)點(diǎn)圖譜中,每個(gè)實(shí)體均對(duì)應(yīng)一個(gè)完整的知識(shí)點(diǎn),而非知識(shí)點(diǎn)的細(xì)分部分,這樣能夠使知識(shí)點(diǎn)圖譜的粒度更為適中,避免了過(guò)于細(xì)化產(chǎn)生的局限;知識(shí)點(diǎn)的提取過(guò)程完全依賴于glm-4模型,glm-4模型的理解及分析能力強(qiáng),確保知識(shí)點(diǎn)的準(zhǔn)確性和提取操作的高效性;為了進(jìn)一步簡(jiǎn)化人工審核的流程,本專利技術(shù)采用glm-4模型對(duì)符合大綱知識(shí)點(diǎn)的數(shù)據(jù)進(jìn)行二次審核,有效去除數(shù)據(jù)噪聲,提升了數(shù)據(jù)純凈度;為了確保大綱中的知識(shí)點(diǎn)沒(méi)有遺漏,本專利技術(shù)利用glm-4模型進(jìn)行二次處理,并最終通過(guò)相似度比對(duì)技術(shù),精確判斷大綱中的知識(shí)點(diǎn)是否均已提取,從而保障知識(shí)點(diǎn)圖譜的完整性。
11、在更具體的技術(shù)方案中,s1中,利用預(yù)置大模型對(duì)文檔的目錄進(jìn)行解析,并根據(jù)需求信息生成對(duì)應(yīng)cypher語(yǔ)言;
12、利用python工具,通過(guò)正則表達(dá)式從目錄中匹配對(duì)應(yīng)內(nèi)容,將對(duì)應(yīng)內(nèi)容存儲(chǔ)到neo4j數(shù)據(jù)庫(kù),作為課程內(nèi)容層次結(jié)構(gòu)。
13、本專利技術(shù)確保了知識(shí)點(diǎn)圖譜在邏輯上的嚴(yán)密性和結(jié)構(gòu)上的清晰性,不僅提高了數(shù)據(jù)處理的效率,還減少了人工干預(yù)的需求,為整個(gè)知識(shí)管理系統(tǒng)的框架搭建提供堅(jiān)實(shí)基礎(chǔ)。
14、在更具體的技術(shù)方案中,s4中,利用prompt指令指示glm-4模型,在二級(jí)標(biāo)題層級(jí)下,根據(jù)大綱,捕捉顯著知識(shí)點(diǎn),同步提取顯著知識(shí)點(diǎn)的定義、原文本內(nèi)容以及例題;
15、在二級(jí)標(biāo)題缺失的情況下,利用prompt指令指導(dǎo)glm-4模型在一級(jí)標(biāo)題層級(jí)進(jìn)行知識(shí)點(diǎn)的提取;
16、glm-4模型根據(jù)預(yù)設(shè)格式,返回結(jié)構(gòu)化知識(shí)點(diǎn)數(shù)據(jù),據(jù)以處理得到符合大綱知識(shí)點(diǎn)。
17、在更具體的技術(shù)方案中,s5中,將符合大綱知識(shí)點(diǎn),提交至glm-4模型,并提交符合大綱知識(shí)點(diǎn)對(duì)應(yīng)的prompt指令;
18、利用glm-4模型,識(shí)別并移除文檔中的冗余信息;
19、校驗(yàn)文檔中的知識(shí)點(diǎn)定義、原文表述及例題的準(zhǔn)確性。
20、本專利技術(shù)采用的prompt指令觸發(fā)glm-4模型對(duì)符合大綱知識(shí)點(diǎn)中的數(shù)據(jù)進(jìn)行審查,利用審查操作確保json(javascrip本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.基于GLM-4的無(wú)標(biāo)注課程知識(shí)點(diǎn)圖譜構(gòu)建方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的基于GLM-4的無(wú)標(biāo)注課程知識(shí)點(diǎn)圖譜構(gòu)建方法,其特征在于,所述S1包括:
3.根據(jù)權(quán)利要求1所述的基于GLM-4的無(wú)標(biāo)注課程知識(shí)點(diǎn)圖譜構(gòu)建方法,其特征在于,所述S4包括:
4.根據(jù)權(quán)利要求1所述的基于GLM-4的無(wú)標(biāo)注課程知識(shí)點(diǎn)圖譜構(gòu)建方法,其特征在于,所述S5包括:
5.根據(jù)權(quán)利要求1所述的基于GLM-4的無(wú)標(biāo)注課程知識(shí)點(diǎn)圖譜構(gòu)建方法,其特征在于,所述S6包括:
6.根據(jù)權(quán)利要求5所述的基于GLM-4的無(wú)標(biāo)注課程知識(shí)點(diǎn)圖譜構(gòu)建方法,其特征在于,所述S62中的所述遞歸神經(jīng)網(wǎng)絡(luò)RNN包括:嵌入層、GRU層以及softmax層;其中,所述嵌入層利用word2vec算法為每個(gè)單詞生成所述詞嵌入向量,在所述GRU層,對(duì)每個(gè)輸入詞,按照下述邏輯循環(huán)使用GRU單元:
7.根據(jù)權(quán)利要求5所述的基于GLM-4的無(wú)標(biāo)注課程知識(shí)點(diǎn)圖譜構(gòu)建方法,其特征在于,所述S64中,利用下述邏輯,表征所述上下文:
8.根據(jù)權(quán)利要求
9.根據(jù)權(quán)利要求1所述的基于GLM-4的無(wú)標(biāo)注課程知識(shí)點(diǎn)圖譜構(gòu)建方法,其特征在于,所述S66中,利用下述邏輯,確定CRF解碼器的評(píng)分函數(shù):
10.基于GLM-4的無(wú)標(biāo)注課程知識(shí)點(diǎn)圖譜構(gòu)建系統(tǒng),其特征在于,所述系統(tǒng)包括:
...【技術(shù)特征摘要】
1.基于glm-4的無(wú)標(biāo)注課程知識(shí)點(diǎn)圖譜構(gòu)建方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的基于glm-4的無(wú)標(biāo)注課程知識(shí)點(diǎn)圖譜構(gòu)建方法,其特征在于,所述s1包括:
3.根據(jù)權(quán)利要求1所述的基于glm-4的無(wú)標(biāo)注課程知識(shí)點(diǎn)圖譜構(gòu)建方法,其特征在于,所述s4包括:
4.根據(jù)權(quán)利要求1所述的基于glm-4的無(wú)標(biāo)注課程知識(shí)點(diǎn)圖譜構(gòu)建方法,其特征在于,所述s5包括:
5.根據(jù)權(quán)利要求1所述的基于glm-4的無(wú)標(biāo)注課程知識(shí)點(diǎn)圖譜構(gòu)建方法,其特征在于,所述s6包括:
6.根據(jù)權(quán)利要求5所述的基于glm-4的無(wú)標(biāo)注課程知識(shí)點(diǎn)圖譜構(gòu)建方法,其特征在于,所述s62中的所述遞歸神經(jīng)網(wǎng)絡(luò)rnn包括:嵌入層、gru層以及softmax層;其中,所述嵌入層利用...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:陳潔,張吳揚(yáng),譚思雨,趙姝,張燕平,
申請(qǐng)(專利權(quán))人:安徽大學(xué),
類型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。