System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術創造涉及輔助閱卷,特別是涉及一種基于大語言模型和光學字符識別的智能閱卷方法。
技術介紹
1、對于長久以來對教師群體形成了重壓的試卷評閱任務,相較單純依賴人工的評分方法,采用智能閱卷方法進行輔助閱卷具有顯著優勢:能夠極大提高試卷評閱的效率;可以對學生的回答進行深入分析,為每一個回答生成基于內容質量的評分,避免由于人工評閱帶來的主觀性,而且也更具有可解釋性;還可以擴展評分的維度。
2、但是目前的智能閱卷方法還存在很大的挑戰:試卷中通常包含各種手寫筆跡和印刷文本,可能還包括一些特殊的符號或圖形等元素,給準確的字符識別技術帶來了挑戰。采用智能閱卷方法需要理解和解析大量的文字內容,會使用大量的tokens(模型可以理解和生成的最小意義單位),增加用戶的使用成本。采用智能閱卷方法需要在學習過程中理解教師個性化的評教風格,并在批改試卷時做出適當的調整,要求所采用的智能閱卷方法具有強大的學習和適應能力。采用智能閱卷方法需要載入設備,為了易于教師群體使用,所采用的智能閱卷方法要能夠適用多種設備且具有較好的穩定性。
3、針對相關技術中的智能閱卷方法識別準確率較低,且不能兼顧使用成本較低、學習和適應能力較強、易用性和穩定性較好的問題,目前尚未提出有效的解決方案。
技術實現思路
1、本專利技術實施例提供的一種基于大語言模型和光學字符識別的智能閱卷方法和計算機程序產品,至少解決相關技術中的智能閱卷方法識別準確率較低的問題。
2、本專利技術實施例提供的一種基于大語
3、本專利技術實施例提供的基于大語言模型和光學字符識別的智能閱卷方法,通過大語言模型對試卷和答案進行處理,得到試題解析文本,包括:對所述試卷的試題進行語義向量化處理得到對應的語義向量;根據所述語義向量,采用相似度匹配算法,在臨時記憶庫中查找相似度達到預設要求的相關材料,其中,所述臨時記憶庫用于緩存所述試卷所涉及到的知識材料;根據所述相關材料,采用提示詞技術,生成對應的提示詞;將所述提示詞輸入所述大語言模型,由所述大語言模型輸出對應的解析內容。
4、本專利技術實施例提供的基于大語言模型和光學字符識別的智能閱卷方法,根據所述相關材料,采用提示詞技術,生成對應的提示詞,包括:根據所述相關材料中的題目和答案,通過思維鏈的方式,生成具有鏈式邏輯的解答步驟,以及提問問題;通過自洽性檢驗技術,生成對應的邏輯自洽約束;將所述解答步驟作為提示實例,其中,所述提示實例用于以少樣本提示的方式輸入大語言模型,以引導所述大語言模型進行解答;根據所述提問問題,所述提示實例以及所述邏輯自洽約束,生成所述提示詞。
5、本專利技術實施例提供的基于大語言模型和光學字符識別的智能閱卷方法,根據所述語義向量在臨時記憶庫中查找對應的相關材料之前,所述方法還包括:根據所述試卷的試題文本,以及所述答案的答案文本,作為第一記憶庫;根據所述試題文本和所述答案文本,提取出所述試卷的關鍵詞集群;基于所述關鍵詞集群,通過所述大語言模型,獲取有關內容文本,并作為第二記憶庫;基于所述第一記憶庫和所述第二記憶庫,搭建所述試卷的臨時記憶庫;和/或,所述方法還包括:響應目標關鍵詞的輸入操作,在所述臨時記憶庫中查詢所述目標關鍵詞的相關內容;在預設窗口內顯示所述相關內容。
6、本專利技術實施例提供的基于大語言模型和光學字符識別的智能閱卷方法,通過光學字符識別ocr技術對需要閱卷的試卷圖像進行處理,得到對應的答題文本,包括:通過所述光學字符識別ocr技術,獲取所述試卷圖像的檢測框;從橫向視角出發,根據所述試卷的尺寸,對所述檢測框進行自適應擴展,得到具有完整文本行的第一檢測框;從縱向視角出發,采用非極大值抑制算法,過濾冗余的第一檢測框,得到重疊度不超過重疊度閾值的第二檢測框;基于所述第二檢測框,采用所述光學字符識別ocr技術,識別所述第二檢測框中的文本字符,得到所述答題文本。
7、本專利技術實施例提供的基于大語言模型和光學字符識別的智能閱卷方法,所述試卷和答案為文本格式,或者圖像格式;在所述試卷和答案為圖像格式的情況下,通過大語言模型對試卷和答案進行處理,得到試題解析文本之前,所述方法還包括:通過光學字符識別ocr技術對圖像格式的試卷和答案進行處理,得到對應的答題文本。
8、本專利技術實施例提供的基于大語言模型和光學字符識別的智能閱卷方法,通過所述試題解析文本與所述答題文本的對比,確定各個題目的評分數據,包括:將所述試題解析文本與所述答題文本輸入大語言模型,由所述大語言模型輸出對應的初始評分數據;將所述初始評分數據輸入個性映射模型,由所述個性映射模型輸出具有目標語言風格的評分數據,其中,所述個性映射模型為包括多個全連接層的機器學習模型,是通過多組訓練數據訓練得到的,每組訓練數據包括輸入的大語言模型的初始評分,以及按照目標語言風格修正后的評分。
9、本專利技術實施例提供的基于大語言模型和光學字符識別的智能閱卷方法,通過所述試題解析文本與所述答題文本的對比,確定各個題目的評分數據之后,所述方法還包括:將所述評分數據進行展示;響應所述評分數據修改的操作,接收修改后的評分數據,并結合修改前的評分數據進行緩存;利用緩存的修改前后的評分數據作為訓練數據,對所述個性映射模型進行優化訓練;在所述個性映射模型的目標損失達到預設損失閾值的情況下,完成對所述個性映射模型的優化訓練。
10、本專利技術實施例提供的基于大語言模型和光學字符識別的智能閱卷方法,所述方法還包括:響應喚醒智能助理的操作,打開智能助理的文本輸入框;響應對功能的調用文本輸入,對所述調用文本進行語言指令解析,得到對應的調用指令;基于所述調用指令,匹配對應的功能接口,并進行參數匹配,調用對應的功能;在開啟對應的功能后,獲取關聯功能的調用,并按照設定開啟對應的關聯功能。
11、本專利技術實施例提供的一種計算機程序產品,包括計算機程序/指令,所述計算機程序/指令被處理器執行時,實現任一所述的基于大語言模型和光學字符識別的智能閱卷方法。
12、本專利技術實施例提供的基于大語言模型和光學字符識別的智能閱卷方法,解決了相關技術中的智能閱卷方法識別準確率較低的問題,通過使用大語言模型和光學字符識別技術提高了識別準確率;通過使用look?twice算法減少了漏檢情況,進一步提高了識別準確率;通過設置臨時記憶庫與使用提示詞技術,降低了tokens消耗,使得利用大語言模型更加高效,且使用成本較低;通過訓練構建和使用個性映射模型,使得大語言模型最終輸出的評分適配不同教師的閱卷評分風格,學習和適應能力較強;能夠基于上述智能閱卷方法運行的系統或者設備多樣,易用性和穩定性較好。
本文檔來自技高網...【技術保護點】
1.一種基于大語言模型和光學字符識別的智能閱卷方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,通過大語言模型對試卷和答案進行處理,得到試題解析文本,包括:
3.根據權利要求2所述的方法,其特征在于,根據所述相關材料,采用提示詞技術,生成對應的提示詞,包括:
4.根據權利要求2所述的方法,其特征在于,根據所述語義向量在臨時記憶庫中查找對應的相關材料之前,所述方法還包括:
5.根據權利要求1所述的方法,其特征在于,通過光學字符識別OCR技術對需要閱卷的試卷圖像進行處理,得到對應的答題文本,包括:
6.根據權利要求5所述的方法,其特征在于,所述試卷和答案為文本格式,或者圖像格式;
7.根據權利要求1所述的方法,其特征在于,通過所述試題解析文本與所述答題文本的對比,確定各個題目的評分數據,包括:
8.根據權利要求7所述的方法,其特征在于,通過所述試題解析文本與所述答題文本的對比,確定各個題目的評分數據之后,所述方法還包括:
9.根據權利要求1所述的方法,其特征在于,所述方法
10.一種計算機程序產品,包括計算機程序/指令,其特征在于,所述計算機程序/指令被處理器執行時,實現權利要求1至9中任一項所述的方法。
...【技術特征摘要】
1.一種基于大語言模型和光學字符識別的智能閱卷方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,通過大語言模型對試卷和答案進行處理,得到試題解析文本,包括:
3.根據權利要求2所述的方法,其特征在于,根據所述相關材料,采用提示詞技術,生成對應的提示詞,包括:
4.根據權利要求2所述的方法,其特征在于,根據所述語義向量在臨時記憶庫中查找對應的相關材料之前,所述方法還包括:
5.根據權利要求1所述的方法,其特征在于,通過光學字符識別ocr技術對需要閱卷的試卷圖像進行處理,得到對應的答題文本,包括:
【專利技術屬性】
技術研發人員:吳秦,沈惠,陳澤達,潘煜穎,范勝男,柴志雷,陳璟,劉登峰,王寧,周浩杰,
申請(專利權)人:江南大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。