本申請(qǐng)涉及一種對(duì)模型推理能力進(jìn)行評(píng)測(cè)的方法、設(shè)備及存儲(chǔ)介質(zhì),屬于大模型評(píng)測(cè)技術(shù)領(lǐng)域。本申請(qǐng)將構(gòu)建的模型推理能力評(píng)測(cè)數(shù)據(jù)集輸入到待評(píng)測(cè)大語(yǔ)言模型中,獲取待評(píng)測(cè)大語(yǔ)言模型的輸出,所述輸出至少包括對(duì)設(shè)定問(wèn)題的問(wèn)題答案以及解決所述設(shè)定問(wèn)題過(guò)程中...