溫馨提示:您尚未登錄,請點 登陸 后下載,如果您還沒有賬戶請點 注冊 ,登陸完成后,請刷新本頁查看技術詳細信息。
本申請涉及一種大模型訓練數據自動篩選方法,該方法包括:收集大規模文本數據集,通過訓練好的Transformer模型對大規模文本數據集中的各文本段落進行似然估計,得到各文本段落的生成概率;基于各文本段落的生成概率計算得到文本段落間的語義互信息...該專利屬于深圳市迪博企業風險管理技術有限公司所有,僅供學習研究參考,未經過深圳市迪博企業風險管理技術有限公司授權不得商用。
溫馨提示:您尚未登錄,請點 登陸 后下載,如果您還沒有賬戶請點 注冊 ,登陸完成后,請刷新本頁查看技術詳細信息。
本申請涉及一種大模型訓練數據自動篩選方法,該方法包括:收集大規模文本數據集,通過訓練好的Transformer模型對大規模文本數據集中的各文本段落進行似然估計,得到各文本段落的生成概率;基于各文本段落的生成概率計算得到文本段落間的語義互信息...