System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本申請(qǐng)涉及自然語(yǔ)言處理,特別是涉及一種同傳質(zhì)量評(píng)測(cè)方法及相關(guān)裝置、設(shè)備和存儲(chǔ)介質(zhì)。
技術(shù)介紹
1、得益于機(jī)器學(xué)習(xí)的不斷發(fā)展,將大模型應(yīng)用至同聲傳譯已經(jīng)取得相當(dāng)程度進(jìn)展。不同于傳統(tǒng)同傳,大模型同傳要求在用戶輸入語(yǔ)音的同時(shí),直接流式生成對(duì)應(yīng)的翻譯結(jié)果,而無(wú)需經(jīng)過(guò)識(shí)別再翻譯。因此,端到端地評(píng)測(cè)同傳質(zhì)量顯得尤為重要。
2、但是,現(xiàn)有評(píng)測(cè)方式通常適用于傳統(tǒng)同傳,若應(yīng)用于大模型同傳,則將難以真實(shí)反映同傳質(zhì)量。有鑒于此,如何在流式同傳的應(yīng)用場(chǎng)景下,提升同傳質(zhì)量評(píng)測(cè)的準(zhǔn)確性,成為亟待解決的問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)主要解決的技術(shù)問(wèn)題是提供一種同傳質(zhì)量評(píng)測(cè)方法及相關(guān)裝置、設(shè)備和存儲(chǔ)介質(zhì),能夠在流式同傳的應(yīng)用場(chǎng)景下,提升同傳質(zhì)量評(píng)測(cè)的準(zhǔn)確性。
2、為了解決上述技術(shù)問(wèn)題,本申請(qǐng)第一方面提供了一種同傳質(zhì)量評(píng)測(cè)方法,包括:基于目標(biāo)語(yǔ)音的同傳文本進(jìn)行切分,得到若干子文本;獲取目標(biāo)語(yǔ)音中與子文本相對(duì)應(yīng)子語(yǔ)音的刷字?jǐn)?shù)據(jù);其中,子語(yǔ)音的刷字?jǐn)?shù)據(jù)包括:子語(yǔ)音在同傳過(guò)程中從首次出字到逐漸修正直至最終翻譯為子文本的若干文本;基于子語(yǔ)音的刷字?jǐn)?shù)據(jù),分析得到子語(yǔ)音的同傳質(zhì)量分;基于各個(gè)子語(yǔ)音的同傳質(zhì)量分,融合得到表征目標(biāo)語(yǔ)音同傳質(zhì)量的目標(biāo)分值。
3、為了解決上述技術(shù)問(wèn)題,本申請(qǐng)第二方面提供了一種同傳質(zhì)量評(píng)測(cè)裝置,包括:文本切分模塊、數(shù)據(jù)獲取模塊、質(zhì)量分析模塊和評(píng)分融合模塊,文本切分模塊,用于基于目標(biāo)語(yǔ)音的同傳文本進(jìn)行切分,得到若干子文本;數(shù)據(jù)獲取模塊,用于獲取目標(biāo)語(yǔ)音中與子文本相對(duì)應(yīng)
4、為了解決上述技術(shù)問(wèn)題,本申請(qǐng)第三方面提供了一種電子設(shè)備,至少包括相互耦接的存儲(chǔ)器和處理器,存儲(chǔ)器中至少存儲(chǔ)有程序指令,處理器用于執(zhí)行程序指令以實(shí)現(xiàn)上述第一方面中的同傳質(zhì)量評(píng)測(cè)方法。
5、為了解決上述技術(shù)問(wèn)題,本申請(qǐng)第四方面提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),存儲(chǔ)有能夠被處理器運(yùn)行的程序指令,程序指令用于實(shí)現(xiàn)上述第一方面的同傳質(zhì)量評(píng)測(cè)方法。
6、上述方案,基于目標(biāo)語(yǔ)音的同傳文本進(jìn)行切分,得到若干子文本,獲取目標(biāo)語(yǔ)音中與子文本相對(duì)應(yīng)子語(yǔ)音的刷字?jǐn)?shù)據(jù),且子語(yǔ)音的刷字?jǐn)?shù)據(jù)包括:子語(yǔ)音在同傳過(guò)程中從首次出字到逐漸修正直至最終翻譯為子文本的若干文本,再基于子語(yǔ)音的刷字?jǐn)?shù)據(jù),分析得到子語(yǔ)音的同傳質(zhì)量分,進(jìn)而基于各子語(yǔ)音的同傳質(zhì)量分,融合得到表征目標(biāo)語(yǔ)音同傳質(zhì)量的目標(biāo)分值,故一方面通過(guò)將同傳文本劃分為若干子文本,再對(duì)每一子文本分別相對(duì)應(yīng)子語(yǔ)音進(jìn)行同傳質(zhì)量評(píng)價(jià)并最終進(jìn)行分值融合,相較于結(jié)合目標(biāo)語(yǔ)音及其同傳文本進(jìn)行整體質(zhì)量評(píng)測(cè)而言,能夠進(jìn)一步細(xì)化評(píng)測(cè)粒度,有助于在一定程度上提升同傳質(zhì)量評(píng)測(cè)的準(zhǔn)確性,另一方面在對(duì)每一子語(yǔ)音進(jìn)行評(píng)測(cè)時(shí)由于結(jié)合子語(yǔ)音的刷字?jǐn)?shù)據(jù),且刷字?jǐn)?shù)據(jù)包括子語(yǔ)音在同傳過(guò)程中從首次出字到逐漸修正直至最終翻譯為子文本的若干文本,故在對(duì)子語(yǔ)音進(jìn)行同傳質(zhì)量評(píng)測(cè)過(guò)程中能夠關(guān)注同傳過(guò)程,有助于在流式同傳的應(yīng)用場(chǎng)景下衡量刷字過(guò)程中的同傳質(zhì)量。故此,能夠在流式同傳的應(yīng)用場(chǎng)景下,提升同傳質(zhì)量評(píng)測(cè)的準(zhǔn)確性。
本文檔來(lái)自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種同傳質(zhì)量評(píng)測(cè)方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于目標(biāo)語(yǔ)音的同傳文本進(jìn)行切分,得到若干子文本,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,在同傳質(zhì)量以出字響應(yīng)時(shí)間為評(píng)價(jià)指標(biāo)的情況下,所述基于所述子語(yǔ)音的刷字?jǐn)?shù)據(jù),分析得到所述子語(yǔ)音的同傳質(zhì)量分,包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,在同傳質(zhì)量以結(jié)果響應(yīng)時(shí)間為評(píng)價(jià)指標(biāo)的情況下,所述基于所述子語(yǔ)音的刷字?jǐn)?shù)據(jù),分析得到所述子語(yǔ)音的同傳質(zhì)量分,包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,在同傳質(zhì)量以刷字比作為評(píng)價(jià)指標(biāo)的情況下,所述基于所述子語(yǔ)音的刷字?jǐn)?shù)據(jù),分析得到所述子語(yǔ)音的同傳質(zhì)量分,包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,在同傳質(zhì)量以跳變度作為評(píng)價(jià)指標(biāo)的情況下,所述基于所述子語(yǔ)音的刷字?jǐn)?shù)據(jù),分析得到所述子語(yǔ)音的同傳質(zhì)量分,包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述基于所述當(dāng)前文本與所述參考文本各自的總長(zhǎng)度,得到第一長(zhǎng)度,包括:
8.根據(jù)權(quán)利要求1所述的方法,其特
9.根據(jù)權(quán)利要求1至8任一項(xiàng)所述的方法,其特征在于,同傳質(zhì)量以若干種評(píng)價(jià)指標(biāo)進(jìn)行評(píng)測(cè),且所述若干種評(píng)價(jià)指標(biāo)包括:出字響應(yīng)時(shí)間、結(jié)果響應(yīng)時(shí)間、刷字比、跳變度中至少一者;
10.一種同傳質(zhì)量評(píng)測(cè)裝置,其特征在于,包括:
11.一種電子設(shè)備,其特征在于,至少包括相互耦接的存儲(chǔ)器和處理器,所述存儲(chǔ)器中至少存儲(chǔ)有程序指令,所述處理器用于執(zhí)行所述程序指令以實(shí)現(xiàn)權(quán)利要求1至9任一項(xiàng)所述的同傳質(zhì)量評(píng)測(cè)方法。
12.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,存儲(chǔ)有能夠被處理器運(yùn)行的程序指令,所述程序指令用于實(shí)現(xiàn)權(quán)利要求1至9任一項(xiàng)所述的同傳質(zhì)量評(píng)測(cè)方法。
...【技術(shù)特征摘要】
1.一種同傳質(zhì)量評(píng)測(cè)方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于目標(biāo)語(yǔ)音的同傳文本進(jìn)行切分,得到若干子文本,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,在同傳質(zhì)量以出字響應(yīng)時(shí)間為評(píng)價(jià)指標(biāo)的情況下,所述基于所述子語(yǔ)音的刷字?jǐn)?shù)據(jù),分析得到所述子語(yǔ)音的同傳質(zhì)量分,包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,在同傳質(zhì)量以結(jié)果響應(yīng)時(shí)間為評(píng)價(jià)指標(biāo)的情況下,所述基于所述子語(yǔ)音的刷字?jǐn)?shù)據(jù),分析得到所述子語(yǔ)音的同傳質(zhì)量分,包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,在同傳質(zhì)量以刷字比作為評(píng)價(jià)指標(biāo)的情況下,所述基于所述子語(yǔ)音的刷字?jǐn)?shù)據(jù),分析得到所述子語(yǔ)音的同傳質(zhì)量分,包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,在同傳質(zhì)量以跳變度作為評(píng)價(jià)指標(biāo)的情況下,所述基于所述子語(yǔ)音的刷字?jǐn)?shù)據(jù),分析得到所述子語(yǔ)音的同傳質(zhì)量分,包括:
7...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:田定書,李如子,殷運(yùn)鵬,張蔡輝,王浩洋,高建清,劉聰,
申請(qǐng)(專利權(quán))人:科大訊飛股份有限公司,
類型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。