System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本申請(qǐng)實(shí)施例涉及情緒識(shí)別,特別涉及一種情緒識(shí)別模型的訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
技術(shù)介紹
1、影視劇劇本理解需要對(duì)作家投稿或待拍攝的劇本進(jìn)行情緒分析,從而了解劇本人物尤其是男女主的情緒走勢(shì)以此評(píng)價(jià)劇本是否跌宕起伏、或把握拍攝中的情緒點(diǎn)。由于人類的情緒是復(fù)雜的,故一句話可表現(xiàn)多種情緒,如樂極生悲、喜極而泣,而在多標(biāo)簽預(yù)測(cè)時(shí)常常容易漏預(yù)測(cè)某些標(biāo)簽。
2、相關(guān)技術(shù)中,采用均衡采樣的方式,通過統(tǒng)計(jì)每個(gè)標(biāo)簽類別的樣本數(shù)量n,然后在樣本抽樣時(shí),以1/n的概率抽取該標(biāo)簽類別的樣本,從而對(duì)于數(shù)據(jù)量少的標(biāo)簽類別可以獲得更大的抽樣覆蓋度。
3、而在數(shù)據(jù)極度不均衡的情況下,則會(huì)導(dǎo)致頭部標(biāo)簽(樣本數(shù)量較多的標(biāo)簽類別)的某些樣本一直無(wú)法被抽樣學(xué)習(xí),造成頭部標(biāo)簽泛化性降低,且具有多個(gè)標(biāo)簽類別的樣本也會(huì)帶來(lái)采樣冗余而標(biāo)簽學(xué)習(xí)收益不足的問題,進(jìn)而降低情緒識(shí)別的準(zhǔn)確性。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)實(shí)施例提供了一種情緒識(shí)別模型的訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),能夠優(yōu)化情緒識(shí)別模型的訓(xùn)練效果,并提高情緒識(shí)別的準(zhǔn)確性。所述技術(shù)方案如下:
2、一方面,本申請(qǐng)實(shí)施例提供了一種情緒識(shí)別模型的訓(xùn)練方法,所述方法包括:
3、通過情緒識(shí)別模型對(duì)訓(xùn)練數(shù)據(jù)集中的樣本文本進(jìn)行情緒識(shí)別,得到各個(gè)樣本文本對(duì)應(yīng)的樣本情緒識(shí)別結(jié)果,所述訓(xùn)練數(shù)據(jù)集中包括所述樣本文本以及所述樣本文本對(duì)應(yīng)的情緒真值標(biāo)簽;
4、根據(jù)所述樣本文本的樣本特征以及所述樣本情緒識(shí)別結(jié)果,確定所述樣本文本對(duì)應(yīng)的損失調(diào)
5、基于所述損失調(diào)節(jié)權(quán)重、所述樣本情緒識(shí)別結(jié)果以及所述情緒真值標(biāo)簽,確定所述樣本文本的情緒識(shí)別損失;
6、基于所述情緒識(shí)別損失訓(xùn)練所述情緒識(shí)別模型。
7、另一方面,本申請(qǐng)實(shí)施例提供了一種情緒識(shí)別模型的訓(xùn)練裝置,所述裝置包括:
8、第一情緒識(shí)別模塊,用于通過情緒識(shí)別模型對(duì)訓(xùn)練數(shù)據(jù)集中的樣本文本進(jìn)行情緒識(shí)別,得到各個(gè)樣本文本對(duì)應(yīng)的樣本情緒識(shí)別結(jié)果,所述訓(xùn)練數(shù)據(jù)集中包括所述樣本文本以及所述樣本文本對(duì)應(yīng)的情緒真值標(biāo)簽;
9、權(quán)重確定模塊,用于根據(jù)所述樣本文本的樣本特征以及所述樣本情緒識(shí)別結(jié)果,確定所述樣本文本對(duì)應(yīng)的損失調(diào)節(jié)權(quán)重,所述樣本特征包括樣本類型和所述樣本文本對(duì)應(yīng)情緒真值標(biāo)簽的標(biāo)簽樣本數(shù)中的至少一種,所述樣本類型包括容易樣本和困難樣本,所述標(biāo)簽樣本數(shù)指所述訓(xùn)練數(shù)據(jù)集中具有所述情緒真值標(biāo)簽的樣本文本數(shù)量;
10、損失確定模塊,用于基于所述損失調(diào)節(jié)權(quán)重、所述樣本情緒識(shí)別結(jié)果以及所述情緒真值標(biāo)簽,確定所述樣本文本的情緒識(shí)別損失;
11、模型訓(xùn)練模塊,用于基于所述情緒識(shí)別損失訓(xùn)練所述情緒識(shí)別模型。
12、另一方面,本申請(qǐng)實(shí)施例提供了一種計(jì)算機(jī)設(shè)備,所述計(jì)算機(jī)設(shè)備包括處理器和存儲(chǔ)器,所述存儲(chǔ)器中存儲(chǔ)有至少一條指令,所述至少一條指令由所述處理器加載并執(zhí)行以實(shí)現(xiàn)如上述方面所述的情緒識(shí)別模型的訓(xùn)練方法。
13、另一方面,本申請(qǐng)實(shí)施例提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有至少一條指令,所述至少一條指令由處理器加載并執(zhí)行以實(shí)現(xiàn)如上述方面所述的情緒識(shí)別模型的訓(xùn)練方法。
14、另一方面,本申請(qǐng)實(shí)施例提供了一種計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包括至少一條指令,所述至少一條指令存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中。計(jì)算機(jī)設(shè)備的處理器從所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)讀取所述至少一條指令,所述處理器執(zhí)行所述至少一條指令,使得所述計(jì)算機(jī)設(shè)備執(zhí)行上述方面所述的情緒識(shí)別模型的訓(xùn)練方法。
15、本申請(qǐng)實(shí)施例中,通過情緒識(shí)別模型對(duì)訓(xùn)練數(shù)據(jù)集中的樣本文本進(jìn)行情緒識(shí)別,得到各個(gè)樣本文本的樣本情緒識(shí)別結(jié)果之后,并沒有直接根據(jù)樣本情緒識(shí)別結(jié)果和情緒真值標(biāo)簽確定情緒識(shí)別損失,而是充分考慮到訓(xùn)練數(shù)據(jù)集中各個(gè)樣本文本的樣本特征,先根據(jù)樣本文本的樣本特征以及樣本情緒識(shí)別結(jié)果,確定損失調(diào)節(jié)權(quán)重,再結(jié)合損失調(diào)節(jié)權(quán)重、樣本情緒識(shí)別結(jié)果以及情緒真值標(biāo)簽共同確定情緒識(shí)別損失,進(jìn)而基于該情緒識(shí)別損失訓(xùn)練情緒識(shí)別模型。采用本申請(qǐng)實(shí)施例提供的方案,通過利用損失調(diào)節(jié)權(quán)重確定情緒識(shí)別損失,可以實(shí)現(xiàn)對(duì)容易樣本以及困難樣本的情緒識(shí)別損失的調(diào)節(jié),并在不同情緒真值標(biāo)簽的樣本文本數(shù)量不均衡的情況下,實(shí)現(xiàn)對(duì)不均衡標(biāo)簽樣本的情緒識(shí)別損失的調(diào)節(jié),從而基于經(jīng)過調(diào)節(jié)后的情緒識(shí)別損失訓(xùn)練情緒識(shí)別模型,能夠優(yōu)化情緒識(shí)別模型的訓(xùn)練效果,提高情緒識(shí)別模型輸出的準(zhǔn)確性。
本文檔來(lái)自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種情緒識(shí)別模型的訓(xùn)練方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述情緒識(shí)別模型通過二階段訓(xùn)練得到;所述基于所述情緒識(shí)別損失訓(xùn)練所述情緒識(shí)別模型,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,在所述第一訓(xùn)練階段,所述根據(jù)所述樣本文本的樣本特征以及所述樣本情緒識(shí)別結(jié)果,確定所述樣本文本對(duì)應(yīng)的損失調(diào)節(jié)權(quán)重,包括:
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,在所述第二訓(xùn)練階段,所述根據(jù)所述樣本文本的樣本特征以及所述樣本情緒識(shí)別結(jié)果,確定所述樣本文本對(duì)應(yīng)的損失調(diào)節(jié)權(quán)重,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述樣本文本具有的樣本標(biāo)簽類別數(shù)、所述情緒真值標(biāo)簽的標(biāo)簽樣本數(shù)以及所述第二訓(xùn)練數(shù)據(jù)集中的第二標(biāo)簽類別數(shù),確定所述樣本文本對(duì)應(yīng)的第二損失調(diào)節(jié)權(quán)重,包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過情緒識(shí)別模型對(duì)訓(xùn)練數(shù)據(jù)集中的樣本文本進(jìn)行情緒識(shí)別,得到各個(gè)樣本文本對(duì)應(yīng)的樣本情緒識(shí)別結(jié)果,包括:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述基于各個(gè)關(guān)鍵人物的目標(biāo)對(duì)話文本對(duì)應(yīng)的目標(biāo)情緒標(biāo)簽對(duì)所述劇本進(jìn)行質(zhì)量評(píng)估,得到劇本質(zhì)量評(píng)估結(jié)果,包括:
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述基于同一劇本場(chǎng)次內(nèi)各個(gè)關(guān)鍵人物的目標(biāo)對(duì)話文本對(duì)應(yīng)的目標(biāo)情緒標(biāo)簽,以及所述目標(biāo)情緒標(biāo)簽對(duì)應(yīng)的情緒預(yù)測(cè)概率,生成各個(gè)關(guān)鍵人物在所述劇本場(chǎng)次中的情緒發(fā)展曲線,包括:
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述基于各個(gè)目標(biāo)情緒標(biāo)簽對(duì)應(yīng)的情緒預(yù)測(cè)概率,確定各個(gè)目標(biāo)情緒標(biāo)簽的情緒顯著程度,包括:
11.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述基于各個(gè)關(guān)鍵人物對(duì)應(yīng)的情緒發(fā)展曲線對(duì)所述劇本進(jìn)行質(zhì)量評(píng)估,得到所述劇本質(zhì)量評(píng)估結(jié)果,包括:
12.一種情緒識(shí)別模型的訓(xùn)練裝置,其特征在于,所述裝置包括:
13.一種計(jì)算機(jī)設(shè)備,其特征在于,所述計(jì)算機(jī)設(shè)備包括處理器和存儲(chǔ)器;所述存儲(chǔ)器存儲(chǔ)有至少一條指令,所述至少一條指令用于被所述處理器執(zhí)行以實(shí)現(xiàn)如權(quán)利要求1至11任一所述的情緒識(shí)別模型的訓(xùn)練方法。
14.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述存儲(chǔ)介質(zhì)存儲(chǔ)有至少一條指令,所述至少一條指令用于被處理器執(zhí)行以實(shí)現(xiàn)如權(quán)利要求1至11任一所述的情緒識(shí)別模型的訓(xùn)練方法。
15.一種計(jì)算機(jī)程序產(chǎn)品,其特征在于,所述計(jì)算機(jī)程序產(chǎn)品包括至少一條指令,所述至少一條指令存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中;計(jì)算機(jī)設(shè)備的處理器從所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)讀取所述至少一條指令,所述處理器執(zhí)行所述至少一條指令,使得所述計(jì)算機(jī)設(shè)備實(shí)現(xiàn)如權(quán)利要求1至11任一所述的情緒識(shí)別模型的訓(xùn)練方法。
...【技術(shù)特征摘要】
1.一種情緒識(shí)別模型的訓(xùn)練方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述情緒識(shí)別模型通過二階段訓(xùn)練得到;所述基于所述情緒識(shí)別損失訓(xùn)練所述情緒識(shí)別模型,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,在所述第一訓(xùn)練階段,所述根據(jù)所述樣本文本的樣本特征以及所述樣本情緒識(shí)別結(jié)果,確定所述樣本文本對(duì)應(yīng)的損失調(diào)節(jié)權(quán)重,包括:
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,在所述第二訓(xùn)練階段,所述根據(jù)所述樣本文本的樣本特征以及所述樣本情緒識(shí)別結(jié)果,確定所述樣本文本對(duì)應(yīng)的損失調(diào)節(jié)權(quán)重,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述樣本文本具有的樣本標(biāo)簽類別數(shù)、所述情緒真值標(biāo)簽的標(biāo)簽樣本數(shù)以及所述第二訓(xùn)練數(shù)據(jù)集中的第二標(biāo)簽類別數(shù),確定所述樣本文本對(duì)應(yīng)的第二損失調(diào)節(jié)權(quán)重,包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過情緒識(shí)別模型對(duì)訓(xùn)練數(shù)據(jù)集中的樣本文本進(jìn)行情緒識(shí)別,得到各個(gè)樣本文本對(duì)應(yīng)的樣本情緒識(shí)別結(jié)果,包括:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述基于各個(gè)關(guān)鍵人物的目標(biāo)對(duì)話文本對(duì)應(yīng)的目標(biāo)情緒標(biāo)簽對(duì)所述劇本進(jìn)行質(zhì)量評(píng)估,得到劇本質(zhì)量評(píng)估結(jié)果,包括:
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:郭卉,
申請(qǐng)(專利權(quán))人:騰訊科技深圳有限公司,
類型:發(fā)明
國(guó)別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。