• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種檢驗(yàn)語音標(biāo)注質(zhì)量的一致性檢測方法技術(shù)

    技術(shù)編號(hào):11782058 閱讀:147 留言:0更新日期:2015-07-27 21:40
    本發(fā)明專利技術(shù)提供一種檢驗(yàn)語音標(biāo)注質(zhì)量的一致性檢測方法,該方法包括以下步驟:1)標(biāo)注文件為TextGrid格式,將標(biāo)注形式分為三種,并根據(jù)三種不同的標(biāo)注形式,設(shè)計(jì)了三種相應(yīng)的一致性檢測公式。2)對含有六層標(biāo)注信息的文件進(jìn)行一致性檢測,六層信息分別是:音節(jié)層(PY層)、聲韻母層(SY層)、清音濁音靜音層(SUV層)、副語言信息層(PARAL層)、情感層(EMO層)、重音指數(shù)層(ST層)。3)根據(jù)標(biāo)注層的標(biāo)注形式,選擇對應(yīng)的一致性計(jì)算公式。4)設(shè)定時(shí)間誤差T0,兩名標(biāo)注者標(biāo)注內(nèi)容相同且時(shí)間誤差小于等于T0的則認(rèn)為標(biāo)注結(jié)果一致,否則認(rèn)為不一致,依次計(jì)算各層的一致性。本發(fā)明專利技術(shù)一致性檢測方法是檢驗(yàn)語音數(shù)據(jù)庫標(biāo)注質(zhì)量的基礎(chǔ),為自動(dòng)語音標(biāo)注質(zhì)量和手動(dòng)標(biāo)注質(zhì)量的檢驗(yàn)提供了一種有效的檢測方法。

    【技術(shù)實(shí)現(xiàn)步驟摘要】

    本專利技術(shù)涉及,該方法可以對比兩個(gè)已標(biāo) 注完成的文件,檢驗(yàn)標(biāo)注結(jié)果的一致性,屬于語音信號(hào)處理領(lǐng)域。
    技術(shù)介紹
    語音標(biāo)注是指標(biāo)注者按照一定的標(biāo)注規(guī)則對語音進(jìn)行分割及標(biāo)注,包括音節(jié)、聲 母、韻母、清音、濁音、靜音、副語言信息、重音信息等。一致性檢測是指不同的語音標(biāo)注者標(biāo) 注相同的語音,然后對標(biāo)注的結(jié)果進(jìn)行對比,觀察和分析標(biāo)注結(jié)果的相同性和差異性。語音 手工標(biāo)注的一致性是評(píng)價(jià)語音質(zhì)量好壞和標(biāo)注系統(tǒng)是否完備的重要指標(biāo)。為了保證情感語 音數(shù)據(jù)庫的標(biāo)注質(zhì)量,同時(shí)檢驗(yàn)標(biāo)注規(guī)則的完整性,通過一致性檢測,可以更好地發(fā)現(xiàn)標(biāo)注 中存在的問題,從而及時(shí)完善標(biāo)注規(guī)則,也可以更好地理解語音的特點(diǎn)和語音數(shù)據(jù)庫的質(zhì) 量。 由于標(biāo)注內(nèi)容可以是符號(hào),也可以是數(shù)字,而標(biāo)注形式可以按時(shí)間段劃分,也可以 標(biāo)注在某個(gè)時(shí)間點(diǎn)上,所以進(jìn)行一致性檢測時(shí),需要根據(jù)標(biāo)注形式設(shè)計(jì)相應(yīng)的檢測算法。目 前國內(nèi)外的語音標(biāo)注都是根據(jù)各自研宄需求進(jìn)行,一致性檢測方法更是缺乏,尚未有統(tǒng)一 的標(biāo)注標(biāo)準(zhǔn)和檢測方法。
    技術(shù)實(shí)現(xiàn)思路
    本專利技術(shù)的目的在于解決上述
    技術(shù)介紹
    中的不足,提出一種檢驗(yàn)語音標(biāo)注質(zhì)量的一 致性檢測方法,該方法可以對比兩個(gè)已標(biāo)注完成的TextGrid文件中的標(biāo)注內(nèi)容,通過設(shè)定 一個(gè)對比的時(shí)間誤差,達(dá)到檢驗(yàn)不同標(biāo)注者標(biāo)注結(jié)果是否一致的結(jié)果。 ,包含以下步驟: 步驟一:針對兩個(gè)已標(biāo)注完成文件,進(jìn)行一致性檢測對比。設(shè)兩名標(biāo)注者分別為 A、B,判斷各層標(biāo)注的形式。標(biāo)注層數(shù)可以是一層或多層,根據(jù)標(biāo)注內(nèi)容不同,將標(biāo)注的形式 劃分為三種:第一種是按段標(biāo)注,A、B劃分段數(shù)可以相同也可不同,標(biāo)注內(nèi)容可以是字符或 數(shù)字。一致性檢測對比時(shí),可以理解為該層的標(biāo)注內(nèi)容由多個(gè)段組成,每個(gè)段內(nèi)包括起始時(shí) 間"xmin",結(jié)束時(shí)間"xmax"及當(dāng)前時(shí)間段內(nèi)容"text",例如:音節(jié)標(biāo)注,音素標(biāo)注,清音、濁 音及靜音標(biāo)注,重音標(biāo)注等;第二種是按段標(biāo)注,但A、B劃分段數(shù)相同,且標(biāo)注內(nèi)容為數(shù)字, 例如情感程度的標(biāo)注;第三種是按點(diǎn)標(biāo)注,可以理解為該層的標(biāo)注內(nèi)容由多個(gè)點(diǎn)組成,每個(gè) 點(diǎn)包括當(dāng)前點(diǎn)的時(shí)間位置"number"及對應(yīng)的內(nèi)容"mark",例如副語言信息標(biāo)注; 步驟二:標(biāo)注形式為第一種形式的標(biāo)注層,采用逐段遍歷的方式兩兩進(jìn)行對比,計(jì)【主權(quán)項(xiàng)】1. ,其特征在于,該方法包含w下步驟: 步驟一;針對兩個(gè)已標(biāo)注完成的文件,進(jìn)行一致性檢測對比。設(shè)兩名標(biāo)注者分別為A、B,判斷各層標(biāo)注的形式。標(biāo)注層數(shù)可W是一層或多層,根據(jù)標(biāo)注內(nèi)容不同,將標(biāo)注的形式劃 分為=種;第一種是按段標(biāo)注,A、B劃分段數(shù)可W相同也可不同,標(biāo)注內(nèi)容可W是字符或數(shù) 字,一致性檢測對比時(shí),可W理解為該層的標(biāo)注內(nèi)容由多個(gè)段組成,每個(gè)段內(nèi)包括起始時(shí)間 "xmin",結(jié)束時(shí)間"xmax"及當(dāng)前時(shí)間段內(nèi)容"text",例如;音節(jié)標(biāo)注,音素標(biāo)注,清音、濁音 及靜音標(biāo)注,重音標(biāo)注等;第二種是按段標(biāo)注,但A、B劃分段數(shù)相同,且標(biāo)注內(nèi)容為數(shù)字,例 如情感程度的標(biāo)注;第=種是按點(diǎn)標(biāo)注,可W理解為該層的標(biāo)注內(nèi)容由多個(gè)點(diǎn)組成,每個(gè)點(diǎn) 包括當(dāng)前點(diǎn)的時(shí)間位置"number"及對應(yīng)的內(nèi)容"mark",例如副語言信息標(biāo)注; 步驟二:標(biāo)注形式為第一種形式的標(biāo)注層,采用逐段遍歷的方式兩兩進(jìn)行對比,計(jì)算一 致性結(jié)果的公式為:P代表一致性結(jié)果,count代表標(biāo) 注者A和B標(biāo)注結(jié)果一致的分割點(diǎn)數(shù),Adw,分別代表標(biāo)注者A、B在該層標(biāo)注的段數(shù); 步驟標(biāo)注形式為第二種形式的標(biāo)注層,采用歐氏距離公式進(jìn)行計(jì)算,例如對情感程 度的標(biāo)注采用打分形式進(jìn)行,一致性計(jì)算公式為:其中, 屯"= (a-b) 2Xc,代表兩人標(biāo)注的結(jié)果完全相反時(shí)的分?jǐn)?shù),a代表最高分,b代表最低分,C代表情感種類總數(shù),Ak,Bk分別代表相應(yīng)的情感所得分?jǐn)?shù),即情感程度,k= 1,2,…,C,代表 C種情感類型。 步驟四;標(biāo)注形式為第=種形式的標(biāo)注層,采用逐點(diǎn)遍歷的方式進(jìn)行對比,一致性計(jì)算 方法公式為'Adw,Bdw分別代表標(biāo)注者A、B在該層標(biāo)注的點(diǎn) 數(shù); 步驟五:對含有六層標(biāo)注信息的文件進(jìn)行一致性檢測,六層信息分別是;音節(jié)層(PY層)、聲韻母層(SY層)、清音濁音靜音層(SUV層)、副語言信息層(PARAL層)、情感層(EM0 層)、重音指數(shù)層(ST層); 步驟六:根據(jù)標(biāo)注層的標(biāo)注形式,選擇對應(yīng)的一致性計(jì)算公式; 步驟走;按照上述方法開始進(jìn)行對比,時(shí)間誤差為T。,兩名標(biāo)注者標(biāo)注內(nèi)容相同且時(shí)間 誤差小于等于T。的則認(rèn)為標(biāo)注結(jié)果一致,否則認(rèn)為不一致,依次計(jì)算各層的一致性。2. 根據(jù)權(quán)利要求1所述方法,其特征在于;在所述步驟走中對比A、B的標(biāo)注結(jié)果時(shí),采 用的對比方法為:用A的每一段和B的每一段進(jìn)行一一對比,W時(shí)間誤差T。判斷一致性。3. 根據(jù)權(quán)利要求1所述方法,其特征在于,在所述步驟走中時(shí)間誤差T。為5ms。4.根據(jù)權(quán)利要求1所述方法,其特征在于,TextGrid文件通過軟件PraatVersion 5. 3. 59獲得。【專利摘要】本專利技術(shù)提供,該方法包括以下步驟:1)標(biāo)注文件為TextGrid格式,將標(biāo)注形式分為三種,并根據(jù)三種不同的標(biāo)注形式,設(shè)計(jì)了三種相應(yīng)的一致性檢測公式。2)對含有六層標(biāo)注信息的文件進(jìn)行一致性檢測,六層信息分別是:音節(jié)層(PY層)、聲韻母層(SY層)、清音濁音靜音層(SUV層)、副語言信息層(PARAL層)、情感層(EMO層)、重音指數(shù)層(ST層)。3)根據(jù)標(biāo)注層的標(biāo)注形式,選擇對應(yīng)的一致性計(jì)算公式。4)設(shè)定時(shí)間誤差T0,兩名標(biāo)注者標(biāo)注內(nèi)容相同且時(shí)間誤差小于等于T0的則認(rèn)為標(biāo)注結(jié)果一致,否則認(rèn)為不一致,依次計(jì)算各層的一致性。本專利技術(shù)一致性檢測方法是檢驗(yàn)語音數(shù)據(jù)庫標(biāo)注質(zhì)量的基礎(chǔ),為自動(dòng)語音標(biāo)注質(zhì)量和手動(dòng)標(biāo)注質(zhì)量的檢驗(yàn)提供了一種有效的檢測方法。【IPC分類】G10L25-60【公開號(hào)】CN104795077【申請?zhí)枴緾N201510115470【專利技術(shù)人】毛峽, 景少玲, 陳立江, 王嵐, 張娜娜 【申請人】北京航空航天大學(xué)【公開日】2015年7月22日【申請日】2015年3月17日本文檔來自技高網(wǎng)...
    一種<a  title="一種檢驗(yàn)語音標(biāo)注質(zhì)量的一致性檢測方法原文來自X技術(shù)">檢驗(yàn)語音標(biāo)注質(zhì)量的一致性檢測方法</a>

    【技術(shù)保護(hù)點(diǎn)】
    一種檢驗(yàn)語音標(biāo)注質(zhì)量的一致性檢測方法,其特征在于,該方法包含以下步驟:步驟一:針對兩個(gè)已標(biāo)注完成的文件,進(jìn)行一致性檢測對比。設(shè)兩名標(biāo)注者分別為A、B,判斷各層標(biāo)注的形式。標(biāo)注層數(shù)可以是一層或多層,根據(jù)標(biāo)注內(nèi)容不同,將標(biāo)注的形式劃分為三種:第一種是按段標(biāo)注,A、B劃分段數(shù)可以相同也可不同,標(biāo)注內(nèi)容可以是字符或數(shù)字,一致性檢測對比時(shí),可以理解為該層的標(biāo)注內(nèi)容由多個(gè)段組成,每個(gè)段內(nèi)包括起始時(shí)間“xmin”,結(jié)束時(shí)間“xmax”及當(dāng)前時(shí)間段內(nèi)容“text”,例如:音節(jié)標(biāo)注,音素標(biāo)注,清音、濁音及靜音標(biāo)注,重音標(biāo)注等;第二種是按段標(biāo)注,但A、B劃分段數(shù)相同,且標(biāo)注內(nèi)容為數(shù)字,例如情感程度的標(biāo)注;第三種是按點(diǎn)標(biāo)注,可以理解為該層的標(biāo)注內(nèi)容由多個(gè)點(diǎn)組成,每個(gè)點(diǎn)包括當(dāng)前點(diǎn)的時(shí)間位置“number”及對應(yīng)的內(nèi)容“mark”,例如副語言信息標(biāo)注;步驟二:標(biāo)注形式為第一種形式的標(biāo)注層,采用逐段遍歷的方式兩兩進(jìn)行對比,計(jì)算一致性結(jié)果的公式為:p代表一致性結(jié)果,count代表標(biāo)注者A和B標(biāo)注結(jié)果一致的分割點(diǎn)數(shù),Asize,Bsize分別代表標(biāo)注者A、B在該層標(biāo)注的段數(shù);步驟三:標(biāo)注形式為第二種形式的標(biāo)注層,采用歐氏距離公式進(jìn)行計(jì)算,例如對情感程度的標(biāo)注采用打分形式進(jìn)行,一致性計(jì)算公式為:其中,dmax=(a?b)2×c,代表兩人標(biāo)注的結(jié)果完全相反時(shí)的分?jǐn)?shù),a代表最高分,b代表最低分,c代表情感種類總數(shù),Ak,Bk分別代表相應(yīng)的情感所得分?jǐn)?shù),即情感程度,k=1,2,…,c,代表c種情感類型。步驟四:標(biāo)注形式為第三種形式的標(biāo)注層,采用逐點(diǎn)遍歷的方式進(jìn)行對比,一致性計(jì)算方法公式為:Asize,Bsize分別代表標(biāo)注者A、B在該層標(biāo)注的點(diǎn)數(shù);步驟五:對含有六層標(biāo)注信息的文件進(jìn)行一致性檢測,六層信息分別是:音節(jié)層(PY層)、聲韻母層(SY層)、清音濁音靜音層(SUV層)、副語言信息層(PARAL層)、情感層(EMO層)、重音指數(shù)層(ST層);步驟六:根據(jù)標(biāo)注層的標(biāo)注形式,選擇對應(yīng)的一致性計(jì)算公式;步驟七:按照上述方法開始進(jìn)行對比,時(shí)間誤差為T0,兩名標(biāo)注者標(biāo)注內(nèi)容相同且時(shí)間誤差小于等于T0的則認(rèn)為標(biāo)注結(jié)果一致,否則認(rèn)為不一致,依次計(jì)算各層的一致性。...

    【技術(shù)特征摘要】

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:毛峽景少玲陳立江王嵐張娜娜
    申請(專利權(quán))人:北京航空航天大學(xué)
    類型:發(fā)明
    國別省市:北京;11

    網(wǎng)友詢問留言 已有0條評(píng)論
    • 還沒有人留言評(píng)論。發(fā)表了對其他瀏覽者有用的留言會(huì)獲得科技券。

    1
    主站蜘蛛池模板: 国产成年无码久久久久毛片| 中文字幕无码AV波多野吉衣| 无码人妻精品一区二区三区蜜桃| 中文字幕久久久人妻无码| 日韩精品成人无码专区免费| 无码精品久久久久久人妻中字| 国产成人无码AV一区二区在线观看| 青青草无码免费一二三区| 国产成人无码一区二区在线观看 | 无码人妻少妇伦在线电影| 亚洲人片在线观看天堂无码 | av无码国产在线看免费网站| 成人A片产无码免费视频在线观看| 亚洲av无码专区国产不乱码| 亚洲精品久久无码av片俺去也 | 中文字幕无码人妻AAA片| 一本一道VS无码中文字幕| 亚洲精品无码鲁网中文电影| 久久精品无码精品免费专区| 国模GOGO无码人体啪啪| 亚洲av无码乱码在线观看野外| 久久99久久无码毛片一区二区| 无码精品久久一区二区三区| 久久久g0g0午夜无码精品| 日韩丰满少妇无码内射| 男人的天堂无码动漫AV| 人妻av无码一区二区三区| 国产无码网页在线观看| 亚洲AV无码一区二区三区鸳鸯影院 | 无码国模国产在线观看| yy111111电影院少妇影院无码| 亚洲av无码成人影院一区| JAVA性无码HD中文| 蜜桃AV无码免费看永久| 国产午夜鲁丝片AV无码免费| 色欲aⅴ亚洲情无码AV| 无码任你躁久久久久久老妇| 日韩少妇无码一区二区三区| 嫩草影院无码av| 潮喷失禁大喷水aⅴ无码| 精品久久久无码21p发布 |