• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    獲取文字提示文件的方法及裝置制造方法及圖紙

    技術編號:14930591 閱讀:95 留言:0更新日期:2017-03-31 12:26
    本發明專利技術公開了一種獲取文字提示文件的方法及裝置,屬于網絡技術領域。該方法包括:獲取第一文字提示文件和至少一個第二文字提示文件;對于第一文字提示文件中多行提示信息中的每行,如果該行與任一個第二文字提示文件的至少一行之間的相似度大于第一數值,將第二文字提示文件的至少一行確定為第一目標行,將第一目標行所在的第二文字提示文件確定為第一目標文字提示文件;如果第一目標文字提示文件的數量與至少一個第二文字提示文件的數量的比例大于第二數值,將與該行之間相似度最高的第一目標行確定為待合成的行;根據第一文字提示文件中多行提示信息對應的待合成的行,合成文字提示文件。本發明專利技術提供了一種較為準確地獲取文字提示文件的方法。

    【技術實現步驟摘要】

    本專利技術涉及網絡
    ,尤其涉及一種獲取文字提示文件的方法及裝置。
    技術介紹
    隨著網絡技術的發展,網絡提供的多媒體資源越來越豐富,例如,大量的音頻文件和視頻文件。當然,為了充分體現多媒體文件的語音內容,網絡中流傳的多媒體文件通常會附帶與其語音內容對應的文字提示文件,例如,音頻文件往往會附帶歌詞文件。一般地,這些文字提示文件是由用戶上傳的。然而,由于這些文字提示文件是用戶自己制作的,所以該文件中包括的提示信息通常會出現錯誤,例如,歌詞文件中包括了用戶的祝福語、廣告語或者廣告鏈接。由于用戶上傳的文字提示文件中包括的提示信息通常會出現錯誤,會導致文字提示文件的準確性差,因此亟需一種準確獲取文字提示文件的方法。
    技術實現思路
    為了解決現有技術的問題,本專利技術實施例提供了一種獲取文字提示文件的方法及裝置。所述技術方案如下:一方面,提供了一種獲取文字提示文件的方法及裝置方法,所述方法包括:獲取第一文字提示文件和至少一個第二文字提示文件,所述第一文字提示文件和所述第二文字提示文件均對應同一個多媒體文件;對于所述第一文字提示文件中多行提示信息中的每行,如果所述行與任一個第二文字提示文件的至少一行之間的相似度大于第一數值,則將所述第二文字提示文件的至少一行確定為第一目標行,將所述第一目標行所在的第二文字提示文件確定為第一目標文字提示文件;如果所述第一目標文字提示文件的數量與所述至少一個第二文字提示文件的數量的比例大于第二數值,則將與所述行之間相似度最高的第一目標行確定為待合成的行;根據所述第一文字提示文件中多行提示信息對應的待合成的行,合成文字提示文件。本專利技術實施例提供的技術方案帶來的有益效果是:在一種可能實現方式中,所述方法還包括:對于所述第一文字提示文件中多行提示信息中的每行、以及所述至少一個第二文字提示文件中的每個第二文字提示文件,比較所述第一文字提示文件的所述行與所述第二文字提示文件的至少一行所包括的字符數;當所述第一文字提示文件的所述行所包括的字符數不小于所述第二文字提示文件的至少一行所包括的字符數,則將所述行所包括的字符數確定為目標字符數;或,當所述第一文字提示文件的所述行所包括的字符數小于所述第二文字提示文件的至少一行所包括的字符數,則將所述第二文字提示文件的至少一行所包括的字符數確定為目標字符數;確定所述第一文字提示文件的所述行和所述第二文字提示文件的至少一行中的相同字符數;將所述相同字符數與所述目標字符數的比值,獲取為所述行與所述第二文字提示文件的至少一行之間的相似度。在一種可能實現方式中,所述獲取第一文字提示文件和至少一個第二文字提示文件包括:獲取多個版本的文字提示文件,所述多個版本的文字提示文件均對應所述同一個多媒體文件;確定所述多個版本的文字提示文件中,每個文字提示文件所包括的文件字符數、以及多個所述文件字符數中的中位數;在所述多個版本的文件提示文件中,將文件字符數與所述中位數最相近的文字提示文件獲取為所述第一文字提示信息,將除所述第一文字提示文件之外的文字提示文件獲取為所述第二文字提示文件。在一種可能實現方式中,所述獲取多個版本的文字提示文件包括:獲取待檢測的多個版本的文字提示文件,所述待檢測的多個版本的文字提示文件均對應所述同一多媒體文件;如果檢測到所述待檢測的多個版本的文字提示文件所包括的字符中存在英文字符,則將所述英文字符轉換為預置詞形的英文字符;或,如果檢測到所述待檢測的多個版本的文字提示文件所包括的字符中存在繁體中文字符,則將所述繁體中文字符轉換為簡體中文字符;將字符轉換后的所述待檢測的多個版本的文字提示文件獲取為所述多個版本的文字提示文件。在一種可能實現方式中,所述方法還包括:對于所述第一文字提示文件中多行提示信息中的每行,如果所述行與任一個第二文字提示文件的至少一行之間的相似度均不大于所述第一數值,或,如果所述第一目標文字提示文件的數量與所述至少一個第二文字提示文件的數量的比例不大于所述第二數值,則將所述行與所述行的下一行合并,且與所述第二文字提示文件的至少一行比較相似度;如果合并后的行與所述第二文字提示文件的至少一行的相似度大于所述第一數值,則將所述第二文字提示文件的至少一行確定為第二目標行,將所述第二目標行所在的第二文字提示文件確定為第二目標文字提示文件;如果所述第二目標文字提示文件的數量與所述至少一個第二文字提示文件的數量的比例大于所述第二數值,則將與所述行之間相似度最高的第二目標行確定為所述待合成的行。在一種可能實現方式中,對于所述第一文字提示文件中多行提示信息中的每行,所述任一個第二文字提示文件的至少一行是指:所述第二文字提示文件中未進行過相似度計算的第一行、第一行和第一行的上一行或第一行和第一行的下一行;或者,如果確定所述第一文字提示文件的第三數值的行與對應的所述第二文字提示文件的至少一行的相似度均不大于所述第一數值,則所述行的下一行對應的所述第二文字提示文件的至少一行是指:所述第二文字提示文件中未進行過相似度計算的第二行、第二行和第二行的上一行或第二行和第二行的下一行。另一方面,提供了一種獲取文字提示文件的方法及裝置裝置,所述裝置包括:獲取模塊,用于獲取第一文字提示文件和至少一個第二文字提示文件,所述第一文字提示文件和所述第二文字提示文件均對應同一個多媒體文件;確定模塊,用于對于所述第一文字提示文件中多行提示信息中的每行,如果所述行與任一個第二文字提示文件的至少一行之間的相似度大于第一數值,則將所述第二文字提示文件的至少一行確定為第一目標行,將所述第一目標行所在的第二文字提示文件確定為第一目標文字提示文件;如果所述第一目標文字提示文件的數量與所述至少一個第二文字提示文件的數量的比例大于第二數值,則將與所述行之間相似度最高的第一目標行確定為待合成的行;合成模塊,用于根據所述第一文字提示文件中多行提示信息對應的待合成的行,合成文字提示文件。在一種可能實現方式中,所述裝置還包括:相似度計算模塊,用于對于所述第一文字提示文件中多行提示信息中的每行、以及所述至少一個第二文字提示文件中的每個第二文字提示文件,比較所述第一文字提示文件的所述行與所述第二文字提示文件的至少一行所包括的字符數;當所述第一文字提示文件的所述行所包括的字符數不小于所述第二文字提示文件的至少一行所包括的字符數,則將所述行所包括的字符數確定為目標字符數;或,當所述第一文字提示文件的所述行所包括的字符數小于所述第二文字提示文件的至少一行所包括的字符數,則將所述第二文字提示文件的至少一行所包括的字符數確定為目標字符數;確定所述第一文字提示文件的所述行和所述第二文字提示文件的至少一行中的相同字符數;將所述相同字符數與所述目標字符數的比值,獲取為所述行與所述第二文字提示文件的至少一行之間的相似度。在一種可能實現方式中,所述獲取模塊用于:獲取多個版本的文字提示文件,所述多個版本的文字提示文件均對應所述同一個多媒體文件;確定所述多個版本的文字提示文件中,每個文字提示文件所包括的文件字符數、以及多個所述文件字符數中的中位數;在所述多個版本的文件提示文件中,將文件字符數與所述中位數最相近的文字提示文件獲取為所述第一文字提示信息,將除所述第一文字提示文件之外的文字提示文件獲取為所述第二文字提示文件。在一種可能實現方式本文檔來自技高網...
    獲取文字提示文件的方法及裝置

    【技術保護點】
    一種獲取文字提示文件的方法,其特征在于,所述方法包括:獲取第一文字提示文件和至少一個第二文字提示文件,所述第一文字提示文件和所述第二文字提示文件均對應同一個多媒體文件;對于所述第一文字提示文件中多行提示信息中的每行,如果所述行與任一個第二文字提示文件的至少一行之間的相似度大于第一數值,則將所述第二文字提示文件的至少一行確定為第一目標行,將所述第一目標行所在的第二文字提示文件確定為第一目標文字提示文件;如果所述第一目標文字提示文件的數量與所述至少一個第二文字提示文件的數量的比例大于第二數值,則將與所述行之間相似度最高的第一目標行確定為待合成的行;根據所述第一文字提示文件中多行提示信息對應的待合成的行,合成文字提示文件。

    【技術特征摘要】
    1.一種獲取文字提示文件的方法,其特征在于,所述方法包括:獲取第一文字提示文件和至少一個第二文字提示文件,所述第一文字提示文件和所述第二文字提示文件均對應同一個多媒體文件;對于所述第一文字提示文件中多行提示信息中的每行,如果所述行與任一個第二文字提示文件的至少一行之間的相似度大于第一數值,則將所述第二文字提示文件的至少一行確定為第一目標行,將所述第一目標行所在的第二文字提示文件確定為第一目標文字提示文件;如果所述第一目標文字提示文件的數量與所述至少一個第二文字提示文件的數量的比例大于第二數值,則將與所述行之間相似度最高的第一目標行確定為待合成的行;根據所述第一文字提示文件中多行提示信息對應的待合成的行,合成文字提示文件。2.根據權利要求1所述的方法,其特征在于,所述方法還包括:對于所述第一文字提示文件中多行提示信息中的每行、以及所述至少一個第二文字提示文件中的每個第二文字提示文件,比較所述第一文字提示文件的所述行與所述第二文字提示文件的至少一行所包括的字符數;當所述第一文字提示文件的所述行所包括的字符數不小于所述第二文字提示文件的至少一行所包括的字符數,則將所述行所包括的字符數確定為目標字符數;或,當所述第一文字提示文件的所述行所包括的字符數小于所述第二文字提示文件的至少一行所包括的字符數,則將所述第二文字提示文件的至少一行所包括的字符數確定為目標字符數;確定所述第一文字提示文件的所述行和所述第二文字提示文件的至少一行中的相同字符數;將所述相同字符數與所述目標字符數的比值,獲取為所述行與所述第二文字提示文件的至少一行之間的相似度。3.根據權利要求1所述的方法,其特征在于,所述獲取第一文字提示文件和至少一個第二文字提示文件包括:獲取多個版本的文字提示文件,所述多個版本的文字提示文件均對應所述同一個多媒體文件;確定所述多個版本的文字提示文件中,每個文字提示文件所包括的文件字符數、以及多個所述文件字符數中的中位數;在所述多個版本的文件提示文件中,將文件字符數與所述中位數最相近的文字提示文件獲取為所述第一文字提示信息,將除所述第一文字提示文件之外的文字提示文件獲取為所述第二文字提示文件。4.根據權利要求3所述的方法,其特征在于,所述獲取多個版本的文字提示文件包括:獲取待檢測的多個版本的文字提示文件,所述待檢測的多個版本的文字提示文件均對應所述同一多媒體文件;如果檢測到所述待檢測的多個版本的文字提示文件所包括的字符中存在英文字符,則將所述英文字符轉換為預置詞形的英文字符;或,如果檢測到所述待檢測的多個版本的文字提示文件所包括的字符中存在繁體中文字符,則將所述繁體中文字符轉換為簡體中文字符;將字符轉換后的所述待檢測的多個版本的文字提示文件獲取為所述多個版本的文字提示文件。5.根據權利要求1所述的方法,其特征在于,所述方法還包括:對于所述第一文字提示文件中多行提示信息中的每行,如果所述行與任一個第二文字提示文件的至少一行之間的相似度均不大于所述第一數值,或,如果所述第一目標文字提示文件的數量與所述至少一個第二文字提示文件的數量的比例不大于所述第二數值,則將所述行與所述行的下一行合并,且與所述第二文字提示文件的至少一行比較相似度;如果合并后的行與所述第二文字提示文件的至少一行的相似度大于所述第一數值,則將所述第二文字提示文件的至少一行確定為第二目標行,將所述第二目標行所在的第二文字提示文件確定為第二目標文字提示文件;如果所述第二目標文字提示文件的數量與所述至少一個第二文字提示文件的數量的比例大于所述第二數值,則將與所述行之間相似度最高的第二目標行確定為所述待合成的行。6.根據權利要求1所述的方法,其特征在于,對于所述第一文字提示文件中多行提示信息中的每行,所述任一個第二文字提示文件的至少一行是指:所述第二文字提示文件中未進行過相似度計算的第一行、第一行和第一行的上一行或第一行和第一行的下一行;或者,如果確定所述第一文字提示文件的第三數值的行與對應的所述第二文字提示文件的至少一行的相似度均不大于所述第一數值,則所述行的下一行對應的所述第二文字提示文件的至少一行是指:所述第二文字提示文件中未進行過相似度計算的第二行、第二行和第二行的上一行或第二行和第二行的下一行。7.一種...

    【專利技術屬性】
    技術研發人員:劉勇,莊正中,劉翠陳傳藝,李祖輝
    申請(專利權)人:廣州酷狗計算機科技有限公司,
    類型:發明
    國別省市:廣東;44

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲中文字幕无码永久在线 | 无码人妻AV免费一区二区三区| 国产精品无码素人福利不卡| 亚洲av麻豆aⅴ无码电影| 亚洲日韩精品无码专区网址 | 无码射肉在线播放视频| 亚洲一区二区三区无码中文字幕| 亚洲AV日韩AV永久无码下载| 免费无码午夜福利片| 熟妇人妻中文字幕无码老熟妇| 小泽玛丽无码视频一区| 亚洲乱亚洲乱妇无码| 无码精品一区二区三区在线| 亚洲精品无码99在线观看 | 精品久久久久久无码不卡 | 久久久久亚洲AV无码去区首| 亚洲成AV人在线观看天堂无码| 成在人线AV无码免费| 亚洲AV无码一区二区三区久久精品| 国产日韩AV免费无码一区二区| 性色AV一区二区三区无码| 永久免费av无码不卡在线观看| 亚洲AV区无码字幕中文色| 久久国产精品无码网站| 精品人妻无码专区在中文字幕| 亚洲欧洲免费无码| 亚洲AV无码精品国产成人| 久久无码国产专区精品| 精品无码国产一区二区三区AV| 亚洲AV无码不卡在线播放| 国产精品VA在线观看无码不卡| 国产精品无码素人福利不卡| 惠民福利中文字幕人妻无码乱精品| 亚洲AV无码一区二区三区电影| 无码av人妻一区二区三区四区| 免费精品无码AV片在线观看| 久久午夜福利无码1000合集| 国产成人无码AV麻豆| 天堂一区人妻无码| 无码人妻精品一区二区三区99不卡 | 久久精品日韩av无码|