System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 中文无码乱人伦中文视频在线V,中文字幕无码AV波多野吉衣,亚洲中文字幕久久精品无码APP
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    基于人工智能的文本處理方法、裝置、計算機設備及介質制造方法及圖紙

    技術編號:44491743 閱讀:2 留言:0更新日期:2025-03-04 17:57
    本申請屬于人工智能領域與金融科技領域,涉及一種基于人工智能的文本處理方法、裝置、計算機設備及存儲介質,包括:接收用戶輸入的初始文本;基于目標編碼類型對初始文本進行編碼處理得到第一編碼數據;對初始文本進行語種識別處理得到對應的語種信息;基于目標編碼類型對語種信息進行編碼處理得到第二編碼數據;對第一編碼數據與第二編碼數據進行拼接得到模型輸入文本;調用正則處理模型對模型輸入文本進行推理處理生成對應的正則化文本結果;將正則化文本結果返回給用戶。此外,本申請的正則化文本結果可存儲于區塊鏈中。本申請基于正則處理模型的使用,有效地降低了文本正則系統的復雜度和維度難度,提高了文本正則系統的多語言通用性。

    【技術實現步驟摘要】

    本申請涉及人工智能開發與金融科技領域,尤其涉及基于人工智能的文本處理方法、裝置、計算機設備及存儲介質。


    技術介紹

    1、在語音合成
    中,文本正則化處理作為關鍵步驟,對于提升語音輸出的準確性和自然度具有至關重要的作用。該過程涵蓋了拼寫錯誤校正、語法問題調整、數字和特殊字符處理等多個方面,旨在確保在多語言環境下,語音輸出的一致性和流暢性,進而優化用戶體驗。文本正則化的有效實施,不僅對于語音助手、語音導航等語音合成應用的效果至關重要,還對于提高技術的可訪問性具有深遠影響。

    2、然而,當前文本正則處理領域面臨諸多挑戰,尤其是在多語言處理方面。傳統上,基于規則的多語言文本正則處理系統需要針對每種語言單獨設計復雜的規則集,這不僅增加了系統的復雜度,還極大地提升了維護難度。并且,現有的基于規則的多語言文本正則處理在適應多語言文本方面存在明顯不足,難以靈活應對多樣化的語言場景,無法實現真正的多語言通用性。這一局限性導致在處理包含多種語言元素的文本時,現有技術往往無法達到理想的正則化效果,進而影響語音合成的整體性能和用戶體驗。


    技術實現思路

    1、本申請實施例的目的在于提出一種基于人工智能的文本處理方法、裝置、計算機設備及存儲介質,以解決現有的基于規則的多語言文本正則處理需要針對每種語言單獨設計復雜的規則集,這不僅增加了系統的復雜度,還極大地提升了維護難度,并且難以靈活應對多樣化的語言場景,無法實現真正的多語言通用性的技術問題。

    2、為了解決上述技術問題,本申請實施例提供一種基于人工智能的文本處理方法,采用了如下所述的技術方案:

    3、接收用戶輸入的初始文本;

    4、基于預設的目標編碼類型對所述初始文本進行編碼處理,得到對應的第一編碼數據;

    5、對所述初始文本進行語種識別處理,得到與所述初始文本對應的語種信息;

    6、基于所述目標編碼類型對所述語種信息進行編碼處理,得到對應的第二編碼數據;

    7、對所述第一編碼數據與所述第二編碼數據進行拼接處理,得到對應的模型輸入文本;

    8、調用預先構建的正則處理模型對所述模型輸入文本進行推理處理,生成與所述模型輸入文本對應的正則化文本結果;

    9、將所述正則化文本結果返回給所述用戶。

    10、進一步的,所述基于預設的目標編碼類型對所述初始文本進行編碼處理,得到對應的第一編碼數據的步驟,具體包括:

    11、獲取與所述目標編碼類型對應的目標處理方法;

    12、基于所述目標處理方法對所述初始文本進行編碼處理,得到對應的目標編碼數據;

    13、將所述目標編碼數據作為所述第一編碼數據。

    14、進一步的,所述對所述初始文本進行語種識別處理,得到與所述初始文本對應的語種信息的步驟,具體包括:

    15、調用預設的語種識別工具;

    16、通過所述語種識別工具對所述初始文本進行語種識別處理,得到與所述初始文本對應的語種標簽;

    17、接收所述語種識別工具返回的所述語種標簽,并將所述語種標簽作為與所述初始文本對應的所述語種信息。

    18、進一步的,所述對所述第一編碼數據與所述第二編碼數據進行拼接處理,得到對應的模型輸入文本的步驟,具體包括:

    19、獲取預設的拼接順序;

    20、基于所述拼接順序對所述第一編碼數據與所述第二編碼數據進行拼接處理,得到拼接后的編碼數據;

    21、將所述拼接后的編碼數據作為所述模型輸入文本。

    22、進一步的,在所述調用預先構建的正則處理模型對所述模型輸入文本進行推理處理,生成與所述模型輸入文本對應的正則化文本結果的步驟之前,還包括:

    23、基于預先采集的多語言文本數據集構建多語言文本樣本數據;

    24、調用預設的語言模型;

    25、基于所述多語言文本樣本數據對所述語言模型進行預訓練處理,得到對應的第一語言模型;

    26、獲取預先構建的多語言文本正則任務數據;

    27、基于所述多語言文本正則任務數據對所述第一語言模型進行微調處理,得到對應的第二語言模型;

    28、將所述第二語言模型作為所述正則處理模型。

    29、進一步的,所述基于預先采集的多語言文本數據集構建多語言文本樣本數據的步驟,具體包括:

    30、調用預設的多語言文本數據語料庫;

    31、從所述多語言文本數據語料庫中獲取指定數量的多語言文本數據,得到所述多語言文本數據集;

    32、基于預設的數據過濾規則對所述多語言文本數據集進行過濾處理,得到處理后的多語言文本數據集;

    33、將所述處理后的多語言文本數據集作為所述多語言文本樣本數據。

    34、進一步的,在所述調用預先構建的正則處理模型對所述模型輸入文本進行推理處理,生成與所述模型輸入文本對應的正則化文本結果的步驟之后,還包括:

    35、調用預先訓練好的語音合成模型;

    36、基于所述語音合成模型對所述正則化文本結果進行語音合成處理,得到與所述正則化文本結果對應的語音數據;

    37、對所述語音數據進行優化處理得到對應的目標語音;

    38、將所述目標語音返回給所述用戶。

    39、為了解決上述技術問題,本申請實施例還提供一種基于人工智能的文本處理裝置,采用了如下所述的技術方案:

    40、接收模塊,用于接收用戶輸入的初始文本;

    41、第一處理模塊,用于基于預設的目標編碼類型對所述初始文本進行編碼處理,得到對應的第一編碼數據;

    42、識別模塊,用于對所述初始文本進行語種識別處理,得到與所述初始文本對應的語種信息;

    43、第二處理模塊,用于基于所述目標編碼類型對所述語種信息進行編碼處理,得到對應的第二編碼數據;

    44、拼接模塊,用于對所述第一編碼數據與所述第二編碼數據進行拼接處理,得到對應的模型輸入文本;

    45、推理模塊,用于調用預先構建的正則處理模型對所述模型輸入文本進行推理處理,生成與所述模型輸入文本對應的正則化文本結果;

    46、第一返回模塊,用于將所述正則化文本結果返回給所述用戶。

    47、為了解決上述技術問題,本申請實施例還提供一種計算機設備,采用了如下所述的技術方案:

    48、接收用戶輸入的初始文本;

    49、基于預設的目標編碼類型對所述初始文本進行編碼處理,得到對應的第一編碼數據;

    50、對所述初始文本進行語種識別處理,得到與所述初始文本對應的語種信息;

    51、基于所述目標編碼類型對所述語種信息進行編碼處理,得到對應的第二編碼數據;

    52、對所述第一編碼數據與所述第二編碼數據進行拼接處理,得到對應的模型輸入文本;

    53、調用預先構建的正則處理模型對所述模型輸入文本進行推理處理,生成與所述模型輸入文本對應的正則化文本結果;...

    【技術保護點】

    1.一種基于人工智能的文本處理方法,其特征在于,包括下述步驟:

    2.根據權利要求1所述的基于人工智能的文本處理方法,其特征在于,所述基于預設的目標編碼類型對所述初始文本進行編碼處理,得到對應的第一編碼數據的步驟,具體包括:

    3.根據權利要求1所述的基于人工智能的文本處理方法,其特征在于,所述對所述初始文本進行語種識別處理,得到與所述初始文本對應的語種信息的步驟,具體包括:

    4.根據權利要求1所述的基于人工智能的文本處理方法,其特征在于,所述對所述第一編碼數據與所述第二編碼數據進行拼接處理,得到對應的模型輸入文本的步驟,具體包括:

    5.根據權利要求1所述的基于人工智能的文本處理方法,其特征在于,在所述調用預先構建的正則處理模型對所述模型輸入文本進行推理處理,生成與所述模型輸入文本對應的正則化文本結果的步驟之前,還包括:

    6.根據權利要求5所述的基于人工智能的文本處理方法,其特征在于,所述基于預先采集的多語言文本數據集構建多語言文本樣本數據的步驟,具體包括:

    7.根據權利要求1所述的基于人工智能的文本處理方法,其特征在于,在所述調用預先構建的正則處理模型對所述模型輸入文本進行推理處理,生成與所述模型輸入文本對應的正則化文本結果的步驟之后,還包括:

    8.一種基于人工智能的文本處理裝置,其特征在于,包括:

    9.一種計算機設備,包括存儲器和處理器,所述存儲器中存儲有計算機可讀指令,所述處理器執行所述計算機可讀指令時實現如權利要求1至7中任一項所述的基于人工智能的文本處理方法的步驟。

    10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲有計算機可讀指令,所述計算機可讀指令被處理器執行時實現如權利要求1至7中任一項所述的基于人工智能的文本處理方法的步驟。

    ...

    【技術特征摘要】

    1.一種基于人工智能的文本處理方法,其特征在于,包括下述步驟:

    2.根據權利要求1所述的基于人工智能的文本處理方法,其特征在于,所述基于預設的目標編碼類型對所述初始文本進行編碼處理,得到對應的第一編碼數據的步驟,具體包括:

    3.根據權利要求1所述的基于人工智能的文本處理方法,其特征在于,所述對所述初始文本進行語種識別處理,得到與所述初始文本對應的語種信息的步驟,具體包括:

    4.根據權利要求1所述的基于人工智能的文本處理方法,其特征在于,所述對所述第一編碼數據與所述第二編碼數據進行拼接處理,得到對應的模型輸入文本的步驟,具體包括:

    5.根據權利要求1所述的基于人工智能的文本處理方法,其特征在于,在所述調用預先構建的正則處理模型對所述模型輸入文本進行推理處理,生成與所述模型輸入文本對應的正則化文本結果的步驟之前,還包括:

    6.根據...

    【專利技術屬性】
    技術研發人員:李俊杰劉智恒陳閩川王少軍
    申請(專利權)人:平安科技深圳有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 国产精品无码久久久久久久久久| 无码AV岛国片在线播放| 一夲道无码人妻精品一区二区| 激情无码亚洲一区二区三区| 亚洲av无码国产精品色在线看不卡 | 成人午夜精品无码区久久| 亚洲av永久无码精品秋霞电影影院| 97精品人妻系列无码人妻| 日韩精品无码久久一区二区三| 久久无码专区国产精品s| 亚洲国产精品无码久久久秋霞1| 极品粉嫩嫩模大尺度无码视频| 无码人妻丰满熟妇啪啪网站| 亚洲无码日韩精品第一页| 亚洲人av高清无码| 无码专区—VA亚洲V天堂| 黄A无码片内射无码视频 | 亚洲日韩精品无码专区加勒比☆| 中文字幕无码不卡在线| 国产丰满乱子伦无码专| 亚洲av午夜精品无码专区 | 日日摸日日碰人妻无码| 久久久久久国产精品免费无码| 人妻AV中出无码内射| 在线无码视频观看草草视频| 无码人妻一区二区三区兔费| 91嫩草国产在线无码观看| 亚洲国产精品无码AAA片| 国产色无码专区在线观看| 国产麻豆天美果冻无码视频| 无码精品不卡一区二区三区| 特级毛片内射www无码| 亚洲AV成人无码网天堂| 亚洲另类无码一区二区三区| 亚洲av永久无码精品网址| 亚洲一本到无码av中文字幕| 亚洲精品无码av片| 亚洲AV无码成人精品区狼人影院| 亚洲熟妇av午夜无码不卡| 无码人妻丰满熟妇区五十路| 在人线av无码免费高潮喷水|