• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種會(huì)議記錄生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)制造方法及圖紙

    技術(shù)編號(hào):35468164 閱讀:42 留言:0更新日期:2022-11-05 16:12
    本申請(qǐng)實(shí)施例提供了一種會(huì)議記錄生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),涉及人工智能技術(shù)領(lǐng)域及語音處理技術(shù)領(lǐng)域,方法包括:獲取目標(biāo)會(huì)議的會(huì)議音頻;獲取目標(biāo)會(huì)議的至少一個(gè)與會(huì)對(duì)象中每個(gè)與會(huì)對(duì)象的語音特征,根據(jù)每個(gè)與會(huì)對(duì)象的語音特征對(duì)會(huì)議音頻中每個(gè)與會(huì)對(duì)象的音頻進(jìn)行增強(qiáng)處理,得到每個(gè)與會(huì)對(duì)象的增強(qiáng)后的音頻;對(duì)增強(qiáng)后的音頻進(jìn)行語音識(shí)別,得到增強(qiáng)后的音頻對(duì)應(yīng)的目標(biāo)文本,并根據(jù)目標(biāo)文本生成目標(biāo)會(huì)議對(duì)應(yīng)的會(huì)議記錄。采用本申請(qǐng),可以自動(dòng)化智能化的生成會(huì)議記錄。本申請(qǐng)涉及區(qū)塊鏈技術(shù),會(huì)議音頻可從區(qū)塊鏈獲取。會(huì)議音頻可從區(qū)塊鏈獲取。會(huì)議音頻可從區(qū)塊鏈獲取。

    【技術(shù)實(shí)現(xiàn)步驟摘要】
    一種會(huì)議記錄生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)


    [0001]本申請(qǐng)涉及語音處理
    ,尤其涉及一種會(huì)議記錄生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。

    技術(shù)介紹

    [0002]在現(xiàn)代各種辦公會(huì)議中,完整的會(huì)議記錄是十分必要的,會(huì)后回顧記錄往往是以錄制的音頻形式保存的,但是音頻文件占用存儲(chǔ)容量較大,而且查看起來十分不方便,使用率不高。如果將音頻轉(zhuǎn)為文字的話,可以大大減少存儲(chǔ)空間,方便傳送。因此,如何自動(dòng)化智能化生成會(huì)議記錄成為研究的熱點(diǎn)。

    技術(shù)實(shí)現(xiàn)思路

    [0003]本申請(qǐng)實(shí)施例提供了一種會(huì)議記錄生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),可以自動(dòng)化智能化生成會(huì)議記錄。
    [0004]一方面,本申請(qǐng)實(shí)施例提供了一種會(huì)議記錄生成方法,包括:
    [0005]獲取目標(biāo)會(huì)議的會(huì)議音頻,所述目標(biāo)會(huì)議存在多個(gè)與會(huì)對(duì)象;
    [0006]獲取所述多個(gè)與會(huì)對(duì)象中的至少一個(gè)與會(huì)對(duì)象中每個(gè)與會(huì)對(duì)象的語音特征;
    [0007]根據(jù)所述每個(gè)與會(huì)對(duì)象的語音特征對(duì)所述會(huì)議音頻中所述每個(gè)與會(huì)對(duì)象的音頻進(jìn)行增強(qiáng)處理,得到所述每個(gè)與會(huì)對(duì)象的增強(qiáng)后的音頻;
    [0008]對(duì)所述增強(qiáng)后的音頻進(jìn)行語音識(shí)別,得到所述增強(qiáng)后的音頻對(duì)應(yīng)的目標(biāo)文本,并根據(jù)所述目標(biāo)文本生成所述目標(biāo)會(huì)議對(duì)應(yīng)的會(huì)議記錄。
    [0009]第二方面,本申請(qǐng)實(shí)施例提供了一種會(huì)議記錄生成裝置,包括:
    [0010]獲取模塊,用于獲取目標(biāo)會(huì)議的會(huì)議音頻,所述目標(biāo)會(huì)議存在多個(gè)與會(huì)對(duì)象;
    [0011]所述獲取模塊,還用于獲取所述多個(gè)與會(huì)對(duì)象中的至少一個(gè)與會(huì)對(duì)象中每個(gè)與會(huì)對(duì)象的語音特征;
    [0012]處理模塊,用于根據(jù)所述每個(gè)與會(huì)對(duì)象的語音特征對(duì)所述會(huì)議音頻中所述每個(gè)與會(huì)對(duì)象的音頻進(jìn)行增強(qiáng)處理,得到所述每個(gè)與會(huì)對(duì)象的增強(qiáng)后的音頻,并對(duì)所述增強(qiáng)后的音頻進(jìn)行語音識(shí)別,得到所述增強(qiáng)后的音頻對(duì)應(yīng)的目標(biāo)文本,并根據(jù)所述目標(biāo)文本生成所述目標(biāo)會(huì)議對(duì)應(yīng)的會(huì)議記錄。
    [0013]再一方面,本申請(qǐng)實(shí)施例提供了一種計(jì)算機(jī)設(shè)備,包括處理器和存儲(chǔ)器,所述處理器和所述存儲(chǔ)器相互連接,其中,所述存儲(chǔ)器用于存儲(chǔ)計(jì)算機(jī)程序指令,所述處理器被配置用于執(zhí)行所述程序指令,實(shí)現(xiàn)所述的會(huì)議記錄生成方法。
    [0014]再一方面,本申請(qǐng)實(shí)施例提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)程序指令,所述計(jì)算機(jī)程序指令被處理器執(zhí)行時(shí),用于執(zhí)行所述的會(huì)議記錄生成方法。
    [0015]綜上所述,計(jì)算機(jī)設(shè)備獲取目標(biāo)會(huì)議的會(huì)議音頻;計(jì)算機(jī)設(shè)備還可以獲取目標(biāo)會(huì)議中至少一個(gè)與會(huì)對(duì)象中每個(gè)與會(huì)對(duì)象的語音特征。并根據(jù)每個(gè)與會(huì)對(duì)象的語音特征對(duì)會(huì)
    議音頻中每個(gè)與會(huì)對(duì)象的音頻進(jìn)行增強(qiáng)處理,得到每個(gè)與會(huì)對(duì)象的增強(qiáng)后的音頻;計(jì)算機(jī)設(shè)備對(duì)增強(qiáng)后的音頻進(jìn)行語音識(shí)別,得到增強(qiáng)后的音頻對(duì)應(yīng)的目標(biāo)文本,并根據(jù)目標(biāo)文本生成目標(biāo)會(huì)議對(duì)應(yīng)的會(huì)議記錄,實(shí)現(xiàn)了會(huì)議記錄的自動(dòng)化智能化生成過程。
    附圖說明
    [0016]為了更清楚地說明本申請(qǐng)實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請(qǐng)的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
    [0017]圖1是本申請(qǐng)實(shí)施例提供的一種會(huì)議記錄生成方法的流程示意圖;
    [0018]圖2A是本申請(qǐng)?zhí)峁┑囊环N梅爾濾波器對(duì)數(shù)能量提取過程的示意圖;
    [0019]圖2B是本申請(qǐng)實(shí)施例提供的一種生成增強(qiáng)后的音頻以及訓(xùn)練語音過濾器的過程的示意圖;
    [0020]圖2C是本申請(qǐng)實(shí)施例提供的一種生成會(huì)議記錄的過程的示意圖;
    [0021]圖3是本申請(qǐng)實(shí)施例提供的一種會(huì)議記錄生成裝置的結(jié)構(gòu)示意圖;
    [0022]圖4是本申請(qǐng)實(shí)施例提供的一種計(jì)算機(jī)設(shè)備的結(jié)構(gòu)示意圖。
    具體實(shí)施方式
    [0023]下面將結(jié)合本申請(qǐng)實(shí)施例中的附圖,對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行描述。需要說明的是,本申請(qǐng)所涉及各種音頻,如會(huì)議音頻、對(duì)象的音頻的錄制、處理和使用,均經(jīng)過相關(guān)人員充分授權(quán)或者經(jīng)過各方充分授權(quán),本申請(qǐng)實(shí)施例涉及的各種音頻的錄制、處理和使用遵守相關(guān)國(guó)家和地區(qū)的相關(guān)法律法規(guī)和標(biāo)準(zhǔn)。
    [0024]請(qǐng)參閱圖1,為本申請(qǐng)實(shí)施例提供的一種會(huì)議記錄生成方法的流程示意圖。該方法可以應(yīng)用于計(jì)算機(jī)設(shè)備。計(jì)算機(jī)設(shè)備可以為智能終端或服務(wù)器。智能終端可以為臺(tái)式電腦等具備信息處理能力的智能終端。服務(wù)器可以是獨(dú)立的服務(wù)器,也可以是多個(gè)物理服務(wù)器構(gòu)成的服務(wù)器集群或者分布式系統(tǒng),還可以是提供云服務(wù)、云數(shù)據(jù)庫、云計(jì)算、云函數(shù)、云存儲(chǔ)、網(wǎng)絡(luò)服務(wù)、云通信、中間件服務(wù)、域名服務(wù)、安全服務(wù)、內(nèi)容分發(fā)網(wǎng)絡(luò)(Content Delivery Network,CDN)、以及大數(shù)據(jù)和人工智能平臺(tái)等基礎(chǔ)云計(jì)算服務(wù)的云服務(wù)器,但并不局限于此。具體地,該方法可以包括以下步驟:
    [0025]S101、獲取目標(biāo)會(huì)議的會(huì)議音頻,所述目標(biāo)會(huì)議存在多個(gè)與會(huì)對(duì)象。
    [0026]其中,目標(biāo)會(huì)議指待生成對(duì)應(yīng)的會(huì)議記錄的會(huì)議。與會(huì)對(duì)象指參加會(huì)議的人或虛擬角色(指虛擬出來的形象,如虛擬出來的人物形象),發(fā)言對(duì)象指在目標(biāo)會(huì)議上發(fā)言的與會(huì)對(duì)象,如發(fā)言的人或虛擬角色。
    [0027]其中,所述會(huì)議音頻混合了所述多個(gè)與會(huì)對(duì)象中的至少一個(gè)發(fā)言對(duì)象中每個(gè)發(fā)言對(duì)象的音頻。會(huì)議音頻可以通過錄音設(shè)備采集。錄音設(shè)備為具有錄音功能的電子設(shè)備,包括但不限于錄音器、電話機(jī)、手機(jī)、電腦等。在實(shí)際的應(yīng)用場(chǎng)景中,若目標(biāo)會(huì)議為線下會(huì)議,則錄音設(shè)備可以是設(shè)置在目標(biāo)會(huì)議的舉辦地點(diǎn)的一個(gè)錄音設(shè)備,若目標(biāo)會(huì)議為線上會(huì)議,則錄音設(shè)備可以是任一與會(huì)對(duì)象或指定的一個(gè)與會(huì)對(duì)象使用的錄音設(shè)備。
    [0028]其中,所述的會(huì)議音頻可以以一個(gè)音頻文件的形式存在。會(huì)議音頻混合了至少一
    個(gè)發(fā)言對(duì)象中每個(gè)發(fā)言對(duì)象的音頻。在播放會(huì)議音頻時(shí),可以聽到至少一個(gè)發(fā)言對(duì)象中每個(gè)發(fā)言對(duì)象的語音。在實(shí)際的應(yīng)用場(chǎng)景中,假設(shè)目標(biāo)會(huì)議上有多人發(fā)言,此時(shí)通過錄音設(shè)備采集的會(huì)議音頻就包括多人語音。如果播放這個(gè)會(huì)議音頻,就能夠聽到多個(gè)發(fā)言人中每個(gè)發(fā)言人的語音。正常情況下,如果能夠正常采集到目標(biāo)會(huì)議上所有發(fā)言對(duì)象中每個(gè)發(fā)言對(duì)象的語音,則會(huì)議音頻就會(huì)混合有所有發(fā)言對(duì)象中每個(gè)發(fā)言對(duì)象的音頻。
    [0029]在一個(gè)實(shí)施例中,計(jì)算機(jī)設(shè)備可以在檢測(cè)到目標(biāo)會(huì)議的會(huì)議音頻時(shí),執(zhí)行步驟S101。例如,計(jì)算機(jī)設(shè)備可以在檢測(cè)到指定存儲(chǔ)區(qū)域存儲(chǔ)了會(huì)議音頻時(shí),執(zhí)行步驟S101。或者,計(jì)算機(jī)設(shè)備可以在接收到針對(duì)目標(biāo)會(huì)議的會(huì)議記錄生成指令時(shí),執(zhí)行步驟S101。其中,會(huì)議記錄生成指令可以由任一與會(huì)人員或指定的與會(huì)人員或除與會(huì)人員之外的其它人員提交。
    [0030]在一個(gè)實(shí)施例中,錄音設(shè)備采集完成目標(biāo)會(huì)議的會(huì)議音頻后,可以將會(huì)議音頻發(fā)送至計(jì)算機(jī)設(shè)備或?qū)?huì)議音頻存儲(chǔ)于指定存儲(chǔ)區(qū)域(錄音設(shè)備的內(nèi)部存儲(chǔ)或外部存儲(chǔ)、指定服務(wù)器或指定數(shù)據(jù)庫),后續(xù)計(jì)算機(jī)設(shè)備可以獲取指定存儲(chǔ)區(qū)域存儲(chǔ)的會(huì)議音頻。
    [0031]S102、獲取所述多個(gè)與會(huì)對(duì)象中的至少一個(gè)與會(huì)對(duì)象中每個(gè)與會(huì)對(duì)象的語音特征本文檔來自技高網(wǎng)
    ...

    【技術(shù)保護(hù)點(diǎn)】

    【技術(shù)特征摘要】
    1.一種會(huì)議記錄生成方法,其特征在于,包括:獲取目標(biāo)會(huì)議的會(huì)議音頻,所述目標(biāo)會(huì)議存在多個(gè)與會(huì)對(duì)象;獲取所述多個(gè)與會(huì)對(duì)象中的至少一個(gè)與會(huì)對(duì)象中每個(gè)與會(huì)對(duì)象的語音特征;根據(jù)所述每個(gè)與會(huì)對(duì)象的語音特征對(duì)所述會(huì)議音頻中所述每個(gè)與會(huì)對(duì)象的音頻進(jìn)行增強(qiáng)處理,得到所述每個(gè)與會(huì)對(duì)象的增強(qiáng)后的音頻;對(duì)所述增強(qiáng)后的音頻進(jìn)行語音識(shí)別,得到所述增強(qiáng)后的音頻對(duì)應(yīng)的目標(biāo)文本,并根據(jù)所述目標(biāo)文本生成所述目標(biāo)會(huì)議對(duì)應(yīng)的會(huì)議記錄。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:獲取多個(gè)對(duì)象中每個(gè)對(duì)象的語音,所述多個(gè)對(duì)象包括所述至少一個(gè)與會(huì)對(duì)象;根據(jù)所述每個(gè)對(duì)象的語音提取所述每個(gè)對(duì)象對(duì)應(yīng)的多組梅爾濾波器對(duì)數(shù)能量;根據(jù)所述每個(gè)對(duì)象對(duì)應(yīng)的多組梅爾濾波器對(duì)數(shù)能量確定所述每個(gè)對(duì)象的語音特征信息;對(duì)所述每個(gè)對(duì)象的語音特征信息進(jìn)行編碼處理,得到所述每個(gè)對(duì)象的語音特征。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述每個(gè)對(duì)象對(duì)應(yīng)的多組梅爾濾波器對(duì)數(shù)能量確定所述每個(gè)對(duì)象的語音特征信息,包括:分別對(duì)所述每個(gè)對(duì)象對(duì)應(yīng)的多組梅爾濾波器對(duì)數(shù)能量進(jìn)行L2正則化處理,得到所述每個(gè)對(duì)象對(duì)應(yīng)的多組正則化處理結(jié)果;分別對(duì)所述每個(gè)對(duì)象對(duì)應(yīng)的多組正則化處理結(jié)果進(jìn)行均值計(jì)算,得到所述每個(gè)對(duì)象對(duì)應(yīng)的多個(gè)正則化處理結(jié)果均值;將所述每個(gè)對(duì)象對(duì)應(yīng)的多個(gè)正則處理結(jié)果均值確定為所述每個(gè)對(duì)象的語音特征信息。4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述每個(gè)與會(huì)對(duì)象的語音特征對(duì)所述會(huì)議音頻中所述每個(gè)與會(huì)對(duì)象的音頻進(jìn)行增強(qiáng)處理,得到所述每個(gè)與會(huì)對(duì)象的增強(qiáng)后的音頻,包括:獲取所述會(huì)議音頻的聲音特征;對(duì)所述會(huì)議音頻的聲音特征進(jìn)行短時(shí)傅里葉變換,得到第一幅度頻譜;調(diào)用語音過濾器以根據(jù)所述至少一個(gè)與會(huì)對(duì)象中的與會(huì)對(duì)象O
    i
    的語音特征以及所述第一幅度頻譜進(jìn)行處理,得到軟掩碼P
    i
    ,i為小于或等于M的正整數(shù),M為所述至少一個(gè)與會(huì)對(duì)象的數(shù)量;利用所述軟掩碼P
    i
    對(duì)所述第一幅度頻譜進(jìn)行掩碼處理,得到掩碼后的幅度頻譜Q
    i
    ;對(duì)所述掩碼后的幅度頻譜Q
    i
    進(jìn)行短時(shí)逆傅里葉變換,得到所述與會(huì)對(duì)象O
    i
    的增強(qiáng)后的音頻。5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述獲取所述會(huì)議音頻的聲音特征,包括:根據(jù)所述會(huì)議音頻提取所述會(huì)議音頻對(duì)應(yīng)的多組梅爾濾波器對(duì)數(shù)能量;根據(jù)所述會(huì)議音頻對(duì)應(yīng)的多組梅爾濾波器對(duì)數(shù)能量確定所述會(huì)議音頻的聲音特征信息;對(duì)所述會(huì)議音頻的聲音特征信息進(jìn)行編碼處理,得到所述會(huì)議音頻的聲音特征。6.根據(jù)權(quán)利要求4或5所述的方法,其特征在于,所述方法還包括:獲取樣本會(huì)議音頻,所述樣本會(huì)議音頻對(duì)應(yīng)的會(huì)議存在多個(gè)樣本與會(huì)對(duì)象;獲取所述多個(gè)樣本與會(huì)對(duì)象中...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:胡立云
    申請(qǐng)(專利權(quán))人:未鯤上海科技服務(wù)有限公司
    類型:發(fā)明
    國(guó)別省市:

    網(wǎng)友詢問留言 已有0條評(píng)論
    • 還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

    1
    主站蜘蛛池模板: 无码中文在线二区免费| 亚洲爆乳AAA无码专区| 亚洲精品无码鲁网中文电影| 亚洲国产精品无码一线岛国 | 久久精品中文无码资源站| 亚洲AV无码国产精品色| gogo少妇无码肉肉视频| 精品人妻中文无码AV在线| 国产精品无码av在线播放| 人妻丰满熟AV无码区HD| 亚洲av无码一区二区三区乱子伦| 无码国产激情在线观看| 久久久久久亚洲Av无码精品专口| 波多野结AV衣东京热无码专区| 精品久久久久久久无码| 高h纯肉无码视频在线观看| 无码任你躁久久久久久老妇| 亚洲国产精品无码中文lv| 日韩网红少妇无码视频香港| 亚洲日韩精品A∨片无码| 亚洲?v无码国产在丝袜线观看 | 亚洲大尺度无码无码专区| 大胆日本无码裸体日本动漫| 精品爆乳一区二区三区无码av| 人妻无码人妻有码中文字幕| 爽到高潮无码视频在线观看| 亚洲中文字幕无码av| 中文字幕无码免费久久99| 久久99精品久久久久久hb无码| 国产成人亚洲综合无码精品| 伊人久久精品无码二区麻豆| 亚洲人成影院在线无码观看| 国产成人无码aa精品一区| 无码尹人久久相蕉无码| 亚洲AV色无码乱码在线观看| 亚洲欧洲无码一区二区三区| 亚洲AV永久无码精品一福利| 无码狠狠躁久久久久久久| 免费无码看av的网站| 久久久91人妻无码精品蜜桃HD| 国产成人A亚洲精V品无码|