• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基于人工智能的超高清視頻會議分析管理系統技術方案

    技術編號:34934947 閱讀:36 留言:0更新日期:2022-09-15 07:31
    本發明專利技術涉及視頻會議管理技術領域,具體公開一種基于人工智能的超高清視頻會議分析管理系統,包括目標視頻會議參會人員統計模塊、目標視頻會議網絡傳輸參數檢測模塊、目標視頻會議網絡傳輸異常提示模塊、會議管理數據庫、參會人員發言語音信息實時提取模塊、參會人員發言語音處理模塊和參會人員參會視頻界面顯示亮度調控處理模塊,通過對超高清視頻會議進行網絡傳輸質量的監測管理、參會人員發言語音信息的字幕添加、音量調控及音色潤色多功能管理和參會視頻界面的顯示亮度統籌調控,實現了超高清視頻會議的多方面智能化在線管理,克服了目前超高清視頻會議的在線管理存在的不足,能夠提升參會人員對超高清視頻會議在視覺和聽覺上的雙重體驗感。聽覺上的雙重體驗感。聽覺上的雙重體驗感。

    【技術實現步驟摘要】
    一種基于人工智能的超高清視頻會議分析管理系統


    [0001]本專利技術涉及視頻會議管理
    ,具體而言,是一種基于人工智能的超高清視頻會議分析管理系統。

    技術介紹

    [0002]隨著互聯網的迅猛發展和多媒體通信技術的進步,為視頻會議的實現提供了可能。視頻會議模式打破了傳統會議在時間和空間上的限制,能夠將處于不同地點、時區的會議對象進行整合,實現會議的召開,因此受到了廣泛歡迎。伴隨著時代的發展,視頻會議也由曾經的標清視頻會議升級到超高清視頻會議,更加強化了視頻會議的視覺體驗感,而為了保障超高清視頻會議的召開效果,對超高清視頻會議進行在線管理顯得至關重要。
    [0003]然而目前對超高清視頻會議的在線管理基本都集中在視頻會議的圖像呈現方面,比如視頻界面中的人臉攝像追蹤聚焦,不僅忽略了視頻會議的網絡傳輸質量監測管理,還對參會人員發言語音信息的管理關注度不夠,具體體現在以下幾個方面:第一方面:超高清視頻會議相對于普通標清會議,其視頻界面畫質清晰度的改善是通過提高網絡傳輸質量來實現的,當網絡傳輸質量不佳時,視頻會議的畫質就達不到超高清的畫質需求,進而影響參會人員的視覺感受,與此同時還容易造成卡頓,影響視頻會議的召開流暢度,從而降低了超高清視頻會議的召開效果。
    [0004]第二方面:目前對超高清視頻會議中參會人員發言語音信息的管理集中在音量調控方面,一方面缺乏對參會人員發言語音的字幕處理,由于參會人員大多來自各個地區,對于一些存在普通話發言困難的參會人員,其在發言過程中不可避免地會攜帶口音,這些攜帶口音的發言語音對其他參會人員就會造成傾聽障礙,為了克服傾聽障礙,就需要添加字幕來輔助會議內容理解,另一方面在對參會人員的發言語音進行音量調控時,只是單純將發言語音的音量調控到人耳傾聽的適宜基準音量,但由于發言語音的頻率不同,對人耳造成的音量感受會存在差異,因此如果只是將發言語音的音量進行基準調控,就會導致調控精準度下降,不僅降低了傾聽的清晰度效果,還可能會造成參會人員聽神經的損傷。

    技術實現思路

    [0005]為解決上述技術問題,本專利技術是通過以下技術方案實現的:一種基于人工智能的超高清視頻會議分析管理系統,包括:目標視頻會議參會人員統計模塊,用于將當前正在進行的視頻會議記為目標視頻會議,并統計目標視頻會議中存在的參會人員數量,進而將各參會人員依次標記為1,2,...,i,...,n。
    [0006]目標視頻會議網絡傳輸參數檢測模塊,用于由各參會人員對應的參會終端對其所處參會空間進行網絡傳輸參數檢測。
    [0007]目標視頻會議網絡傳輸異常提示模塊,用于對各參會人員對應參會空間的網絡傳輸參數進行分析,由此篩選出網絡傳輸異常參會人員,進而在該參會人員的參會視頻界面進行網絡傳輸異常彈窗提示。
    [0008]會議管理數據庫,用于存儲超高清模式對應的標準網絡傳輸參數,存儲各種語種對應的口音特征,存儲各種字號對應的字體面積,存儲各種背景顏色對應匹配的字幕顏色,存儲各種人耳傾聽敏感度對應的聲音頻率區間,存儲各種人耳傾聽敏感度對應的音量需求調控度,存儲人耳傾聽的適宜基準音量,并存儲各種照明亮度對應參會視頻界面的適宜顯示亮度區間。
    [0009]參會人員發言語音信息實時提取模塊,用于由各參會人員對應參會終端內置的麥克風實時對其發言語音信息進行提取。
    [0010]參會人員發言語音處理模塊,用于對提取的各參會人員的發言語音信息進行處理。
    [0011]在一種可選的方式中,所述網絡傳輸參數包括網絡傳輸速度和網絡信號強度。
    [0012]在一種可選的方式中,所述篩選出網絡傳輸異常參會人員對應的具體篩選方法如下:將各參會人員對應參會空間的網絡傳輸參數與會議管理數據庫中超高清模式對應的標準網絡傳輸參數進行對比,通過網絡傳輸質量系數計算公式,計算得到各參會人員對應參會空間的網絡傳輸質量系數,其中、分別表示為第i個參會人員對應參會空間的網絡傳輸速度、網絡信號強度,i表示為第i個參會人員的編號,、分別表示為超高清模式對應的標準網絡傳輸速度、標準網絡信號強度,a、b分別表示為網絡傳輸速度、網絡信號強度對應的影響因子,且,e表示為自然常數。
    [0013]將各參會人員對應參會空間的網絡傳輸質量系數與設定閾值進行對比,若某參會人員對應參會空間的網絡傳輸質量系數小于設定閾值,表明該參會人員對應的參會空間存在網絡傳輸異常,并將該參會人員記為網絡傳輸異常參會人員。
    [0014]在一種可選的方式中,所述參會人員發言語音處理模塊包括參會人員發言字幕添加單元、參會人員發言音量調控單元和參會人員發言音色潤色單元。
    [0015]在一種可選的方式中,所述參會人員發言字幕添加單元用于將各參會人員的發言語音信息轉化為發言文本信息,并將其在參會視頻界面進行字幕添加,其具體執行過程參見以下步驟:從各參會人員的發言語音信息中提取口音特征,并將其與會議管理數據庫中各種語種對應的口音特征進行匹配,從中篩選出各參會人員對應的發言語種。
    [0016]將各參會人員對應的發言語音信息導入到該參會人員對應發言語種的普通話模板,由此將各參會人員對應的發言語音信息轉化為普通話語音信息,得到各參會人員對應的發言轉化語音信息。
    [0017]從各參會人員對應的發言轉化語音信息中提取轉化失敗的語音,并將其記為異常語音,同時定位異常語音在發言轉化語音信息中的位置,由此提取異常語音對應的前端語音和后端語音。
    [0018]根據異常語音對應的前端語音和后端語音對異常語音進行修正,得到修正后的異常語音,將修正后的異常語音與發言轉化語音信息進行融合,由此得到各參會人員對應的修正發言轉化語音信息。
    [0019]將各參會人員對應的修正發言轉化語音信息進行語音分詞劃分,得到若干語音詞
    組,進而將各參會人員對應修正發言轉化語音信息劃分的若干語音詞組通過語音識別技術轉化為發言文本信息。
    [0020]獲取參會視頻界面對應的尺寸和背景顏色,并以此確定字幕適配字號和字幕適配顏色。
    [0021]將各參會人員對應的發言文本信息在參會視頻界面按照確定的字幕適配字號和字幕適配顏色進行字幕添加。
    [0022]在一種可選的方式中,所述確定字幕適配字號和字幕適配顏色對應的具體操作方式如下:根據參會視頻界面對應的尺寸獲取參會視頻界面的面積。
    [0023]依據參會視頻界面的面積與預設的字幕字體面積適配占比計算字幕字體的適配面積,其計算公式為,表示為字幕字體的適配面積,表示為參會視頻界面的面積,表示為字幕字體面積適配占比。
    [0024]將字幕字體的適配面積與會議管理數據庫中各種字號對應的字體面積進行對比,計算各種字號對應的字體面積相似度,并從中篩選出字體面積相似度最大的字號作為字幕適配字號。
    [0025]將參會視頻界面對應的背景顏色與會議管理數據庫中各種背景顏色對應匹配的字幕顏色進行比對,從中匹配出字幕適配顏色。
    [0026]在一種可選的方式中,所述參會人員發言音量調控單元用于對各參會人員的發言語音進行音量調控,其具體調控過程本文檔來自技高網
    ...

    【技術保護點】

    【技術特征摘要】
    1.一種基于人工智能的超高清視頻會議分析管理系統,其特征在于,包括:目標視頻會議參會人員統計模塊,用于將當前正在進行的視頻會議記為目標視頻會議,并統計目標視頻會議中存在的參會人員數量,進而將各參會人員依次標記為1,2,...,i,...,n;目標視頻會議網絡傳輸參數檢測模塊,用于由各參會人員對應的參會終端對其所處參會空間進行網絡傳輸參數檢測;目標視頻會議網絡傳輸異常提示模塊,用于對各參會人員對應參會空間的網絡傳輸參數進行分析,由此篩選出網絡傳輸異常參會人員,進而在該參會人員的參會視頻界面進行網絡傳輸異常彈窗提示;會議管理數據庫,用于存儲超高清模式對應的標準網絡傳輸參數,存儲各種語種對應的口音特征,存儲各種字號對應的字體面積,存儲各種背景顏色對應匹配的字幕顏色,存儲各種人耳傾聽敏感度對應的聲音頻率區間,存儲各種人耳傾聽敏感度對應的音量需求調控度,存儲人耳傾聽的適宜基準音量,并存儲各種照明亮度對應參會視頻界面的適宜顯示亮度區間;參會人員發言語音信息實時提取模塊,用于由各參會人員對應參會終端內置的麥克風實時對其發言語音信息進行提取;參會人員發言語音處理模塊,用于對提取的各參會人員的發言語音信息進行處理。2.根據權利要求1所述的一種基于人工智能的超高清視頻會議分析管理系統,其特征在于:所述網絡傳輸參數包括網絡傳輸速度和網絡信號強度。3.根據權利要求2所述的一種基于人工智能的超高清視頻會議分析管理系統,其特征在于:所述篩選出網絡傳輸異常參會人員對應的具體篩選方法如下:將各參會人員對應參會空間的網絡傳輸參數與會議管理數據庫中超高清模式對應的標準網絡傳輸參數進行對比,通過網絡傳輸質量系數計算公式,計算得到各參會人員對應參會空間的網絡傳輸質量系數,其中、分別表示為第i個參會人員對應參會空間的網絡傳輸速度、網絡信號強度,i表示為第i個參會人員的編號,、分別表示為超高清模式對應的標準網絡傳輸速度、標準網絡信號強度,a、b分別表示為網絡傳輸速度、網絡信號強度對應的影響因子,且,e表示為自然常數;將各參會人員對應參會空間的網絡傳輸質量系數與設定閾值進行對比,若某參會人員對應參會空間的網絡傳輸質量系數小于設定閾值,表明該參會人員對應的參會空間存在網絡傳輸異常,并將該參會人員記為網絡傳輸異常參會人員。4.根據權利要求1所述的一種基于人工智能的超高清視頻會議分析管理系統,其特征在于:所述參會人員發言語音處理模塊包括參會人員發言字幕添加單元、參會人員發言音量調控單元和參會人員發言音色潤色單元。5.根據權利要求4所述的一種基于人工智能的超高清視頻會議分析管理系統,其特征在于:所述參會人員發言字幕添加單元用于將各參會人員的發言語音信息轉化為發言文本信息,并將其在參會視頻界面進行字幕添加,其具體執行過程參見以下步驟:
    從各參會人員的發言語音信息中提取口音特征,并將其與會議管理數據庫中各種語種對應的口音特征進行匹配,從中篩選出各參會人員對應的發言語種;將各參會人員對應的發言語音信息導入到該參會人員對應發言語種的普通話模板,由此將各參會人員對應的發言語音信息轉化為普通話語音信息,得到各參會人員對應的發言轉化語音信息;從各參會人員對應的發言轉化語音信息中提取轉化失敗的語音,并將其記為異常語音,同時定位異常語音在發言轉化語音信息中的位置,由此提取異常語音對應的前端語音和后端語音;根據異常語音對應的前端語音和后端語音對異常語音進行修正,得到修正后的異常語音,將修正后的異常語音與發言轉化語音信息進行融合,由此得到各參會人員對應的修正發言轉化語音信息;將各參會人員對應的修正發言轉化語音信息進行語音分詞劃分,得到若干語音詞組,進而將各參會人員對應修正發言轉化語音信息劃分的若干語音...

    【專利技術屬性】
    技術研發人員:陳家豪
    申請(專利權)人:深圳市稻興實業有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 粉嫩大学生无套内射无码卡视频 | 中文字幕无码一区二区免费| 精品国产一区二区三区无码| 亚洲无码一区二区三区| 亚洲精品人成无码中文毛片| 色窝窝无码一区二区三区成人网站 | 亚洲?V无码乱码国产精品| 无码人妻久久久一区二区三区 | 精品无码国产污污污免费| 亚洲中文字幕不卡无码| 无码专区国产精品视频| 国产精品无码一区二区三区电影| 无码日本电影一区二区网站| 久久久无码精品国产一区| 少妇人妻av无码专区| 67194成l人在线观看线路无码| 变态SM天堂无码专区| 亚洲av无码专区在线观看下载| 无码囯产精品一区二区免费| 久久精品无码一区二区日韩AV | 人妻精品久久无码区| 精品久久久久久无码专区不卡| 亚洲av日韩av高潮潮喷无码| 在线高清无码A.| 丰满日韩放荡少妇无码视频| 国产精品亚洲一区二区无码| 无码国内精品人妻少妇| 国产亚洲AV无码AV男人的天堂| 国精品无码一区二区三区在线蜜臀| 国产精品久久无码一区二区三区网| 久久精品中文字幕无码绿巨人 | 亚洲av中文无码乱人伦在线观看| 免费无遮挡无码永久视频| 成年无码av片完整版| 亚洲自偷自偷偷色无码中文 | 无码精品A∨在线观看| 日韩精品少妇无码受不了| 无码国产午夜福利片在线观看| 小SAO货水好多真紧H无码视频| 蜜桃臀无码内射一区二区三区| 色情无码WWW视频无码区小黄鸭|