視頻剪輯方法和裝置制造方法及圖紙

技術編號：44261127 閱讀：12 留言：0更新日期：2025-02-14 22:06

本申請實施例提供了一種視頻剪輯方法，包括：獲取目標音頻和初始視頻，并確定音頻幀序列，所述音頻幀序列包括多個音頻幀；將所述音頻幀序列輸入到點位預測模型，獲取鼓點預測序列，所述鼓點預測序列包括多個鼓點預測值，所述多個鼓點預測值和所述多個音頻幀一一對應，所述鼓點預測值用于表征對應音頻幀是否包括目標鼓點，所述目標鼓點的剪輯適配度大于第一預設閾值；根據所述鼓點預測序列，確定所述目標音頻的目標鼓點；基于所述目標鼓點和所述目標音頻，對所述初始視頻進行剪輯，得到目標視頻。本申請實施例的技術方案可以通過點位預測模型快速獲取目標音頻中適用于卡點剪輯的時間節點，實現自動化剪輯，有效優化剪輯效果和觀看體驗。

全部詳細技術資料下載

【技術實現步驟摘要】

本申請實施例涉及計算機，尤其涉及一種視頻剪輯方法、裝置、計算機設備、計算機可讀存儲介質、計算機程序產品。

技術介紹

1、隨著數字多媒體技術的快速發展，視頻的內容和數量不斷增加，觀眾獲取有用信息難度隨之提升。通過視頻剪輯（如卡點剪輯），可以優化視頻的內容和結構，生成更具吸引力的視頻。

2、然而，目前的卡點剪輯方案依賴于背景音樂的固有節拍或人工干預，導致剪輯效率低下、成片生硬且模式化、缺乏律動變化，從而影響觀看體驗。

3、需要說明的是，上述內容并不必然是現有技術，也不用于限制本申請的專利保護范圍。

技術實現思路

1、本申請實施例提供一種視頻剪輯方法、裝置、計算機設備、計算機可讀存儲介質、計算機程序產品，以解決或緩解上面提出的一項或更多項技術問題。

2、本申請實施例的一個方面提供了一種視頻剪輯方法，所述方法包括：

3、獲取目標音頻和初始視頻，并根據所述目標音頻確定音頻幀序列，所述音頻幀序列包括多個音頻幀；

4、將所述音頻幀序列輸入到預先訓練好的點位預測模型中，以獲取鼓點預測序列，所述鼓點預測序列包括多個鼓點預測值，所述多個鼓點預測值和所述多個音頻幀一一對應，所述鼓點預測值用于表征對應音頻幀是否包括目標鼓點，所述目標鼓點的剪輯適配度大于第一預設閾值；

5、根據所述鼓點預測序列，確定所述目標音頻的目標鼓點；

6、基于所述目標鼓點和所述目標音頻，對所述初始視頻進行剪輯，得到目標視頻。

7、可選地，所

8、依序從所述鼓點預測序列獲取鼓點預測值；

9、根據獲取到的鼓點預測值，確定對應的音頻幀是否包括目標鼓點；

10、在所述對應的音頻幀包括目標鼓點的情況下，獲取所述對應的音頻幀的時間戳，所述時間戳用于表征目標鼓點。

11、可選地，基于所述目標鼓點和所述目標音頻，對所述初始視頻進行剪輯，得到目標視頻，包括：

12、對所述初始視頻進行片段過濾，得到多個視頻片段；

13、基于所述目標鼓點和所述目標音頻，確定多個音頻片段以及每個音頻片段的時長，其中，音頻片段根據所述目標音頻中相鄰的兩個目標鼓點確定；

14、根據每個音頻片段的時長，在所述多個視頻片段中確定每個音頻片段對應的第一視頻片段，所述第一視頻片段的時長大于或等于對應的音頻片段的時長；

15、根據每個音頻片段的時長處理對應的第一視頻片段，得到每個音頻片段對應的第二視頻片段，所述第二視頻片段的時長等于對應的音頻片段的時長；

16、將所述多個音頻片段對應的第二視頻片段拼接，得到所述目標視頻。

17、可選地，所述點位預測模型通過以下操作得到：

18、獲取多個剪輯成片；

19、提取每個剪輯成片的音頻，并確定每個剪輯成片的轉場點位；

20、基于所述多個剪輯成片的音頻和轉場點位構建多個訓練樣本，進行模型訓練，得到所述點位預測模型。

21、可選地，剪輯成片包括多個視頻幀，每個視頻幀具有對應的時間戳；

22、對應地，確定每個剪輯成片的轉場點位，包括：

23、獲取所述剪輯成片的多個視頻幀；

24、依序計算所述多個視頻幀中相鄰兩個視頻幀之間的相似度；

25、將所述相似度小于第二預設閾值的相鄰兩個視頻幀中的后一個視頻幀確定為轉場視頻幀；

26、根據所述轉場視頻幀，確定所述轉場點位；

27、其中，所述轉場視頻幀對應的時間戳用于表征所述轉場點位。

28、可選地，所述訓練樣本通過以下操作得到：

29、獲取音頻幀間隔；

30、根據所述音頻幀間隔，將所述剪輯成片的音頻轉換為音頻幀序列；

31、根據所述音頻幀間隔，對所述剪輯成片的轉場點位進行量化，得到量化標簽序列；

32、基于所述剪輯成片的音頻幀序列和量化標簽序列，構建所述訓練樣本。

33、可選地，基于所述多個剪輯成片的音頻和轉場點位構建多個訓練樣本，進行模型訓練，得到所述點位預測模型，包括：

34、將所述多個剪輯成片的音頻幀序列輸入模型中，獲取所述多個剪輯成片的鼓點預測序列；

35、根據所述多個剪輯成片的量化標簽序列和所述鼓點預測序列，計算損失函數；

36、基于所述損失函數的計算結果，通過反向傳播算法更新所述模型，得到所述點位預測模型。

37、本申請實施例的另一個方面提供了一種視頻剪輯裝置，所述裝置包括：

38、第一確定模塊，用于獲取目標音頻和初始視頻，并根據所述目標音頻確定音頻幀序列，所述音頻幀序列包括多個音頻幀；

39、獲取模塊，用于將所述音頻幀序列輸入到預先訓練好的點位預測模型中，以獲取鼓點預測序列，所述鼓點預測序列包括多個鼓點預測值，所述多個鼓點預測值和所述多個音頻幀一一對應，所述鼓點預測值用于表征對應音頻幀是否包括目標鼓點，所述目標鼓點的剪輯適配度大于第一預設閾值；

40、第二確定模塊，用于根據所述鼓點預測序列，確定所述目標音頻的目標鼓點；

41、剪輯模塊，用于基于所述目標鼓點和所述目標音頻，對所述初始視頻進行剪輯，得到目標視頻。

42、本申請實施例的另一個方面提供了一種計算機設備，包括：

43、至少一個處理器；及

44、與所述至少一個處理器通信連接的存儲器；

45、其中：所述存儲器存儲有可被所述至少一個處理器執行的指令，所述指令被所述至少一個處理器執行，以使所述至少一個處理器能夠執行如上所述的方法。

46、本申請實施例的另一個方面提供了一種計算機可讀存儲介質，所述計算機可讀存儲介質內存儲有計算機指令，所述計算機指令被處理器執行時實現如上所述的方法。

47、本申請實施例的另一個方面提供了一種計算機程序產品，包括計算機程序，該計算機程序被處理器執行時實現如上所述的方法。

48、本申請實施例采用上述技術方案可以包括如下優勢：

49、獲取初始視頻和目標音頻，對目標音頻進行處理可以得到包括多個音頻幀的音頻幀序列。將音頻幀序列輸入到預先訓練好的點位預測模型中，可以得到包括多個鼓點預測值的鼓點預測序列。其中，多個鼓點預測值和多個音頻幀一一對應，鼓點預測值用于表征對應音頻幀是否包括目標鼓點。目標鼓點是目標音頻中適用于卡點剪輯的時間節點。根據鼓點預測序列，可以確定目標音頻的目標鼓點。根據目標鼓點和目標音頻對初始視頻進行剪輯，可以得到目標視頻（即剪輯成片）。可知，本申請實施例可以通過點位預測模型快速獲取目標音頻中適用于卡點剪輯的時間節點（目標鼓點），從而實現自動化剪輯，得到具有節奏變化的剪輯成片，增強視聽感染力，有效優化剪輯效果和觀看體驗。

本文檔來自技高網...

【技術保護點】

1.一種視頻剪輯方法，其特征在于，所述方法包括：

2.根據權利要求1所述的方法，其特征在于，所述目標鼓點包括一個或多個；對應地，根據所述鼓點預測序列，確定所述目標音頻中的目標鼓點，包括：

3.根據權利要求2所述的方法，其特征在于，基于所述目標鼓點和所述目標音頻，對所述初始視頻進行剪輯，得到目標視頻，包括：

4.根據權利要求1所述的方法，其特征在于，所述點位預測模型通過以下操作得到：

5.根據權利要求4所述的方法，其特征在于，剪輯成片包括多個視頻幀，每個視頻幀具有對應的時間戳；

6.根據權利要求4所述的方法，其特征在于，所述訓練樣本通過以下操作得到：

7.根據權利要求6所述的方法，其特征在于，基于所述多個剪輯成片的音頻和轉場點位構建多個訓練樣本，進行模型訓練，得到所述點位預測模型，包括：

8.一種視頻剪輯裝置，其特征在于，所述裝置包括：

9.?一種計算機設備，其特征在于，包括：

10.一種計算機可讀存儲介質，其特征在于，所述計算機可讀存儲介質內存儲有計算機指令，所述計算機指令

11.一種計算機程序產品，包括計算機程序，其特征在于，該計算機程序被處理器執行時實現權利要求1至7所述方法的步驟。

...

【技術特征摘要】

1.一種視頻剪輯方法，其特征在于，所述方法包括：

2.根據權利要求1所述的方法，其特征在于，所述目標鼓點包括一個或多個；對應地，根據所述鼓點預測序列，確定所述目標音頻中的目標鼓點，包括：

3.根據權利要求2所述的方法，其特征在于，基于所述目標鼓點和所述目標音頻，對所述初始視頻進行剪輯，得到目標視頻，包括：

4.根據權利要求1所述的方法，其特征在于，所述點位預測模型通過以下操作得到：

5.根據權利要求4所述的方法，其特征在于，剪輯成片包括多個視頻幀，每個視頻幀具有對應的時間戳；

6.根據權利要求4所述的方法，其特征在于，所述...

【專利技術屬性】
技術研發人員：徐順鑫，蔡春磊，陳海云，王璐，
申請(專利權)人：上海幻電信息科技有限公司，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術