System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及計算機,具體而言,涉及一種富文本內容比對方法、系統以及介質。
技術介紹
1、目前,行業內的diff算法,可以用于實現文本差異比較和合并,并標識出文本的添加、刪除和替換更改,有助于在處理歷史存儲數據時進行版本差異化比對。
2、然而,現有的diff算法只能對純文本進行差異比對,如果文本中有圖片、視頻、音頻等媒體資源信息,則無法從內容形式上進行區分。比如現有的采編系統,只能對稿件的文字進行diff比對,無法對稿件中的圖片、視頻、音頻進行區分比對,從而導致用戶無法直觀查看這篇稿子某一個歷史版本媒體素材的增刪改情況。
3、針對上述問題,目前亟待有效的技術解決方案。
技術實現思路
1、本申請的目的在于提供一種富文本內容比對方法、系統以及介質,實現了通過設置文本類型以及多媒體類型的內容識別,同時實現對于文本以及多媒體內容的比對,提供差異內容的標注展示,便于用戶可以快速直觀地查看并比較不同版本的富文本內容。
2、第一方面,本申請提供了一種富文本內容比對方法,包括:
3、獲取第一富文本以及第二富文本,所述第二富文本為所述第一富文本的歷史版本;
4、將所述第一富文本以及所述第二富文本進行過濾處理得到第一目標內容以及第二目標內容,所述第一目標內容以及所述第二目標內容包括文本類型內容以及多媒體類型內容;
5、對所述第一目標內容以及所述第二目標內容進行多媒體內容的類型識別,并基于識別結果進行轉換處理得到第一字符序列以及第二字符
6、將所述第一字符序列以及所述第二字符序列進行比對確定最長公共子序列;
7、在所述最長公共子序列小于設置的序列長度的情況下,基于所述最長公共子序列對所述第一目標內容以及所述第二目標內容進行標注;
8、將所述第一目標內容以及所述第二目標內容基于標注結果進行展示。
9、可選的,所述將所述第一富文本以及所述第二富文本進行過濾處理得到第一目標內容以及第二目標內容,包括:
10、對所述第一富文本進行內容標簽識別,將與文本標簽和多媒體標簽不匹配的內容進行過濾得到第一目標內容;
11、對所述第二富文本進行內容標簽識別,將與字符標簽和多媒體標簽不匹配的內容進行過濾得到第二目標內容。
12、可選的,所述對所述第一目標內容以及所述第二目標內容進行多媒體內容的類型識別,包括:
13、根據設置的正則表達式對所述第一目標內容進行遍歷,確定多媒體內容對應的多媒體類型;
14、根據設置的正則表達式對所述第二目標內容進行遍歷,確定多媒體內容對應的多媒體類型。
15、可選的,所述基于識別結果進行轉換處理得到第一字符序列以及第二字符序列,包括:
16、將第一目標內容的第一多媒體內容轉換為第一多媒體標識,并對應于所述第一多媒體內容與相鄰字符內容的相對位置,將所述第一多媒體標識添加至第一目標內容的字符內容進行占位得到第一字符序列;
17、將第二目標內容的第二多媒體內容轉換為第二多媒體標識,并對應于所述第二多媒體內容與相鄰字符內容的相對位置,將所述第二多媒體標識添加至第二目標內容的字符內容進行占位得到第二字符序列。
18、可選的,所述基于所述最長公共子序列對所述第一目標內容以及所述第二目標內容進行標注,包括:
19、基于所述最長公共子序列確定所述第一字符序列的第一非公共子序列,并基于所述第一非公共子序列對所述第一目標內容進行對應位置的標注;
20、基于所述最長公共子序列確定所述第二字符序列的第二非公共子序列,并基于所述第二非公共子序列對所述第二目標內容進行對應位置的標注。
21、可選的,所述將所述第一目標內容以及所述第二目標內容基于標注結果進行展示,包括:
22、在所述第一目標內容的第一標注位置存在第一多媒體標識的情況下,將所述第一多媒體標識恢復為對應的多媒體內容,并將所述第一多媒體標識替換為對應的多媒體內容得到第一差異內容;
23、在所述第二目標內容的第二標注位置存在第二多媒體標識的情況下,將所述第二多媒體標識恢復為對應的多媒體內容,并將所述第二多媒體標識替換為對應的多媒體內容得到第二差異內容;
24、將所述第一差異內容以及所述第二差異內容進行展示。
25、可選的,在將所述第一字符序列以及所述第二字符序列進行比對確定最長公共子序列之后,還包括:
26、在所述最長公共子序列等于設置的序列長度的情況下,輸出所述第一富文本以及所述第二富文本的內容一致的比對結果。
27、可選的,所述多媒體類型包括圖片類型、視頻類型以及音頻類型中的一種或多種。
28、第二方面,本申請提供了一種富文本內容比對系統,該富文本內容比對系統包括:存儲器及處理器,所述存儲器中包括富文本內容比對方法的程序,所述富文本內容比對方法的程序被所述處理器執行時實現以下步驟:
29、獲取第一富文本以及第二富文本,所述第二富文本為所述第一富文本的歷史版本;
30、將所述第一富文本以及所述第二富文本進行過濾處理得到第一目標內容以及第二目標內容,所述第一目標內容以及所述第二目標內容包括文本類型內容以及多媒體類型內容;
31、對所述第一目標內容以及所述第二目標內容進行多媒體內容的類型識別,并基于識別結果進行轉換處理得到第一字符序列以及第二字符序列;
32、將所述第一字符序列以及所述第二字符序列進行比對確定最長公共子序列;
33、在所述最長公共子序列小于設置的序列長度的情況下,基于所述最長公共子序列對所述第一目標內容以及所述第二目標內容進行標注;
34、將所述第一目標內容以及所述第二目標內容基于標注結果進行展示。
35、第三方面,本申請還提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質中包括富文本內容比對方法程序,所述富文本內容比對方法程序被處理器執行時,實現如本申請中任一實施例所述的富文本內容比對方法的步驟。
36、由上可知,本申請提供的富文本內容比對方法、系統以及介質,該富文本內容比對方法包括:獲取第一富文本以及第二富文本,第二富文本為第一富文本的歷史版本;將第一富文本以及第二富文本進行過濾處理得到第一目標內容以及第二目標內容,第一目標內容以及第二目標內容包括文本類型內容以及多媒體類型內容;對第一目標內容以及第二目標內容進行多媒體內容的類型識別,并基于識別結果進行轉換處理得到第一字符序列以及第二字符序列;將第一字符序列以及第二字符序列進行比對確定最長公共子序列;在最長公共子序列小于設置的序列長度的情況下,基于最長公共子序列對第一目標內容以及第二目標內容進行標注;將第一目標內容以及第二目標內容基于標注結果進行展示。實現了通過設置文本類型以及多媒體類型的內容識別,同時實現對于文本以及多媒體內容的比對,提供差異內容的標注展示,便于用戶可以快速直觀地查看并本文檔來自技高網...
【技術保護點】
1.一種富文本內容比對方法,其特征在于,包括
2.根據權利要求1所述的富文本內容比對方法,其特征在于,所述將所述第一富文本以及所述第二富文本進行過濾處理得到第一目標內容以及第二目標內容,包括:
3.根據權利要求1所述的富文本內容比對方法,其特征在于,所述對所述第一目標內容以及所述第二目標內容進行多媒體內容的類型識別,包括:
4.根據權利要求1所述的富文本內容比對方法,其特征在于,所述基于識別結果進行轉換處理得到第一字符序列以及第二字符序列,包括:
5.根據權利要求1所述的富文本內容比對方法,其特征在于,所述基于所述最長公共子序列對所述第一目標內容以及所述第二目標內容進行標注,包括:
6.根據權利要求1所述的富文本內容比對方法,其特征在于,所述將所述第一目標內容以及所述第二目標內容基于標注結果進行展示,包括:
7.根據權利要求1所述的富文本內容比對方法,其特征在于,在將所述第一字符序列以及所述第二字符序列進行比對確定最長公共子序列之后,還包括:
8.根據權利要求3所述的富文本內容比對方法,其特征在于
9.一種富文本內容比對系統,其特征在于,該富文本內容比對系統包括:存儲器及處理器,所述存儲器中包括富文本內容比對方法的程序,所述富文本內容比對方法的程序被所述處理器執行時實現以下步驟:
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質中包括富文本內容比對方法程序,所述富文本內容比對方法程序被處理器執行時,實現如權利要求1至8中任一項所述的富文本內容比對方法的步驟。
...【技術特征摘要】
1.一種富文本內容比對方法,其特征在于,包括
2.根據權利要求1所述的富文本內容比對方法,其特征在于,所述將所述第一富文本以及所述第二富文本進行過濾處理得到第一目標內容以及第二目標內容,包括:
3.根據權利要求1所述的富文本內容比對方法,其特征在于,所述對所述第一目標內容以及所述第二目標內容進行多媒體內容的類型識別,包括:
4.根據權利要求1所述的富文本內容比對方法,其特征在于,所述基于識別結果進行轉換處理得到第一字符序列以及第二字符序列,包括:
5.根據權利要求1所述的富文本內容比對方法,其特征在于,所述基于所述最長公共子序列對所述第一目標內容以及所述第二目標內容進行標注,包括:
6.根據權利要求1所述的富文本內容比對方法,其特征在于,所述將所述第一目標內容以及所...
【專利技術屬性】
技術研發人員:張宇宜,張健,張宇萍,施蕓,王任華,
申請(專利權)人:傳播大腦科技浙江股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。