System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及計算機,尤其涉及一種文件類型轉換方法、裝置、設備和存儲介質。
技術介紹
1、目前,在將圖片文件轉換為pdf文件或者word文件時,用戶需要先在用戶終端中安裝文件類型轉換客戶端,再通過文件類型轉換客戶端將用戶選擇的圖片文件通過網絡上傳到服務器。在服務器中一般設置有文件類型轉換算法,該文件類型轉換算法利用服務器資源并行處理來自大量客戶端的文件,將每個文件轉換為用戶所需的類型,再通過網絡將轉換出的各個文件分別返回給對應的客戶端,以便在客戶端中展示轉檔后的文件。
2、由于現有的文件類型轉換過程必須借助服務器,需要在服務器進行集中轉檔操作,這導致現有的文件類型轉換時間較長。造成這一問題的原因在于:文件的大小以及網絡環境的優劣都會影響文件的上傳和回傳時間,而且,在需要處理的文件較多或者文件的復雜度較高時,服務器的算力不足而且資源有限,影響單個文件的轉檔時間,甚至會出現轉檔失敗的問題。
技術實現思路
1、本申請提供了一種文件類型轉換方法、裝置、設備和存儲介質,以解決現有的文件類型轉換過程必須借助服務器,導致現有的文件類型轉換時間較長的問題。
2、針對上述技術問題,本申請技術方案是通過如下實施例來解決的:
3、本申請實施例提供了一種文件類型轉換方法,在用戶終端執行,包括:確定待轉換圖像及目標文件類型;識別所述待轉換圖像中的信息塊并且確定所述信息塊的屬性信息;在所述待轉換圖像中,提取所述信息塊的特征信息;創建所述目標文件類型的文件并且根據所述信息塊的屬性
4、其中,所述確定待轉換圖像及目標文件類型,包括:基于被選中的候選圖像,針對所述候選圖像執行預處理操作,將預處理操作之后的所述候選圖像確定為待轉換圖像;和/或;接收所述其他用戶終端發送的文件類型并且將接收到的所述文件類型確定為所述目標文件類型。
5、其中,所述針對所述候選圖像執行預處理操作,包括:在所述候選圖像存在噪聲的情況下,對所述候選圖像進行降噪處理;和/或,在所述候選圖像的數據量大于預設的數據量閾值的情況下,對所述候選圖像進行圖像壓縮處理;和/或,在所述候選圖像的圖像長寬比與所述用戶終端的屏幕長寬比不同的情況下,調整所述候選圖像的尺寸,使所述候選圖像的長寬比與所述用戶終端的屏幕長寬比相同。
6、其中,所述識別所述待轉換圖像中的信息塊并且確定所述信息塊的屬性信息,包括:調用在操作系統中運行的圖像分析工具,通過所述圖像分析工具識別所述待轉換圖像中置信度大于預設置信度閾值的信息塊,并且,確定所述置信度大于預設置信度閾值的信息塊的屬性信息。
7、其中,所述屬性信息包括:所述信息塊中的文本內容以及所述信息塊在所述待轉換圖像中的坐標信息;所述特征信息包括:所述信息塊中的文本內容的字體大小、字體顏色和/或背景顏色;所述在所述待轉換圖像中,提取所述信息塊的特征信息,包括:根據所述信息塊的坐標信息,確定所述信息塊的尺寸;并且,根據所述信息塊的尺寸,確定所述文本內容的字體大??;和/或,根據所述信息塊的坐標信息,在所述待轉換圖像中,裁剪出所述信息塊對應的信息塊圖像;并且,在所述信息塊圖像中,提取所述文本內容的字體顏色和/或背景顏色。
8、其中,所述根據所述信息塊的尺寸,確定所述文本內容的字體大小,包括:確定與所述信息塊的高度對應的初始字體大??;基于所述初始字體大小,繪制所述信息塊中的文本內容并且生成用于容納所述文本內容的文本框;其中,所述文本框的尺寸大小和所述文本內容的字體大小聯動;將所述文本框的尺寸調整到與所述信息塊的尺寸一致,確定尺寸調整后的所述文本框中的文本內容的字體大小,并且,將所述文本框中的文本內容的字體大小作為所述信息塊中的文本內容的字體大小。
9、其中,所述在所述信息塊圖像中,提取所述文本內容的字體顏色和/或背景顏色,包括:利用預設的像素聚類算法,將所述信息塊圖像中的像素聚類為兩個顏色簇;將包含像素少的顏色簇對應的顏色作為所述文本內容對應的字體顏色,并且,將包含像素多的顏色簇對應的顏色作為所述文本內容對應的背景顏色。
10、其中,在所述根據所述信息塊的屬性信息和特征信息,將所述信息塊繪制到所述文件中之前,還包括:將所述信息塊的屬性信息以及所述信息塊的特征信息作為一個block對象,存儲在預先創建的block數組中;所述根據所述信息塊的屬性信息和特征信息,將所述信息塊繪制到所述文件中,包括:從所述block數組中,獲取所述block對象;根據所述block對象中的所述信息塊的屬性信息和特征信息,將所述信息塊繪制到所述文件中。
11、其中,所述屬性信息包括:所述信息塊中的文本內容以及所述信息塊在所述待轉換圖像中的坐標信息;所述特征信息包括:所述信息塊中的文本內容對應的字體大??;所述根據所述信息塊的屬性信息和特征信息,將所述信息塊繪制到所述文件中,包括:根據所述信息塊的坐標信息并且基于所述文本內容對應的字體大小,將所述文本內容繪制到所述文件的頁面上。
12、其中,所述特征信息還包括:所述信息塊中的文本內容對應的字體顏色;所述根據所述信息塊的坐標信息并且基于所述文本內容對應的字體大小,將所述文本內容繪制到所述文件的空白頁頁面上,包括:將所述待轉換圖像鋪設在所述文件的頁面上,形成背景圖像;根據所述信息塊的坐標信息并且基于所述文本內容對應的字體大小和字體顏色,將所述文本內容繪制到所述背景圖像上。
13、其中,所述特征信息還包括:所述信息塊中的文本內容對應的字體顏色和背景顏色;所述根據所述信息塊的坐標信息并且基于所述文本內容對應的字體大小和字體顏色,將所述文本內容繪制到所述背景圖像上,包括:根據所述信息塊的坐標信息,確定所述信息塊的尺寸;生成與所述信息塊的尺寸一致并且與所述文本內容對應的背景顏色一致的背景圖像塊;根據所述信息塊的坐標信息,將所述背景圖像塊繪制到所述背景圖像之上;基于所述文本內容對應的字體大小和字體顏色,將所述文本內容繪制到所述背景圖像塊上。
14、其中,所述屬性信息還包括:所述信息塊的置信度;在所述信息塊的數量為多個的情況下,在所述待轉換圖像中,提取所述信息塊的特征信息之前,還包括:針對每個所述信息塊,根據所述信息塊的坐標信息以及與所述信息塊位置相鄰的信息塊的坐標信息,確定相鄰兩個所述信息塊之間的中心點距離;在所述中心點距離小于預設的距離閾值的情況下,比較兩個所述信息塊分別對應的置信度,舍棄置信度小的信息塊,保留置信度大的信息塊。
15、本申請實施例還提供了一種文件類型轉換裝置,設置在用戶終端,包括:確定模塊,用于確定待轉換圖像及目標文件類型;識別和確定模塊,用于識別所述待轉換圖像中的信息塊并且確定所述信息塊的屬性信息;提取模塊,用于在所述待轉換圖像中,提取所述信息塊的特征信息;創建和繪制模塊,用于創建所述目標文件類型的文件并且根據所述信息塊的屬性信息和特征信息,將所述信息塊繪制到所述文件中。
16、本申請實施例還本文檔來自技高網...
【技術保護點】
1.一種文件類型轉換方法,其特征在于,在用戶終端執行,包括:
2.根據權利要求1所述的方法,其特征在于,所述確定待轉換圖像及目標文件類型,包括:
3.根據權利要求2所述的方法,其特征在于,所述針對所述候選圖像執行預處理操作,包括:
4.根據權利要求1所述的方法,其特征在于,
5.根據權利要求1所述的方法,其特征在于,
6.根據權利要求5所述的方法,其特征在于,
7.根據權利要求5所述的方法,其特征在于,
8.根據權利要求1所述的方法,其特征在于,
9.根據權利要求1所述的方法,其特征在于,
10.根據權利要求9所述的方法,其特征在于,
11.根據權利要求10所述的方法,其特征在于,
12.根據權利要求1-11中任一項所述的方法,其特征在于,
13.一種文件類型轉換裝置,其特征在于,設置在用戶終端,包括:
14.一種文件類型轉換設備,其特征在于,包括:至少一個通信接口;與所述至少一個通信接口相連接的至少一個總線;與所述至少一個總
15.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質存儲有計算機可執行指令,所述計算機可執行指令被執行,以實現權利要求1-12中任一項所述的文件類型轉換方法。
...【技術特征摘要】
1.一種文件類型轉換方法,其特征在于,在用戶終端執行,包括:
2.根據權利要求1所述的方法,其特征在于,所述確定待轉換圖像及目標文件類型,包括:
3.根據權利要求2所述的方法,其特征在于,所述針對所述候選圖像執行預處理操作,包括:
4.根據權利要求1所述的方法,其特征在于,
5.根據權利要求1所述的方法,其特征在于,
6.根據權利要求5所述的方法,其特征在于,
7.根據權利要求5所述的方法,其特征在于,
8.根據權利要求1所述的方法,其特征在于,
9.根據權利要求1所述的方法,其特征在于,
10.根據權利要求9所述的方法,其特征在于,
11.根據權利要求10...
【專利技術屬性】
技術研發人員:徐兵,
申請(專利權)人:珠海金山辦公軟件有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。