System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及貿易服務,具體是跨境貿易服務平臺的實現方法、系統、裝置及存儲介質。
技術介紹
1、隨著全球經濟一體化的加速推進,跨國貿易活動日益頻繁,隨之而來的大量跨境商務文檔處理工作變得越來越重要。這些文檔涵蓋了發票、報關單、合同、提貨單等多種類型,不僅數量龐大而且格式多樣,其中還涉及多種語言。傳統的手工處理方式不僅效率低下,而且容易出現錯誤,尤其是在面對多語言和復雜格式的情況下,這些問題尤為突出。
2、目前針對上述問題采用的人工智能技術面臨以下問題:
3、1、處理效率低:當前的文檔處理系統往往只能處理特定格式的文檔,對于多樣化和復雜格式的文檔處理能力有限;
4、2、多語言支持不足:大多數系統只支持少數幾種主流語言,對于小語種的支持不足,限制了其在全球范圍內的應用;
5、3、自動化程度不高:盡管有些系統已經實現了部分自動化,但仍然需要人工干預來進行文檔分類、數據校驗等工作。
6、因此,亟需一種跨境貿易服務平臺的實現方法、系統、裝置及存儲介質來解決上述問題。
技術實現思路
1、本專利技術的目的在于提供跨境貿易服務平臺的實現方法、系統、裝置及存儲介質,它不僅可以大幅提高文檔處理的效率和準確性,還能顯著降低企業的運營成本。
2、本專利技術為實現上述目的,通過以下技術方案實現:
3、一方面,提供跨境貿易服務平臺的實現方法,包括以下步驟:
4、s1:采集圖像樣本;
5、s2:建立ocr
6、s3:根據電子表單,生成rpa流程。
7、優選的,所述步驟s1中的采集圖像樣本,具體為:
8、采集跨境交易過程中的多語言文檔,所述多語言文檔包括手寫文檔以及電腦生成文檔,將手寫文檔以及電腦生成文檔保存為圖片格式。
9、優選的,所述步驟s2,具體為:
10、s21:選擇pytorch深度學習框架,建立基于卷積神經網絡和循環神經網絡的ocr模型,使用采集到的多語言文檔對ocr模型進行預訓練;
11、s22:建立針對表格、列表的識別算法模型;
12、s23:建立多語言模型、語言檢測模型;
13、s24:建立針對手寫體和模糊文檔的識別模型;
14、s25:根據建立的模型,輸出電子表單。
15、優選的,所述建立針對表格、列表的識別算法模型,具體為:建立tsrformer算法模型,通過直接回歸的方式來預測分割線,采用每條分割線上的若干采樣點來表示分割線,并讓模型直接回歸每條分割線上采樣點的坐標;
16、所述建立多語言模型,具體為:
17、利用多語言文本數據進行預訓練,使模型學習到豐富的語言特征;在多語言任務上進行微調,使模型更適應特定的應用場景;采用transformer模型,通過自注意力機制捕捉不同語言之間的關聯性;
18、所述建立語言檢測模型,具體為:從文本中提取如詞匯頻率、語法結構特征,用于訓練語言檢測模型;選擇支持向量機來構建語言檢測模型;使用標注好的多語言數據集對模型進行訓練,并通過交叉驗證法評估模型的性能。
19、優選的,所述建立針對手寫體和模糊文檔的識別模型,包括以下步驟:
20、使用mnist采集手寫體樣本和模糊文檔樣本數據,并對數據進行標注;
21、使用旋轉、縮放、平移、添加噪聲的方法對數據進行增強,用于提高模型的泛化能力;
22、對于模糊文檔,使用去噪算法來改善圖像質量;
23、將灰度圖像轉換為二值圖像,用于減少計算復雜度;
24、將圖像尺寸統一,并進行像素值歸一化;
25、利用cnn自動提取高層次特征;
26、將訓練好的模型轉換為onnx格式。
27、優選的,所述生成rpa流程具體為:
28、分析現有業務流程并篩選其中重復性、規律性的工作流程做標記;
29、使用uipath對pra流程進行編輯;
30、對生成的pra流程進行優化測試。
31、另一方面,提供跨境貿易服務平臺的實現系統,包括:
32、數據采集模塊,用于:采集圖像樣本;
33、模型建立模塊,用于:建立ocr模型,將采集到的圖像樣本中的文字資料轉換成電子文本,并生成電子表單;
34、數據輸出模塊,用于:根據電子表單,生成rpa流程。
35、另一方面,提供跨境貿易服務平臺的實現的裝置,包括處理器和用于存儲計算機程序的存儲器,所述處理器執行所述計算機程序時,實現上述任一項所述的方法的步驟。
36、另一方面,提供一種計算機可讀存儲介質,所述計算機可讀存儲介質上存儲有計算機程序,所述計算機程序被一個或多個處理器執行時,實現上述任一項所述的方法的步驟。
37、對比現有技術,本專利技術的有益效果在于:
38、1、將ocr、rpa技術應用到跨境貿易信息
,通過技術的新場景應用解決了跨境貿易中表單處理工作繁瑣、效率低、易出錯,不同國家地區表單格式差異大及人工處理影響貿易流程進度等問題;
39、2、引入ocr和rpa技術:ocr快速準確識別表單文字信息,克服不同語言和手寫體識別難題;rpa模擬人工操作,自動分類、整理和錄入數據,實現表單處理自動化;
40、3、提高效率,加快貿易流程進度。提高精度,降低人為錯誤發生率。操作簡便,降低操作難度。節省人力,降低企業成本。
本文檔來自技高網...【技術保護點】
1.跨境貿易服務平臺的實現方法,其特征在于,包括以下步驟:
2.根據權利要求1所述跨境貿易服務平臺的實現方法,其特征在于,所述步驟S1中的采集圖像樣本,具體為:
3.根據權利要求1所述跨境貿易服務平臺的實現方法,其特征在于,所述步驟S2,具體為:
4.根據權利要求3所述跨境貿易服務平臺的實現方法,其特征在于,
5.根據權利要求3所述跨境貿易服務平臺的實現方法,其特征在于,所述建立針對手寫體和模糊文檔的識別模型,包括以下步驟:
6.根據權利要求2所述跨境貿易服務平臺的實現方法,其特征在于,所述生成RPA流程具體為:
7.跨境貿易服務平臺的實現系統,其特征在于,包括:
8.跨境貿易服務平臺的實現的裝置,其特征在于,包括處理器和用于存儲計算機程序的存儲器,所述處理器執行所述計算機程序時,實現如權利要求1-6任一項所述的方法的步驟。
9.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲有計算機程序,所述計算機程序被一個或多個處理器執行時,實現如權利要求1-6任一項所述的方法的步
...【技術特征摘要】
1.跨境貿易服務平臺的實現方法,其特征在于,包括以下步驟:
2.根據權利要求1所述跨境貿易服務平臺的實現方法,其特征在于,所述步驟s1中的采集圖像樣本,具體為:
3.根據權利要求1所述跨境貿易服務平臺的實現方法,其特征在于,所述步驟s2,具體為:
4.根據權利要求3所述跨境貿易服務平臺的實現方法,其特征在于,
5.根據權利要求3所述跨境貿易服務平臺的實現方法,其特征在于,所述建立針對手寫體和模糊文檔的識別模型,包括以下步驟:
6.根據權...
【專利技術屬性】
技術研發人員:柳杰,孫云鵬,馬文章,付強,
申請(專利權)人:數智云潮山東數字科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。