System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及數字化信息管理,具體為一種金融貸款數字化信息管理系統架構。
技術介紹
1、數字化信息管理是將傳統的紙質或非數字形式的信息轉化為電子數據,并通過計算機和相關技術進行存儲、處理、傳輸和管理的過程。它涉及將各種類型的信息轉換為數字形式,以便更方便地進行存儲、檢索、共享和分析,然而在金融貸款領域內,金融貸款數據化信息管理是將金融機構在貸款業務中產生的各類數據進行數字化處理和管理的過程。它包括將貸款申請、客戶信息、財務數據、還款記錄等相關信息轉化為電子形式,并通過計算機系統進行存儲、處理、傳輸和管理。
2、對此,中國申請公開號cn116402477a的專利文件,公開了一種檔案數字化信息管理系統,檔案數字化信息管理系統是由檔案綜合管理系統、權限管理數據庫、登入驗證系統、檔案入庫管理系統、檔案數據庫組成。本專利技術中,在檔案入庫操作過程中,基于證書信息和印章信息生成對應數字證書、電子簽章,作為檢索相關條件,并基于內容項識別單元運作,達成標題、內容識別效果,對檔案文件進行數字化處理,并提取關鍵詞和短句,過濾無效詞匯并生成檔案詞匯表,基于數據標簽建立改寫單元運作生成檔案的狀態標簽以及特征標簽,并基于此在管理過程中建立狀態索引、特征索引、特征門類索引,以此達成對于檔案數據高自動化、準確性的歸類管理功能,確保審核、處理工作的高效執行。
3、在金融貸款中,信息的審核是十分重要的,由于信息可能存在不準確性和延時性,這可能導致銀行在審核貸款申請時出現問題,影響貸款審批的速度和結果,導致這樣問題發生的主要原因是信息審核效
4、針對上述問題,為此,提出一種金融貸款數字化信息管理系統架構。
技術實現思路
1、本專利技術的目的在于提供一種金融貸款數字化信息管理系統架構,解決了
技術介紹
中的數據處理效率低審批周期長的問題。
2、為實現上述目的,本專利技術提供如下技術方案:一種金融貸款數字化信息管理系統架構,包括用戶界面層、應用服務層、數據訪問層、第三方接口層和數據庫層;
3、用戶界面層,用戶通過頁面進行賬戶注冊和登錄操作,訪問和管理貸款信息,用戶填寫貸款申請;
4、應用服務層,處理用戶請求,進行業務邏輯處理;
5、數據訪問層,對用戶提供的貸款提供相關證明文件、雇主或其他相關機構核實信息的真實性;
6、數據訪問層包括數據驗證和內部審查,內部審查;
7、內部審查中實行文件審查,確定文件命名規則,同時確定文件存儲的主要位置,從文件中提取文本數據,利用分詞工具jieba將文本數據進行分詞處理,將連續的文本序列切分成有意義的單詞或短語,去除無意義的詞匯,并且分析得到該詞匯的詞頻,使用tf-idf方法計算每個詞匯的權重,使用倒排索引等方法將詞匯和對應的文件進行關聯,建立索引,當用戶輸入查詢詞匯時,檢索索引,找到所有包含該詞匯的文件,根據權重對文件進行排序,并返回搜索結果;
8、內部審查資料提取包括:
9、s1,資料提取,資料提取訪問本地數據庫,數據經過加密算法和密鑰,對選定的數據對象進行加密操作,加密后的數據存儲在數據庫中或獨立的數據文件中,客戶端訪問加密文件并使用解密工具,對加密文件進行解密操作;
10、s2,資料分為入庫資料和未入庫資料;
11、s3,對入庫資料進行讀檔;
12、s4,主動提取未入庫的資料;
13、s5,對主動提取的入庫資料進行系統審核,系統審核判定結果未審核通過、未審核或審核不通過;
14、s6,審核通過對資料文件進行提取,未審核或審核不通過判定未提取失敗;
15、第三方的數據,讀取第三方數據,對數據進行解析、轉換格式、存儲的處理;
16、第三方數據中對數據安全性進行檢測,包括數據驗證、數據整合和數據更新;
17、內部審查和第三方數據進行數據對比,實行數據評估。
18、優選的,文件中提取文本數據,使用程序語言中的文件讀取函數或庫來讀取待處理的文本文件,將文件內容加載到程序中,使用正則表達式對讀取到的文本數據進行清洗,去除一些特殊字符、標點符號、html標簽等非文本內容。
19、優選的,tf-idf方法計算詞匯權重;
20、計算詞頻,對于給定的文檔,統計每個詞在文檔中出現的頻率,對于給定的文檔集合,統計包含特定詞匯的文檔數量,并計算逆文檔頻率,將詞頻(tf)和逆文檔頻率(idf)相乘,得到詞匯的tf-idf值,對于每個文檔中的詞匯tf-idf向量,計算其l2范數(即向量的長度),將每個詞匯tf-idf向量中的每個分量都除以該向量的l2范數,從而得到單位向量。
21、優選的,內部審查中數據加密包括以下步驟:
22、a.對選定的數據對象進行序列化;
23、b.使用密鑰和加密算法對序列化數據對象進行加密操作;
24、c.將加密后的數據對象存儲在數據庫中。
25、優選的,數據庫分為本地數據庫和拓展數據庫,其中本地數據庫和擴展數據庫均由防火墻進行環境安全監測,數據訪問需經過解密訪問,并自行生成訪問記錄。
26、優選的,第三方提供的數據進行預處理,進行缺失值處理、異常值處理、數據標準化處理,第三方提供的全部特征作為輸入,利用l1正則化進行特征選擇,l1正則化的目標函數為:
27、lossfunction+α*||w||1,其中lossfunction為損失函數,w為特征系數向量,α為正則化參數,||w||1為w的l1范數,將數據集劃分為訓練集和驗證集,對于每個α值,利用訓練集進行模型訓練,然后在驗證集上計算模型性能指標,選擇使得性能最優的α值,確定正則化參數α后,使用全部的數據訓練模型,并得到特征系數向量w,使用測試集對訓練好的模型進行測試,計算模型的性能指標,繪制roc曲線評估模型性能的指標,利用訓練好的模型對新的第三方數據進行判斷。
28、優選的,第三方數據的數據集劃分為訓練集和測試集,訓練集用于構建可信度判斷模型,按照70%-80%的比例劃分訓練集,30%-20%劃分為測試集。
29、優選的,根據邏輯回歸模型的定義,將輸入特征通過sigmoid函數映射到0-1之間的概率值,對于二分類問題,假設標簽為0或1,預測值為y_pred,真實值為y_true;
30、交叉熵損失函數可以表示為:
31、loss=-[y_true*log(y_pred)+(1-y_true)*log(1-y_pred)];
32、log表示自然對數;
33、將損失函數應用于訓練集的每個樣本,并計算其平均值。
34、優選的,隨機初始化模型參數,權重w和偏置b,迭代地對每個樣本進行訓練,計算損失函數關于模型參數的偏導數,對于交叉熵損失函數,偏導數可以表示為:
35、dw=(y_pred-y_true)*x;
...【技術保護點】
1.一種金融貸款數字化信息管理系統架構,包括用戶界面層、應用服務層、數據訪問層、第三方接口層和數據庫層,其特征在于:
2.根據權利要求1所述的一種金融貸款數字化信息管理系統架構,其特征在于:文件中提取文本數據,使用程序語言中的文件讀取函數或庫來讀取待處理的文本文件,將文件內容加載到程序中,使用正則表達式對讀取到的文本數據進行清洗,去除一些特殊字符、標點符號、HTML標簽等非文本內容。
3.根據權利要求1所述的一種金融貸款數字化信息管理系統架構,其特征在于:TF-IDF方法計算詞匯權重;
4.根據權利要求1所述的一種金融貸款數字化信息管理系統架構,其特征在于:內部審查中數據加密包括以下步驟:
5.根據權利要求4所述的一種金融貸款數字化信息管理系統架構,其特征在于:數據庫分為本地數據庫和拓展數據庫,其中本地數據庫和擴展數據庫均由防火墻進行環境安全監測,數據訪問需經過解密訪問,并自行生成訪問記錄。
6.根據權利要求1所述的一種金融貸款數字化信息管理系統架構,其特征在于:第三方提供的數據進行預處理,進行缺失值處理、異常值處理、數
7.根據權利要求6所述的一種金融貸款數字化信息管理系統架構,其特征在于:第三方數據的數據集劃分為訓練集和測試集,訓練集用于構建可信度判斷模型,按照70%-80%的比例劃分訓練集,30%-20%劃分為測試集。
8.根據權利要求7所述的一種金融貸款數字化信息管理系統架構,其特征在于:根據邏輯回歸模型的定義,將輸入特征通過sigmoid函數映射到0-1之間的概率值,對于二分類問題,假設標簽為0或1,預測值為y_pred,真實值為y_true;
9.根據權利要求8所述的一種金融貸款數字化信息管理系統架構,其特征在于:隨機初始化模型參數,權重w和偏置b,迭代地對每個樣本進行訓練,計算損失函數關于模型參數的偏導數,對于交叉熵損失函數,偏導數可以表示為:
10.根據權利要求1所述的一種金融貸款數字化信息管理系統架構,其特征在于:第三方數據和內部審核數據進行對比,將待評估的數據與基準數據進行對比,預測為正例的樣本數;
...【技術特征摘要】
1.一種金融貸款數字化信息管理系統架構,包括用戶界面層、應用服務層、數據訪問層、第三方接口層和數據庫層,其特征在于:
2.根據權利要求1所述的一種金融貸款數字化信息管理系統架構,其特征在于:文件中提取文本數據,使用程序語言中的文件讀取函數或庫來讀取待處理的文本文件,將文件內容加載到程序中,使用正則表達式對讀取到的文本數據進行清洗,去除一些特殊字符、標點符號、html標簽等非文本內容。
3.根據權利要求1所述的一種金融貸款數字化信息管理系統架構,其特征在于:tf-idf方法計算詞匯權重;
4.根據權利要求1所述的一種金融貸款數字化信息管理系統架構,其特征在于:內部審查中數據加密包括以下步驟:
5.根據權利要求4所述的一種金融貸款數字化信息管理系統架構,其特征在于:數據庫分為本地數據庫和拓展數據庫,其中本地數據庫和擴展數據庫均由防火墻進行環境安全監測,數據訪問需經過解密訪問,并自行生成訪問記錄。
6.根據權利要求1所述的一種金融貸款數字化信息管理系統架構,其特征在于:第三方提供的數據進行預處理,進行缺失值處...
【專利技術屬性】
技術研發人員:徐建建,廖輝,
申請(專利權)人:深圳前海時光數字科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。