System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及工業(yè)計算領域,特別涉及一種稀疏對角矩陣求解方法、裝置、設備及介質。
技術介紹
1、目前,流體力學領域中,針對不可壓縮流體力學數值仿真求解是工程計算的難點,其中,超大規(guī)模稀疏對角矩陣的求解是科學工程的核心技術。超大規(guī)模稀疏對角矩陣問題的特點是:超大規(guī)模,其導致問題的求解變得異常困難。困難來源于兩個方面:占用的內存是超大規(guī)模的;由于問題規(guī)模大,導致計算效率低且消耗的計算資源巨大。現有技術中使常用sor(successive?over?relaxation,逐次超松弛迭代法)迭代法在cpu(centralprocessing?unit,中央處理器)并行mpi(massage?passing?interface,消息傳遞接口)計算平臺中對超大規(guī)模稀疏對角矩陣進行計算,但是上述的sor迭代法無法應用在gpu(graphics?processing?unit,圖形處理器)顯卡加速器。
2、綜上,如何實現在gpu平臺上對超大規(guī)模稀疏對角矩陣的并發(fā)加速計算,提高運行效率是本領域有待解決的技術問題。
技術實現思路
1、有鑒于此,本專利技術的目的在于提供一種稀疏對角矩陣求解方法、裝置、設備及介質,能夠實現在gpu平臺上對超大規(guī)模稀疏對角矩陣的并發(fā)加速計算,提高運行效率。其具體方案如下:
2、第一方面,本申請公開了一種稀疏對角矩陣求解方法,應用于預設異構超算平臺,包括:
3、獲取針對工程問題生成的稀疏對角矩陣,并基于所述稀疏對角矩陣生成相應的稀疏對角矩陣
4、對所述稀疏對角矩陣問題進行初次分塊,以得到若干目標稀疏對角矩陣問題;
5、并發(fā)啟動用于計算每一所述目標稀疏對角矩陣問題中的若干子目標稀疏對角矩陣問題的目標線程,計算各所述子目標稀疏對角矩陣問題的非零元素,以得到所述工程問題的最優(yōu)解。
6、可選的,所述獲取針對工程問題生成的稀疏對角矩陣,包括:
7、基于預設流體求解器模擬工程問題,以生成相應的稀疏對角矩陣;
8、通過所述預設異構超算平臺的預設矩陣輸入通道獲取針對所述工程問題的所述稀疏對角矩陣。
9、可選的,所述基于所述稀疏對角矩陣生成相應的稀疏對角矩陣問題,包括:
10、基于所述稀疏對角矩陣、目標矩陣解向量參數、所述稀疏對角矩陣的非齊次向量構建相應的稀疏對角矩陣問題。
11、可選的,所述對所述稀疏對角矩陣問題進行初次分塊,以得到若干目標稀疏對角矩陣問題,包括:
12、基于所述預設異構超算平臺的中央處理器并行計算環(huán)境對所述稀疏對角矩陣問題進行初次分塊,以得到若干目標稀疏對角矩陣問題。
13、可選的,所述并發(fā)啟動用于計算每一所述目標稀疏對角矩陣問題中的若干子目標稀疏對角矩陣問題的目標線程,包括:
14、基于所述預設異構超算平臺的圖形處理器并發(fā)啟動用于計算每一所述目標稀疏對角矩陣問題中的若干子目標稀疏對角矩陣問題的目標線程。
15、可選的,所述并發(fā)啟動用于計算每一所述目標稀疏對角矩陣問題中的若干子目標稀疏對角矩陣問題的目標線程,計算各所述子目標稀疏對角矩陣問題的非零元素,以得到所述工程問題的最優(yōu)解,包括:
16、并發(fā)啟動用于利用jacobi算法計算各所述子目標稀疏對角矩陣問題的目標線程,并逐一計算各所述子目標稀疏對角矩陣問題的非零元素,以獲取所述子目標稀疏對角矩陣問題在x方向、y方向、z方向各自對應的數值點;
17、合并所述x方向、所述y方向、所述z方向各自對應的數值點,以得到所述工程問題的最優(yōu)解。
18、可選的,所述逐一計算各所述子目標稀疏對角矩陣問題的非零元素,以獲取所述子目標稀疏對角矩陣問題在x方向、y方向、z方向各自對應的數值點,包括:
19、將所述子目標稀疏對角矩陣問題拆分為x方向、y方向、z方向的一維二階偏微分方程;
20、逐一計算各方向的所述一維二階偏微分方程中非零元素,以獲取在所述x方向、所述y方向、所述z方向各自對應的數值點。
21、第二方面,本申請公開了一種稀疏對角矩陣求解裝置,應用于預設異構超算平臺,包括:
22、問題生成模塊,用于獲取針對工程問題生成的稀疏對角矩陣,并基于所述稀疏對角矩陣生成相應的稀疏對角矩陣問題;
23、問題分塊模塊,用于對所述稀疏對角矩陣問題進行初次分塊,以得到若干目標稀疏對角矩陣問題;
24、矩陣求解模塊,用于并發(fā)啟動用于計算每一所述目標稀疏對角矩陣問題中的若干子目標稀疏對角矩陣問題的目標線程,計算各所述子目標稀疏對角矩陣問題的非零元素,以得到所述工程問題的最優(yōu)解。
25、第三方面,本申請公開了一種電子設備,包括:
26、存儲器,用于保存計算機程序;
27、處理器,用于執(zhí)行所述計算機程序,以實現前述公開的稀疏對角矩陣求解方法的步驟。
28、第四方面,本申請公開了一種計算機可讀存儲介質,用于存儲計算機程序;其中,所述計算機程序被處理器執(zhí)行時實現前述公開的稀疏對角矩陣求解方法的步驟。
29、由此可見,本申請公開了一種稀疏對角矩陣求解方法,應用于預設異構超算平臺,包括:獲取針對工程問題生成的稀疏對角矩陣,并基于所述稀疏對角矩陣生成相應的稀疏對角矩陣問題;對所述稀疏對角矩陣問題進行初次分塊,以得到若干目標稀疏對角矩陣問題;并發(fā)啟動用于計算每一所述目標稀疏對角矩陣問題中的若干子目標稀疏對角矩陣問題的目標線程,計算各所述子目標稀疏對角矩陣問題的非零元素,以得到所述工程問題的最優(yōu)解。可見,通過獲取針對工程問題生成的稀疏對角矩陣,然后基于稀疏對角矩陣生成相應的稀疏對角矩陣問題,然后對稀疏對角矩陣問題進行初次分塊處理,得到的若干目標稀疏對角矩陣問題,最后并發(fā)啟動用于計算各個目標稀疏對角矩陣問題中的若干子目標稀疏對角矩陣問題的目標線程,只計算各個子目標稀疏對角矩陣的非零元素,而無需裝入整個子目標稀疏對角矩陣問題,可知,對超大規(guī)模矩陣進行mpi分塊,將超大規(guī)模矩陣分解成上百個小矩陣,使得矩陣規(guī)模比原來小上百倍,且使用并發(fā)計算可以在每個mpi并行分塊同時進行矩陣計算,即同時計算上百個小矩陣,大大提高矩陣求解效率;其次,僅對單個矩陣的非零元素進行并發(fā)線程計算,無需一次性裝入整個矩陣,節(jié)約大量計算內存,提高了整體計算效率。
本文檔來自技高網...【技術保護點】
1.一種稀疏對角矩陣求解方法,其特征在于,應用于預設異構超算平臺,包括:
2.根據權利要求1所述的稀疏對角矩陣求解方法,其特征在于,所述獲取針對工程問題生成的稀疏對角矩陣,包括:
3.根據權利要求1所述的稀疏對角矩陣求解方法,其特征在于,所述基于所述稀疏對角矩陣生成相應的稀疏對角矩陣問題,包括:
4.根據權利要求1所述的稀疏對角矩陣求解方法,其特征在于,所述對所述稀疏對角矩陣問題進行初次分塊,以得到若干目標稀疏對角矩陣問題,包括:
5.根據權利要求1所述的稀疏對角矩陣求解方法,其特征在于,所述并發(fā)啟動用于計算每一所述目標稀疏對角矩陣問題中的若干子目標稀疏對角矩陣問題的目標線程,包括:
6.根據權利要求1所述的稀疏對角矩陣求解方法,其特征在于,所述并發(fā)啟動用于計算每一所述目標稀疏對角矩陣問題中的若干子目標稀疏對角矩陣問題的目標線程,計算各所述子目標稀疏對角矩陣問題的非零元素,以得到所述工程問題的最優(yōu)解,包括:
7.根據權利要求6所述的稀疏對角矩陣求解方法,其特征在于,所述逐一計算各所述子目標稀疏對角矩陣問題的非
8.一種稀疏對角矩陣求解裝置,其特征在于,應用于預設異構超算平臺,包括:
9.一種電子設備,其特征在于,包括:
10.一種計算機可讀存儲介質,其特征在于,用于存儲計算機程序;其中,所述計算機程序被處理器執(zhí)行時實現如權利要求1至7任一項所述的稀疏對角矩陣求解方法的步驟。
...【技術特征摘要】
1.一種稀疏對角矩陣求解方法,其特征在于,應用于預設異構超算平臺,包括:
2.根據權利要求1所述的稀疏對角矩陣求解方法,其特征在于,所述獲取針對工程問題生成的稀疏對角矩陣,包括:
3.根據權利要求1所述的稀疏對角矩陣求解方法,其特征在于,所述基于所述稀疏對角矩陣生成相應的稀疏對角矩陣問題,包括:
4.根據權利要求1所述的稀疏對角矩陣求解方法,其特征在于,所述對所述稀疏對角矩陣問題進行初次分塊,以得到若干目標稀疏對角矩陣問題,包括:
5.根據權利要求1所述的稀疏對角矩陣求解方法,其特征在于,所述并發(fā)啟動用于計算每一所述目標稀疏對角矩陣問題中的若干子目標稀疏對角矩陣問題的目標線程,包括:
6.根據權利要求1所述的稀疏對角矩陣求解方...
【專利技術屬性】
技術研發(fā)人員:李青,潘翀,李澤鋮,
申請(專利權)人:天目山實驗室,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。