【技術實現步驟摘要】
本專利技術涉及深度神經網絡(DNN)的訓練方法,尤其涉及一種受限玻爾茲曼機的訓練方法。
技術介紹
深度學習在語音識別,圖像識別,自然語言處理等傳統人工智能
,以及計算技術與醫療,制造業和運輸業的新興交叉領域有著廣闊的應用。目前常用的深度學習框架中,深度信念網絡(DeepBeliefNetwork,DBN)作為一種生成模型,通過無監督預訓練調整模型參數,可以為深度神經網絡(DNN)的訓練提供較好的初始參數。因此深度信念網絡的訓練在深度學習問題中有著重要的意義。深度信念網絡是由一種叫受限玻爾茲曼機(RestrictedBoltzmannMachine,RBM)的模型構成的,研究深度信念網絡的訓練,可以從受限玻爾茲曼機的訓練著手。受限玻爾茲曼機是深度神經網絡的重要組成部分。目前廣泛應用的RBM訓練方法是對比散度(ContrastiveDivergence,CD)法,它是最大似然方法(MaximumLikelihood,ML)方法的一種近似方法。不論是對比散度法還是最大似然法都是基于梯度下降的訓練算法,這類算法的優化效率強烈依賴于問題的下水平集。在遇到問題本身下水平集病態的時候,如Rosenbrock優化問題,這類算法的收斂速度就非常緩慢。事實上,甚至當下水平集的條件數適中的時候,這類優化算法的效率就幾乎會隨著下水平集條件數的增加而線性下降。并且這類算法沒有對于問題規模的一個很好的度量,達到收斂所需要的迭代次數往往會隨著問題規模的變大而大量的增加。信息幾何理論為人們研究玻爾茲曼機訓練過程的幾何特性提供了完備統一的數學工具和分析方法。日本統計學家Amari等 ...
【技術保護點】
一種基于擬牛頓方法的受限玻爾茲曼機迭代映射訓練方法,包括:初始化受限玻爾茲曼機參數,生成子訓練樣本,通過子訓練過程更新受限玻爾茲曼機直到收斂;其特征在于:具體步驟如下:步驟一、初始化受限玻爾茲曼機參數ξ0;步驟二、在給定樣本x的情形下,利用當前受限玻爾茲曼機的條件分布pi(h|x;ξi)生成隱含節點的樣本h(i),將樣本x和h(i)連接生成樣本(x,h(i)),其中,i=0,1,2,…;步驟三、利用樣本(x,h(i))通過下述的子訓練階段得到子訓練中的受限玻爾茲曼機的參數α*;其中,子訓練階段內容如下:3?1)初始化子訓練階段受限玻爾茲曼機的參數α0;3?2)利用樣本(x,h(i))進行吉布斯采樣,求得3?3)利用Newton方法在當前參數αj的鄰域內將目標方程按二階泰勒公式展開:D(αj+t)≈qαj+1(t)≡D(αj+1)+▿D(αj+1)Tt+12tTHt---(1)]]>式(1)中,αj+1=αj+t,D(·)為目標函數,即為KL散度;為目標函數的梯度,H為Hessian矩陣;t是迭代變化量;對式(1 ...
【技術特征摘要】
1.一種基于擬牛頓方法的受限玻爾茲曼機迭代映射訓練方法,包括:初始化受限玻爾茲曼機參數,生成子訓練樣本,通過子訓練過程更新受限玻爾茲曼機直到收斂;其特征在于:具體步驟如下:步驟一、初始化受限玻爾茲曼機參數ξ0;步驟二、在給定樣本x的情形下,利用當前受限玻爾茲曼機的條件分布pi(h|x;ξi)生成隱含節點的樣本h(i),將樣本x和h(i)連接生成樣本(x,h(i)),其中,i=0,1,2,…;步驟三、利用樣本(x,h(i))通過下述的子訓練階段得到子訓練中的受限玻爾茲曼機的參數α*;其中,子訓練階段內容如下:3-1)初始化子訓練階段受限玻爾茲曼機的參數α0;3-2)利用樣本(x,h(i))進行吉布斯采樣,求得3-3)利用Newton方法在當前參數αj的鄰域內將目標方程按二階泰勒公式展開:D(αj+t)≈qαj+1(t...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。