System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 久久精品无码专区免费东京热,蜜桃臀AV高潮无码,无码GOGO大胆啪啪艺术
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    針對矩陣向量乘法使用存儲器單元預補償的存儲器裝置制造方法及圖紙

    技術編號:43963040 閱讀:4 留言:0更新日期:2025-01-07 21:48
    描述與針對矩陣向量乘法使用存儲器單元預補償的存儲器裝置相關的系統、方法及設備。在一種方法中,存儲器單元陣列具有存儲器單元,所述存儲器單元用來基于對來自所述存儲器單元的輸出電流求和而執行矩陣向量乘法。存儲器單元的上下文由控制器(例如,具有所述陣列的存儲器芯片內部或外部的存儲器控制器)來確定。所述上下文可包含例如存儲器單元的物理位置、被編程的權重模式及/或相鄰單元干擾等。基于所述經確定上下文,所述控制器動態地確定用于在執行所述矩陣向量乘法之前對所述存儲器單元進行編程以存儲權重的調整(例如,經調整目標閾值電壓或電流)。

    【技術實現步驟摘要】

    本文中所公開的至少一些實施例大體上涉及存儲器裝置且更特定來說但不限于,在使用存儲器單元執行乘法及其它運算之前調整存儲器單元的編程的存儲器裝置。


    技術介紹

    1、有限的存儲器帶寬是機器學習系統中的一個重大問題。例如,當前系統中使用的dram裝置存儲深度神經網絡(dnn)中使用的大量權重及激活。

    2、在一個實例中,深度學習機器(例如支持針對卷積神經網絡(cnn)的處理的那些機器)執行處理以確定每秒的大量計算。例如,輸入/輸出數據、深度學習網絡訓練參數及中間結果不斷地從一或多個存儲器裝置(例如,dram)提取及存儲在所述一或多個存儲器裝置中。當涉及大存儲密度(例如,大于100mb的存儲密度)時,通常歸因于其成本優勢而使用dram類型的存儲器。在深度學習硬件系統的一個實例中,計算單元(例如,單片系統(soc)、fpga、cpu或gpu)附接到(若干)存儲器裝置(例如,dram裝置)。

    3、現存計算機架構使用專用于串行處理的處理器芯片及針對高密度存儲器優化的dram。這兩個裝置之間的接口是一個主要瓶頸,其引入延時及帶寬限制且增加相當大的功耗開銷。片上存儲器是面積昂貴的且不可能將大量存儲器添加到當前用來訓練及部署dnn的cpu及gpu處理器。

    4、使用神經網絡中的存儲器以隨著輸入傳播通過網絡而存儲輸入數據、權重參數及激活。在訓練中,必須保留來自正向通路的激活,直到它們可被用來計算反向通路中的錯誤梯度。作為實例,網絡可具有2600萬個權重參數且計算正向通路中的1600萬次激活。如果使用32位浮點值來存儲每一權重及激活,那么這對應于168mb的總存儲要求。

    5、gpu及其它機器需要顯著存儲器用于神經網絡的權重及激活。gpu無法高效地直接執行深度神經網絡中使用的小卷積,因此它們需要顯著激活或權重存儲。最后,還需要存儲器來存儲輸入數據、臨時值及程序指令。例如,高性能gpu可能需要超過7gb的本地dram。

    6、在gpu處理器上無法保持大量存儲數據。在許多情況下,高性能gpu處理器可能具有僅1kb的存儲器與可足夠快地讀取以使浮點數據路徑飽和的處理器核心中的每一者相關聯。因此,在dnn的每一層處,gpu需要將狀態保存到外部dram,加載網絡的下一層,且接著重載數據。因此,片外存儲器接口遭受不斷地重載權重以及保存及檢索激活的負擔。這顯著地縮減訓練時間且增加功耗。

    7、在一個實例中,使用圖像及其它傳感器且其產生大量數據。在一些應用中,將某些類型的數據從所述傳感器傳輸到通用微處理器(例如,中央處理單元(cpu))以供處理是低效的。例如,將圖像數據從圖像傳感器傳輸到微處理器以供圖像分段、對象辨識、特征提取等是低效的。

    8、一些圖像處理可包含涉及用于累加的元素的列或矩陣的乘法的密集型計算。已開發出用于加速乘法及累加運算的一些專用電路。例如,乘法器-累加器(mac單元)可使用一組并行計算邏輯電路來實施以實現比通用微處理器更高的計算性能。


    技術實現思路

    1、本申請的一方面涉及一種裝置,其包括:主機接口,其經配置以與主機通信;及邏輯電路系統,其經配置以:基于第一存儲器單元的上下文確定至少一個偏移電壓;及對所述第一存儲器單元進行編程以存儲來自所述主機的第一權重,其中使用所述至少一個偏移電壓調整所述第一存儲器單元的閾值電壓。

    2、本申請的另一方面涉及一種系統,其包括:至少一個傳感器;及至少一個控制器,其經配置以:對第一存儲器單元進行編程以存儲第一權重,其中使用經調整目標電流執行所述編程;及基于累加來自所述第一存儲器單元的輸出電流而確定至少一個結果,其中所述第一權重乘以對應于由所述傳感器收集的數據的輸入。

    3、本申請的又一方面涉及一種方法,其包括:在第一集成電路裸片上的半導體襯底上方形成存儲器單元陣列;及在第二集成電路裸片上形成控制器,其中所述控制器經配置以:確定預測在執行至少一次乘法時存在的所述陣列中的第一存儲器單元的環境;及對所述第一存儲器單元進行編程,其中基于所述經預測環境調整所述編程。

    本文檔來自技高網...

    【技術保護點】

    1.一種裝置,其包括:

    2.根據權利要求1所述的裝置,其中所述上下文包含與所述第一權重相關聯的特性、所述第一存儲器單元在存儲器單元陣列中的位置或在執行乘法時與所述第一存儲器單元相關聯的至少一個電流的預測中的至少一者。

    3.根據權利要求1所述的裝置,其中所述上下文包含關于對至少一個輸入的預測的統計數據或存儲器單元陣列中的權重模式中的至少一者。

    4.根據權利要求1所述的裝置,其中所述上下文包含由處理引起的存儲器單元變動或來自相鄰單元的干擾中的至少一者。

    5.一種系統,其包括:

    6.根據權利要求5所述的系統,其中乘法運算期間的所述輸出電流對應于所述第一存儲器單元的相應目標電流。

    7.根據權利要求5所述的系統,其進一步包括經配置以將至少一個電壓施加到字線以選擇所述第一存儲器單元用于將所述第一權重乘以所述輸入的電壓驅動器。

    8.一種方法,其包括:

    9.根據權利要求8所述的方法,其中所述第一存儲器單元通過選擇晶體管耦合到至少一條位線,且執行所述乘法包括將至少一個輸入模式施加到所述選擇晶體管的柵極。

    10.根據權利要求8所述的方法,其進一步包括:

    ...

    【技術特征摘要】

    1.一種裝置,其包括:

    2.根據權利要求1所述的裝置,其中所述上下文包含與所述第一權重相關聯的特性、所述第一存儲器單元在存儲器單元陣列中的位置或在執行乘法時與所述第一存儲器單元相關聯的至少一個電流的預測中的至少一者。

    3.根據權利要求1所述的裝置,其中所述上下文包含關于對至少一個輸入的預測的統計數據或存儲器單元陣列中的權重模式中的至少一者。

    4.根據權利要求1所述的裝置,其中所述上下文包含由處理引起的存儲器單元變動或來自相鄰單元的干擾中的至少一者。

    5.一種系統,其包括:

    【專利技術屬性】
    技術研發人員:W·C·菲利皮亞克J·M·赫斯特
    申請(專利權)人:美光科技公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 无码一区二区三区免费视频| 久青草无码视频在线观看| 一本无码人妻在中文字幕免费| 亚洲熟妇无码av另类vr影视| 精品久久久无码21p发布| 人妻精品无码一区二区三区| 69堂人成无码免费视频果冻传媒| 精品无码久久久久久久久| 日韩精品无码久久一区二区三| 亚洲AV无码精品无码麻豆| 亚洲熟妇无码久久精品| 精品久久久无码中文字幕边打电话| 亚洲中文无码av永久| 亚洲人成无码网站久久99热国产| 国产精品无码2021在线观看| 无码中文在线二区免费| 国产精品无码久久综合网| 成在人线av无码免费高潮喷水| 日日摸日日踫夜夜爽无码| 色综合久久中文字幕无码| 精品无码成人网站久久久久久| 精品一区二区三区无码免费视频| 人妻无码中文字幕免费视频蜜桃| 无码孕妇孕交在线观看| 内射精品无码中文字幕| 免费无码又爽又刺激高潮| 国产成人午夜无码电影在线观看| 国产成人无码av片在线观看不卡| 无码熟妇αⅴ人妻又粗又大| 国产嫖妓一区二区三区无码| 精品国产性色无码AV网站| 精品久久久久久久无码| 日韩少妇无码一区二区三区| 无码精品人妻一区二区三区AV| 国产强被迫伦姧在线观看无码| 黑人无码精品又粗又大又长| HEYZO无码中文字幕人妻| 无码人妻精品一区二区三区久久久| 亚洲av无码一区二区三区乱子伦| 无码人妻AV一二区二区三区| 久久久久亚洲av无码专区导航|