很遺憾,因您的瀏覽器版本過低導(dǎo)致無法獲得最佳瀏覽體驗(yàn),推薦下載安裝谷歌瀏覽器!

精品国产成人一区二区,看免费5XXAAA毛片裸体,手机在线永久免费观看AV片,久久国产成人精品国产成人亚洲,精品无码国产自产在线观看极品,久久精品亚洲一区二区三区浴池,一本久久精品一区二区不卡,亚洲精品日韩片无码中文字幕,丁香五月综合久久激情,国产精品 精品国内自产拍

精密儀器設(shè)備-裝卸搬運(yùn)搬家

2022-03-16  來自: 亞瑟半導(dǎo)體設(shè)備安裝(上海)有限公司 瀏覽次數(shù):220

精密儀器設(shè)備-裝卸搬運(yùn)搬家打包亞瑟報(bào)道:英偉達(dá)‌‌半‍導(dǎo)‌體‍設(shè)‌備‍搬‌運(yùn)‍、IBM 和大學(xué)合作者開發(fā)了一種架構(gòu),他們稱該架構(gòu)將為 GPU 加速的應(yīng)用程序(例如分析和機(jī)器學(xué)習(xí)訓(xùn)練)提供對大量數(shù)據(jù)存儲的快速細(xì)粒度訪問。‌‌半‍導(dǎo)‌體‍設(shè)‌備‍搬‌運(yùn)‍這種技術(shù)被稱為大加速器內(nèi)存(Big accelerator Memory),又名 BaM,這是一個(gè)有趣的嘗試,旨在減少 Nvidia 圖形處理器和類似硬件加速器在訪問存儲時(shí)對通用芯片的依賴,這可以提高容量和性能。我們知道,現(xiàn)代圖形處理單元不僅僅用于圖形;它們還用于各種重型工作負(fù)載,例如分析、人工智能、機(jī)器學(xué)習(xí)和高性能計(jì)算 (HPC)。為了地處理大型數(shù)據(jù)集,GPU 要么需要大量昂貴的本地專用內(nèi)存(例如 HBM2、GDDR6 等),要么需要地訪問固態(tài)存儲?,F(xiàn)代計(jì)算 GPU 已經(jīng)搭載 80GB–128GB 的 HBM2E 內(nèi)存,下一代計(jì)算 GPU 將擴(kuò)展本地內(nèi)存容量。但數(shù)據(jù)集大小也在迅速增加,因此優(yōu)化 GPU 和存儲之間的互操作性很重要。換而言之,‌‌半‍導(dǎo)‌體‍設(shè)‌備‍搬‌運(yùn)‍改進(jìn) GPU 和 SSD 之間的互操作性有幾個(gè)關(guān)鍵原因:首先,NVMe 調(diào)用和數(shù)據(jù)傳輸給 CP 帶來了很大的負(fù)載,從整體性能和效率的角度來看,這是低效的。其次,CPU-GPU 同步開銷和/或 I/O 流量放大顯著限制了具有大量數(shù)據(jù)集的應(yīng)用程序所需的有效存儲帶寬。BaM 的目標(biāo)是擴(kuò)展 GPU 內(nèi)存容量并提高有效的存儲訪問帶寬,同時(shí)為 GPU 線程提供高級抽象,以便輕松按需、細(xì)粒度地訪問擴(kuò)展內(nèi)存層次結(jié)構(gòu)中的海量數(shù)據(jù)結(jié)構(gòu)”,該團(tuán)隊(duì)在其撰寫的論文中說。BaM 是 Nvidia 將傳統(tǒng)的以 CPU 為中心的任務(wù)轉(zhuǎn)移到 GPU 內(nèi)核的一步。BaM 不依賴于虛擬地址轉(zhuǎn)換、基于頁面錯(cuò)誤的按需加載數(shù)據(jù)以及其他以 CPU 為中心的傳統(tǒng)機(jī)制來處理大量信息,而是提供了允許 Nvidia GPU 獲取的軟件和硬件架構(gòu)直接從內(nèi)存和存儲中獲取數(shù)據(jù)并對其進(jìn)行處理,而無需 CPU 內(nèi)核對其進(jìn)行編排。‌‌半‍導(dǎo)‌體‍設(shè)‌備‍搬‌運(yùn)‍BaM 有兩個(gè)主要部分:GPU 內(nèi)存的軟件管理緩存;以及用于 GPU 線程的軟件庫,通過直接與驅(qū)動(dòng)器對話,直接從 NVMe SSD 請求數(shù)據(jù)。在存儲和 GPU 之間移動(dòng)信息的工作由 GPU 內(nèi)核上的線程處理,使用 RDMA、PCIe 接口和允許 SSD 在需要時(shí)直接讀取和寫入 GPU 內(nèi)存的自定義 Linux 內(nèi)核驅(qū)動(dòng)程序。如果請求的數(shù)據(jù)不在軟件管理的緩存中,驅(qū)動(dòng)器的命令將由 GPU 線程排隊(duì)。這意味著在 GPU 上運(yùn)行以執(zhí)行密集型工作負(fù)載的算法可以快速獲取所需的信息,并且——至關(guān)重要的是——以針對其數(shù)據(jù)訪問模式進(jìn)行優(yōu)化的方式。研究人員使用現(xiàn)成的 GPU 和 NVMe SSD 測試了一個(gè)由 Linux 驅(qū)動(dòng)的原型 BaM 系統(tǒng),以證明它是當(dāng)今讓主機(jī)處理器指的方法的可行替代方案。我們被告知,可以并行化存儲訪問,消除同步障礙,更有效地使用 I/O 帶寬來提高應(yīng)用程序性能。以 CPU 為中心的策略會導(dǎo)致過多的 CPU-GPU 同步開銷和/或 I/O 流量放大,從而減少具有細(xì)粒度數(shù)據(jù)相關(guān)訪問模式(如圖形和數(shù)據(jù)分析、推薦系統(tǒng)和圖形)的新興應(yīng)用程序的有效存儲帶寬神經(jīng)網(wǎng)絡(luò),”研究人員在論文中說。‌‌半‍導(dǎo)‌體‍設(shè)‌備‍搬‌運(yùn)‍借助軟件緩存,BaM 不依賴于虛擬內(nèi)存地址轉(zhuǎn)換,因此不會遭受諸如 TLB 未命中之類的序列化事件的影響,”包括 Nvidia 首席科學(xué)家、曾領(lǐng)導(dǎo)斯坦福大學(xué)計(jì)算機(jī)科學(xué)系的 Bill Dally 在內(nèi)的作者指出。‌‌半‍導(dǎo)‌體‍設(shè)‌備‍搬‌運(yùn)‍BaM 在 GPU 內(nèi)存中提供了一個(gè)高并發(fā) NVMe 提交/完成隊(duì)列的用戶級庫,使按需訪問未從軟件緩存中丟失的 GPU 線程能夠以高吞吐量方式進(jìn)行存儲訪問,”他們繼續(xù)說道。“這種用戶級方法對每次存儲訪問產(chǎn)生的軟件開銷很小,并且支持高度的線程級并行性。”該團(tuán)隊(duì)計(jì)劃將他們的硬件和軟件優(yōu)化的細(xì)節(jié)開源給其他人來構(gòu)建這樣的系統(tǒng)。我們想起了 AMD 的 Radeon Solid State Graphics (SSG) 卡,它將閃存放置在 GPU 旁邊。


運(yùn)營項(xiàng)目

亞瑟半導(dǎo)體設(shè)備安裝(上海)有限公司 VIP:400-081-0031    聯(lián)系電話:158-0214-7888  

郵箱:Arthur@ArthurChina.com     

CopyRight ? 版權(quán)所有: 亞瑟半導(dǎo)體設(shè)備安裝(上海)有限公司 網(wǎng)站地圖 XML 備案號:滬ICP備20001285號-1


掃一掃訪問移動(dòng)端
女人扒开腿让男人狂桶30分钟| 无毒不卡在线观看无需下载| 精品日本亚洲一区二区三区| 精品一区二区三区在线观看视频| 亚洲综合无码久久精品综合| 波多野成人无码精品电影| 高潮喷吹精品无码视频一区| 狠狠色婷婷久久综合频道日韩| 精品人妻潮喷久久久又裸又黄| 国产精品无码不卡一区二区三区| 熟妇高潮精品一区二区三区| 国产小受呻吟GV视频在线观看| 护士脱了内裤让我爽了一夜视频| 亚洲∧v久久久无码精品小说| 欧美亚洲日韩久久精品福利国产精品亚洲综合| 成全在线观看视频在线播放| 最新欧美国产亚洲一区二区三区精品久久久| 久久综合久久美利坚合众国| 国产在线无码精品麻豆不卡| 久久午夜无码鲁丝片午夜精品| 久久久久免费一级毛片| 亚洲色播爱爱爱爱爱爱爱| 国产精品美女久久久浪潮av| 日本熟妇熟色一本在线观看| 日韩精品一区二区三区中文| 国产欧美日韩精品| 99热都是精品久久久久久| 久久久亚洲精品无码| 久久久久亚洲AV成人无码| 少妇被又大又粗猛烈进出视频| 人人爽人人爽人人爽| 久久无码AV中文出轨人妻| 免费无码不卡视频在线观看| 成人免费精品网站在线观看影片| 亚洲欧洲日产国码无码久久99| 在线观看亚洲一区二区,欧美区一区| 久久无码字幕中文久久无码| 亚洲精品乱码久久久久久蜜桃不卡| 精品人妻系列无码人妻免费视频| 99亚洲男女激情在线观看| 欧美一区二区三区黄片|