上海半導(dǎo)體設(shè)備搬運(yùn)-上海精密儀器設(shè)備搬運(yùn)裝卸
2022-04-30
來自:
亞瑟半導(dǎo)體設(shè)備安裝(上海)有限公司
瀏覽次數(shù):265
半導(dǎo)體設(shè)備搬運(yùn)上海半導(dǎo)體設(shè)備搬運(yùn)-上海精密儀器設(shè)備搬運(yùn)裝卸的亞瑟報(bào)道:半導(dǎo)體設(shè)備搬運(yùn)英偉達(dá)在其 Arm CPU 的推動(dòng)下又獲得了另一個(gè)高調(diào)的聘用——這一次是在英特爾的眼皮子底下。
據(jù)半導(dǎo)體設(shè)備搬運(yùn)報(bào)道, 英特爾半導(dǎo)體設(shè)備搬運(yùn)以色列工廠的設(shè)計(jì)經(jīng)理,也是成功的 Tiger Lake 架構(gòu)背后的經(jīng)理之一Rafi Marom,半導(dǎo)體設(shè)備搬運(yùn)跳槽到位于該國的 Nvidia 公司。他作為高級 CPU 總監(jiān)的新角色使他成為公司未來 Arm 產(chǎn)品的主要架構(gòu)師之一。
半導(dǎo)體設(shè)備搬運(yùn)在其斥資數(shù)十億美元收購這家總部位于英國的公司失敗后,英偉達(dá)似乎正在將其Arm 核心設(shè)計(jì)能力加倍,因?yàn)樗荚谶M(jìn)一步推動(dòng)極限。英偉達(dá)需要其芯片設(shè)計(jì)來服務(wù)于它的目的;另一方面,Arm 半導(dǎo)體設(shè)備搬運(yùn)于可應(yīng)用于多個(gè)產(chǎn)品類別和合作伙伴的通用設(shè)計(jì)。挖角——或與現(xiàn)有承包商仍有聯(lián)系的合同人員——是一種相對常見的半導(dǎo)體行業(yè)做法。雖然該行業(yè)一直在顯示出巨大的增長——而且這種增長預(yù)計(jì)只會加速——但缺乏經(jīng)過適當(dāng)培訓(xùn)的高水平技術(shù)工人是一個(gè)真正的問題。英特爾、AMD、英偉達(dá)甚至蘋果公司都經(jīng)常在他們之間雇傭貢獻(xiàn)者,這加強(qiáng)了他們的員工隊(duì)伍和設(shè)計(jì)能力,并剝奪了競爭對手的寶貴資產(chǎn)。預(yù)計(jì)英偉達(dá)將利用 Marom 的知識來設(shè)計(jì)英偉達(dá)未來基于 Arm 的 CPU 產(chǎn)品。這些設(shè)計(jì)將在公司的GraceHopper Superchip之后推出,該芯片利用 72 個(gè)基于 Neoverse 的 Arm v9 內(nèi)核,并聲稱與典型的 x86 CPU 設(shè)計(jì)相比性能提高了 10 倍。半導(dǎo)體設(shè)備搬運(yùn)這一聲明自然引起了英特爾的注意,促使該公司認(rèn)識到英偉達(dá)的目標(biāo)是在 CPU 領(lǐng)域與這家藍(lán)色巨頭展開競爭。英特爾甚至設(shè)立了數(shù)十億美元的基金,旨在留住和吸引新人才,以防止此類情況發(fā)生。然而具有諷刺意味的是,英特爾自己的另一家公司現(xiàn)在將盡努力推進(jìn)英偉達(dá)的目標(biāo)。半導(dǎo)體設(shè)備搬運(yùn)在一年左右的時(shí)間里,隨著“Grace”Arm 服務(wù)器 CPU 的推出,Nvidia 的任何人相信或大聲說并非數(shù)據(jù)中心中的每個(gè)工作負(fù)載都需要 GPU 加速并不是異端邪說。半導(dǎo)體設(shè)備搬運(yùn)在某種程度上,隨著 BlueField 系列基于 Arm 的 DPU 處理器的采用,這種轉(zhuǎn)變已經(jīng)在 Nvidia 的系統(tǒng)架構(gòu)中發(fā)生。但隨著 Grace CPU 的發(fā)布,在一年前的 GTC 2021 大會上進(jìn)行了預(yù)覽,在2023 年上半年的某個(gè)時(shí)候,如果半導(dǎo)體設(shè)備搬運(yùn)順利,Nvidia 將立即成為 Arm 服務(wù)器芯片的可靠供應(yīng)商,可以在條款上與之競爭每瓦的性能,我們假設(shè),每瓦的每美元成本,同時(shí)具有半導(dǎo)體設(shè)備搬運(yùn)X86、Arm 或 Power 架構(gòu)。對于英偉達(dá)來說,從 GPU 加速器供應(yīng)商轉(zhuǎn)變?yōu)橹鳈C(jī) CPU 供應(yīng)商——以及擁有大量自己的向量數(shù)學(xué)能力的主機(jī) CPU ——這將是一個(gè)重要事件。非常重要的事情——將能夠運(yùn)行整個(gè) Nvidia HPC 和 AI 堆棧,包括編譯器、庫和其他系統(tǒng)軟件。Grace CPU 將與 Hopper GPU 完全匹敵,COBOL 發(fā)明前美國海軍少將可能會在隱喻意義上表示贊同。半導(dǎo)體設(shè)備搬運(yùn)十多年來,我們一直在倡導(dǎo) Nvidia 將 Arm 服務(wù)器芯片推向市場,當(dāng) Nvidia 聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Jensen Huang在 1 月份宣布“Project Denver”Arm 服務(wù)器計(jì)劃時(shí),我們對這種可能性感到興奮。2011 年,半導(dǎo)體設(shè)備搬運(yùn) Arm 服務(wù)器芯片試圖沖破數(shù)據(jù)中心的大門。2014 年,當(dāng)兩個(gè) Denver Arm 內(nèi)核出現(xiàn)在 Tegra K1 “superchip” 混合 CPU-GPU 芯片上時(shí),街上的消息是 Nvidia 提出了自己的 CPU 指令集架構(gòu) (ISA),并在此基礎(chǔ)上模擬 Arm ISA,而且,重要的是,它也能夠模擬 X86 ISA。(Transmeta 早在 20 年前就嘗試過這樣做,還記得嗎?)想象一下,如果 Nvidia 推出了可以模擬 Xeon 或 Opteron(現(xiàn)在是 Epyc)并且還可以運(yùn)行 Arm 工作負(fù)載的全功能 Denver 服務(wù)器芯片,那么可能會引發(fā)訴訟,也許,它自己的原生模式。. . .半導(dǎo)體設(shè)備搬運(yùn)但遺憾的是,我們不得不再等十幾年,英偉達(dá)以 400 億美元從軟銀收購 Arm Holdings 的交易落空,英偉達(dá)的更清潔的 Arm 服務(wù)器芯片計(jì)劃才出現(xiàn)。我們認(rèn)為這是 Nvidia 在提出 SoftBank 提議之前初的計(jì)劃——我們和 Huang 開玩笑說我們想要 Nvidia 的 Arm 服務(wù)器芯片,但 Nvidia 不需要Victor Kiam并購買整個(gè)公司。也就是說,我們了解整個(gè) Arm 的千載難逢的機(jī)會——從財(cái)務(wù)上來講,這是一個(gè)很好的機(jī)會,但主要是 Nvidia 股票,它像現(xiàn)金一樣支出,但實(shí)際上不是現(xiàn)金。而且我們還完全理解了未來 Aarmv9 架構(gòu)的影響,以及許多機(jī)器學(xué)習(xí)工作——當(dāng)然大部分推理和可能的一些訓(xùn)練——將保留在 CPU 上并且不會遷移到 GPU 或其他加速器這一事實(shí)。正如我們在 2021 年 3 月仔細(xì)研究 Armv9 公告時(shí)所說的那樣就在 Grace 的努力獲得成功后的幾周和 Arm Holdings 交易宣布的 8 個(gè)月后,英偉達(dá)想要收購 Arm:它可以獲得矢量、矩陣和數(shù)字信號處理知識產(chǎn)權(quán)的許可資金,這將是添加到各種 CPU 正是因?yàn)橄到y(tǒng)架構(gòu)師不想進(jìn)行 GPU 卸載。進(jìn)行任何類型的卸載都存在編碼和安全隱患——加密加速器、在線 FPGA 加速器或 GPU 加速器——許多企業(yè)和組織不想處理它們。那些需要 10 倍或 100 倍半導(dǎo)體設(shè)備搬運(yùn)的 HPC 性能的人別無選擇,只能使用 GPU——除非他們想制造具有大量內(nèi)核和大量矢量引擎的定制 CPU。富士通在日本 RIKEN 實(shí)驗(yàn)室的“Fugaku”超級計(jì)算機(jī)上使用 A64FX Arm CPU 做到了這一點(diǎn),半導(dǎo)體設(shè)備搬運(yùn)并行計(jì)算機(jī)工程與技術(shù)研究中心為無錫半導(dǎo)體設(shè)備搬運(yùn)超級計(jì)算中心的“太湖之光”和“海洋之光”超級計(jì)算機(jī)分別配備了神威SW26010和SW26010- pro處理器。這兩款機(jī)器都有令人印象深刻的結(jié)果。但高性價(jià)比和低功耗并不是這兩款機(jī)器的特點(diǎn)。(Fugaku三年前在 Green500 超級計(jì)算機(jī)排名中半導(dǎo)體設(shè)備搬運(yùn)但已被英偉達(dá)“Ampere”A100 GPU 加速器加速的一長串機(jī)器推下榜單。“Hopper”H100 GPU 加速器只會讓這些比較變得更糟,而且隨著據(jù)我們所知,目前還沒有 A64FX-2 芯片與 A64FX 相比工藝縮小、時(shí)鐘速度提高、功率降低或價(jià)格/性能改進(jìn)。盡管如此,許多企業(yè)和組織仍將做出選擇,要么支付數(shù)百萬美元將其 C、C++ 和 Fortran 代碼拆開以進(jìn)行 GPU 卸載,要么支付更多電費(fèi)并花費(fèi)更長的時(shí)間來得出答案并在 zippy CPU 上運(yùn)行 AI 工作負(fù)載,該 CPU 可以很好地使用內(nèi)存子系統(tǒng)進(jìn)行矩陣和矢量數(shù)學(xué)運(yùn)算,但與 GPU 加速器的skinny sprinter HBM 內(nèi)存相比,內(nèi)存子系統(tǒng)具有大量內(nèi)存。這就是 Grace CPU 對 Nvidia 如此重要的原因之一,Grace 將運(yùn)行 Nvidia 為在 GPU 上運(yùn)行而創(chuàng)建的所有軟件的聲明也是如此。讓我們直接從 Huang 的 GTC 2022 主題演講的頂部寫下這一點(diǎn):“Grace 將在人工智能、數(shù)據(jù)分析、科學(xué)計(jì)算和超大規(guī)模計(jì)算方面表現(xiàn)出色,Grace 將受到 Nvidia 的所有軟件平臺的歡迎——Nvidia RTX、HPC、英偉達(dá) AI 和 Omniverse。”