上海半導(dǎo)體設(shè)備裝卸-上海無塵室設(shè)備裝卸搬運(yùn)
2022-05-02
來自:
亞瑟半導(dǎo)體設(shè)備安裝(上海)有限公司
瀏覽次數(shù):236
上海半導(dǎo)體設(shè)備裝卸-上海無塵室設(shè)備裝卸搬運(yùn)的亞瑟報(bào)道:IBM半導(dǎo)體設(shè)備搬運(yùn)推出了名為IBM z16的大型計(jì)算機(jī)新系列,盡管這一事件并不是什么頭版新聞,除了一些媒體的慶祝之外。然而,大型機(jī)在當(dāng)今科技領(lǐng)域的重要性不斷下降,并不意味著它正在消失。想想IBM對(duì)z16的實(shí)時(shí)人工智能處理欺詐交易的吹捧吧。(IBM還將z16稱為“業(yè)界量子安全系統(tǒng)”。)半導(dǎo)體設(shè)備搬運(yùn)這些激進(jìn)的說法可能會(huì)讓z16走上重振大型機(jī)平臺(tái)的道路。所有這些能力的核心是硅。事實(shí)上,z16的基礎(chǔ)是IBM的Telum芯片,它本身就是去年夏天才推出的。這種芯片的架構(gòu)使IBM今天正在推進(jìn)的人工智能大型機(jī)成為可能。Telum吸引人的地方在于它新穎的緩存設(shè)計(jì)方法。
存是每個(gè)微處理器的關(guān)鍵設(shè)計(jì)組件,對(duì)處理器的整體性能有著巨大的影響。緩存就像存儲(chǔ)柜,能夠存儲(chǔ)數(shù)據(jù),或者在處理器的門口提前緩存數(shù)據(jù)。半導(dǎo)體設(shè)備搬運(yùn)這在當(dāng)今運(yùn)行速度非??斓奶幚砥鳎ㄍǔJ乔д缀眨┲杏绕渲匾?,以至于每當(dāng)系統(tǒng)需要等待數(shù)據(jù)時(shí),寶貴的時(shí)鐘周期就會(huì)被浪費(fèi)掉。雖然一些科技媒體認(rèn)為Telum的緩存操作是“魔法”,但它實(shí)際上只是一種智能工程。半導(dǎo)體設(shè)備搬運(yùn)在Telum芯片之前產(chǎn)生的芯片使用了四層緩存:半導(dǎo)體設(shè)備搬運(yùn)的一級(jí)緩存是一級(jí)(L1),下一級(jí)緩存是二級(jí)(L2),以此類推,直到你到達(dá)四級(jí)(L4)。傳統(tǒng)上,緩存層次結(jié)構(gòu)是在芯片上使用L1、L2和L3構(gòu)建的,而L4不在芯片上。每個(gè)級(jí)別的大小隨著您的操作而增加,并且它們離處理器引擎本身越遠(yuǎn),延遲也越長(zhǎng)。半導(dǎo)體設(shè)備搬運(yùn)使用新的Telum芯片,IBM消除了物理L3和L4緩存。他們是如何做到這一點(diǎn)的,這是一項(xiàng)工程壯舉,花了五年時(shí)間才實(shí)現(xiàn)。半導(dǎo)體設(shè)備搬運(yùn)IBM 研究員ChristianJacobi說:“我們對(duì) Telum 芯片所做的事情是,我們完全重新設(shè)計(jì)了這些緩存的工作方式,以使更多的數(shù)據(jù)比我們過去所做的更接近處理器內(nèi)核。” IBM zSystems 系統(tǒng)架構(gòu)和設(shè)計(jì)首席技術(shù)官。“為此,我們將二級(jí)緩存增加了四倍。我們現(xiàn)在有一個(gè) 32 MB 的二級(jí)緩存。”這個(gè)L2緩存的大小與大多數(shù)其他服務(wù)器芯片的0.5兆字節(jié)或1兆字節(jié)的緩存形成了鮮明的對(duì)比。為了讓這個(gè)大得多的L2緩存有效地工作,IBM優(yōu)化了訪問模式,以及處理器核心如何獲得非常大的32 MB緩存(8個(gè)核心256 MB),從而具有半導(dǎo)體設(shè)備搬運(yùn)延遲。半導(dǎo)體設(shè)備搬運(yùn) 說:“我們不再受控制邏輯的限制,控制邏輯可以確定數(shù)據(jù)在緩存中的實(shí)際位置,然后將請(qǐng)求發(fā)送到緩存的正確區(qū)域,然后緩慢地將數(shù)據(jù)移到那里。”“我們正在設(shè)計(jì)它,使我們真正只受電力傳輸延遲的限制,以獲取數(shù)據(jù),觸發(fā)讀取數(shù)組中的數(shù)據(jù),然后將數(shù)據(jù)流回需要的地方。”我們?cè)噲D為每個(gè)核心用戶提供他們需要的東西,然后他們不需要的東西就變成了可自由支配的空間。”——Christian Jacobi。就實(shí)際數(shù)據(jù)而言,Telum芯片的半導(dǎo)體設(shè)備搬運(yùn)延時(shí)小于3納秒,平均延時(shí)為3.6納秒。“我們已經(jīng)優(yōu)化了這個(gè)訪問管道,通過它,我們?yōu)槲覀儎?chuàng)造了巨大的性能優(yōu)勢(shì),”Jacobi補(bǔ)充說。Jacobi和他的團(tuán)隊(duì)看到了通過增加L2緩存的大小來消除物理L3和L4緩存的好處,但他們?nèi)匀幌M@得L3和L4緩存固有的額外存儲(chǔ)空間所帶來的性能優(yōu)勢(shì)。為了保持這些好處,他們決定重塑和重新定義緩存之間的交互方式。半導(dǎo)體設(shè)備搬運(yùn)所以他們開始意識(shí)到——一個(gè)芯片有8個(gè)核,每個(gè)核都有自己的緩存——并不是每個(gè)核都一直一樣忙。在每個(gè)核心的工作負(fù)載需要使用自己的私有緩存時(shí),會(huì)發(fā)生瞬時(shí)轉(zhuǎn)移半導(dǎo)體設(shè)備搬運(yùn)這次行動(dòng)對(duì)我們來說是一個(gè)巨大的機(jī)會(huì),” Jacobi解釋說。“如果一個(gè)核心在其L2上非常繁忙,實(shí)際上需要超過32mb的內(nèi)存,而芯片上的另一個(gè)核心使用較少的緩存,我可以使用芯片上的另一個(gè)L2作為非常繁忙的緩存的溢出位置。”半導(dǎo)體設(shè)備搬運(yùn)這就是為什么Jacobi和他的團(tuán)隊(duì)提出了虛擬L3緩存的概念。虛擬L3緩存平衡了未充分利用的L2緩存,將其作為溢出空間用于其他超額使用的L2緩存。當(dāng)需要訪問數(shù)據(jù)時(shí),仍然可以從非常非??拷诵牡?2mb緩存中檢索數(shù)據(jù)。事實(shí)上,芯片上的溢出空間因此有效地達(dá)到大值 32 x 8 =256 MB。如果其他核心不做任何事情,理論上它們的所有緩存都可以作為單個(gè)核心的溢出來使用——現(xiàn)在它的延遲仍然非常低,只有 12 納秒。半導(dǎo)體設(shè)備搬運(yùn)說:“我們?cè)噲D為每個(gè)核心提供他們需要的東西,然后他們不需要的東西就會(huì)成為核心可以從中受益的自由空間。”“因?yàn)槲覀內(nèi)栽趦?yōu)化,以獲得非常低的延遲,所以實(shí)際上這就像一個(gè)L3,但它是由物理L2緩存組成的,而不是在芯片上自己的一塊硅區(qū)域。”雖然一些科技媒體將這種操作稱為“魔法”,但它實(shí)際上只是一種智能工程。Jacobi解釋說,芯片會(huì)定期測(cè)量每個(gè)緩存的繁忙程度。通過IBM內(nèi)置到Telum中的啟發(fā)式算法,它可以確定在半導(dǎo)體設(shè)備搬運(yùn)一微秒內(nèi),它在這個(gè)緩存上非常活躍,而在另一個(gè)緩存上不太活躍。有了這些信息,芯片就會(huì)重定向流量,并使用鄰近的緩存作為溢出。與此同時(shí),它繼續(xù)測(cè)量它的緩存變換對(duì)其他緩存的活躍程度。半導(dǎo)體設(shè)備搬運(yùn)i指出,這種架構(gòu)還提供了一種干凈的方法,允許集成在大型機(jī)中的專用硬件加速器(例如能夠?qū)崟r(shí)欺詐檢測(cè)的AI加速器)訪問CPU緩存中的數(shù)據(jù)。