5種工藝1000億晶體管 Intel造出有史以來(lái)最復(fù)雜的芯片?
從歷史上看,英特爾將其積累的所有芯片知識(shí)用于推進(jìn)摩爾定律,并將這些知識(shí)應(yīng)用到其未來(lái)的 CPU 中。如今,其中一些高級(jí)處理器將用于阿貢國(guó)家實(shí)驗(yàn)室即將推出的“Aurora”超級(jí)計(jì)算機(jī)。
然而,要求苛刻的模擬和建模工作負(fù)載也能從 GPU 加速中獲益匪淺。認(rèn)識(shí)到這一不斷增長(zhǎng)的需求,英特爾著手設(shè)計(jì)和構(gòu)建迄今為止最復(fù)雜的 GPU,并在非常緊迫的時(shí)間內(nèi)完成。
這項(xiàng)努力的結(jié)果是,以前代號(hào)為“Ponte Vecchio”的英特爾 Max 系列 GPU將 1000 億個(gè)晶體管和 47 個(gè)區(qū)塊打包到五個(gè)工藝節(jié)點(diǎn)上。
除此之外,它們還包括兩項(xiàng)封裝創(chuàng)新,即 EMIB 2.5D 和 Foveros 3D 技術(shù),以及將模塊堆疊在一起以獲得更高的處理器密度。
英特爾 Max 系列 GPU 產(chǎn)品經(jīng)理 Duke Tallam 表示:“英特爾 Max 系列 GPU 的開(kāi)發(fā)周期非常緊湊,因此將其變?yōu)楝F(xiàn)實(shí)就像挑戰(zhàn)我們的團(tuán)隊(duì)一年蓋房子,明年建造摩天大樓?!?/p>
“迄今為止,GPU 是我們最復(fù)雜的處理器,代表了英特爾硅產(chǎn)品的巨大飛躍。然而,整個(gè)封裝可以放在一個(gè)人的手掌中?!?/p>
眾多創(chuàng)新將 MAX 系列 GPU 推向市場(chǎng)
Max 系列 GPU 的巨大復(fù)雜性需要全球英特爾團(tuán)隊(duì)成員的支持。在俄勒岡州和亞利桑那州的工廠完成技術(shù)開(kāi)發(fā)過(guò)程后,硅片被運(yùn)往英特爾在檳城的制造工廠進(jìn)行大批量生產(chǎn)。
不過(guò),要達(dá)到那個(gè)階段,需要?jiǎng)?chuàng)造性的解決方案,因?yàn)橛⑻貭栃枰獙?duì)其制造過(guò)程進(jìn)行多次修改。首先,英特爾將芯片晶圓互連的間距縮小到 36μm,大約是人類(lèi)頭發(fā)的寬度。
這是 Intel 晶圓廠或工廠成功使用過(guò)的最細(xì)粒度的pitch。
英特爾工廠還開(kāi)發(fā)了一種在工廠生產(chǎn)線上測(cè)試裸片的新方法——稱為單一堆疊裸片測(cè)試 (SSDT)。SSDT 確保在添加其他昂貴的組件(如基板 和高帶寬內(nèi)存 (HBM) 芯片)之前,只有功能正常的芯片才能在制造過(guò)程中向前推進(jìn) 。
該公司還找到了一種將管芯焊接到封裝上的新方法,將工藝能力提高了 50%。最后,該小組開(kāi)發(fā)了先進(jìn)的晶圓級(jí)組裝工藝,將可靠性提高了十倍。
除了 GPU 的技術(shù)復(fù)雜性之外,驗(yàn)證過(guò)程還涉及在最少數(shù)量的樣本 GPU 上完成硅前測(cè)試的挑戰(zhàn)。
因此,該團(tuán)隊(duì)不再依賴物理樣本進(jìn)行測(cè)試,而是轉(zhuǎn)向虛擬模擬來(lái)展示虛擬芯片在真實(shí)場(chǎng)景中的表現(xiàn)。在其他地方,工程師采用其他創(chuàng)造性方法來(lái)加速測(cè)試過(guò)程,例如在從事該項(xiàng)目的許多團(tuán)隊(duì)成員之間運(yùn)行并行工作流的方法。
當(dāng)被問(wèn)及在兩年內(nèi)將 GPU 推向市場(chǎng)所需的巨大努力時(shí),英特爾的 Tallam 提出了他的觀點(diǎn)。
“我們?cè)谥圃焯幚砥鞣矫鎿碛邪雮€(gè)多世紀(jì)的經(jīng)驗(yàn),但設(shè)計(jì) GPU 的復(fù)雜性和性能要求需要我們過(guò)去的所有知識(shí)和技能?!?/p>
Tallam 繼續(xù)說(shuō)道,“Max 系列 GPU 有助于彌合當(dāng)今已經(jīng)令人難以置信的 HPC 系統(tǒng)與世界上少數(shù)能夠或?qū)⒁_(dá)到 exascale 級(jí)性能的系統(tǒng)之間的差距。
因此,我們以意大利佛羅倫薩著名的橋梁命名 GPU 似乎是正確的。
Max 系列 GPU 橋既美觀又功能非凡。我們的團(tuán)隊(duì)對(duì)更小規(guī)模的 GPU 也有同樣的看法?!?/p>
這些數(shù)據(jù)中心 GPU 與新推出的 Intel Xeon CPU Max 系列處理器的綜合能力將加速工作負(fù)載,從而在比以前更短的時(shí)間內(nèi)揭示有價(jià)值的結(jié)果。阿貢國(guó)家實(shí)驗(yàn)室是 Max 系列的首批采用者之一。
其團(tuán)隊(duì)計(jì)劃部署 60,000 個(gè) Max 系列 GPU,平均分配給 10,000 個(gè)服務(wù)器刀片。
每個(gè)刀片還將依靠?jī)蓚€(gè) Intel Xeon CPU Max 系列處理器(這些是帶有 HBM 內(nèi)存的“Sapphire Rapids”Xeons SP)來(lái)最大化 Aurora 的架構(gòu),以應(yīng)對(duì)一些有史以來(lái)最重要的科學(xué)工作負(fù)載。
一旦 ANL 在其旗艦 Aurora 系統(tǒng)上部署完整的 Max 系列 GPU 和 CPU,其雙精度計(jì)算性能將超過(guò) 2 exaFLOPS。
研究人員已經(jīng)計(jì)劃將所有計(jì)算能力用于一些最具挑戰(zhàn)性的科學(xué)問(wèn)題,例如宇宙建模、推進(jìn)基于聚變的安全能源解決方案、幫助實(shí)現(xiàn)醫(yī)學(xué)突破或更精確地預(yù)測(cè)颶風(fēng)。
這些 GPU 代表了英特爾雄心勃勃的多年IDM 2.0 產(chǎn)品領(lǐng)導(dǎo)、創(chuàng)新和長(zhǎng)期客戶價(jià)值戰(zhàn)略的核心組成部分。
匯集一切
去年 11 月,馬來(lái)西亞的檳城組裝與測(cè)試 (PGAT) 員工慶祝了首批 60,000 個(gè) GPU 的制造。馬來(lái)西亞擁有英特爾最大的組裝和測(cè)試制造工廠,由四家工廠組成。

檳城組裝與測(cè)試 (PGAT) 工廠經(jīng)理 Wong Mei Fong 在她 28 年的英特爾職業(yè)生涯中經(jīng)歷了很多挑戰(zhàn)。盡管如此,與 GPU 的 1,500 名團(tuán)隊(duì)成員的復(fù)雜性和協(xié)調(diào)性相比,它們都相形見(jiàn)絀。
PGAT 需要用通常與這種規(guī)模的項(xiàng)目相關(guān)的一半時(shí)間來(lái)滿足生產(chǎn)需求。為了使這一切成為可能,其他團(tuán)隊(duì)和工廠也支持這項(xiàng)工作。
“該產(chǎn)品的眾多復(fù)雜性是無(wú)與倫比的。由于時(shí)間緊迫,我們面臨的嚴(yán)峻挑戰(zhàn)變得更加困難,”Mei Fong 說(shuō)?!氨M管存在這些障礙,我們?cè)诤献骰锇榻M織的寶貴幫助下實(shí)現(xiàn)了最初看似不可能的目標(biāo)。”
寶貴的教訓(xùn)
從開(kāi)發(fā)和制造 GPU Max 系列中獲得的綜合經(jīng)驗(yàn)為未來(lái)的生產(chǎn)流程帶來(lái)了新的見(jiàn)解,這將加速即將推出的處理器的交付。Tallum 指出,“我們對(duì)最新的處理器版本感到興奮,我們很自豪有機(jī)會(huì)為實(shí)現(xiàn)突破性科學(xué)盡自己的一份力量。”

責(zé)任編輯:憲瑞
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com

