五年前,Nvidia著手設(shè)計(jì)一種超級計(jì)算機(jī)級系統(tǒng),該系統(tǒng)功能強(qiáng)大,足以訓(xùn)練和運(yùn)行自己的AI模型,例如自動駕駛汽車模型,但又足夠靈活,幾乎可以服務(wù)于任何深度學(xué)習(xí)研究人員。在構(gòu)建了DGX Pods的多個迭代之后,Nvidia汲取了有關(guān)構(gòu)建具有模塊化,可擴(kuò)展單元的系統(tǒng)的寶貴經(jīng)驗(yàn)。然后,大流行病爆發(fā)了。

該COVID-19的爆發(fā)帶來了新的挑戰(zhàn)Nvidia的,因?yàn)樗哪繕?biāo)是構(gòu)建塞勒涅,第四代其DGX SuperPODs的。減少的人員和建筑限制使這項(xiàng)任務(wù)變得復(fù)雜,但是Nvidia在短短三個半星期內(nèi)就從數(shù)據(jù)中心的裸機(jī)架過渡到了完整的操作系統(tǒng)。
領(lǐng)導(dǎo)Nvidia系統(tǒng)團(tuán)隊(duì)的首席架構(gòu)師Michael Houston對記者說:“最初的重點(diǎn)是非常非??斓剡M(jìn)行部署,以便我們能夠不斷吸引研究人員。” “英偉達(dá)是我們機(jī)器的第一個客戶-因此我們會證明一切,并確保機(jī)器以及我們?nèi)绾沃付ǖ跖摷軜?gòu)是堅(jiān)如磐石。”