8月30日,阿里云正式推出全棧智能計算解決方案“飛天智算平臺”,并啟動兩座超大規(guī)模智算中心,以公共云和專有云兩種模式,為各類科研、公共服務和企業(yè)機構(gòu)提供強大的智能計算服務。
阿里云稱,飛天智算平臺可將計算資源利用率提高3倍以上,AI訓練效率提升11倍,推理效率提升6倍。
據(jù)了解,飛天智算平臺已在阿里內(nèi)部廣泛應用,支撐達摩院前沿AI和電商智能技術(shù)發(fā)展,并服務了多家機構(gòu)和企業(yè),支撐自動駕駛、新藥研發(fā)、氣象預測、工業(yè)能源等行業(yè)大幅提升AI訓練效率。
據(jù)介紹,飛天智算平臺平臺提供基于阿里云磐久基礎(chǔ)設(shè)施的融合算力和大數(shù)據(jù)AI一體化平臺整體解決方案,可以運行在X86、GPU、ARM等多種芯片類型的服務器上,實現(xiàn)“一云多芯”,并以最高10倍IO優(yōu)化和5倍通信性能優(yōu)化,實現(xiàn)90%的千卡并行計算效率。
綠色技術(shù)方面,飛天智算在技術(shù)減排、能源結(jié)構(gòu)優(yōu)化、區(qū)域布局優(yōu)化、供應鏈減碳以及資源利用優(yōu)化五個方面來降低單位算力的碳排放。在技術(shù)減排方面,通過液冷、電源技術(shù)以及智能運維等方式降低能耗,PUE最低可達1.09。
同時,開發(fā)人員可以在平臺上進行數(shù)據(jù)存儲、數(shù)據(jù)治理、數(shù)據(jù)分析、模型開發(fā)、模型訓練與推理的工作。此外,還提供了預訓練模型,以及語音、圖像、自然語言處理、決策等領(lǐng)域的模型能力,以方便開發(fā)者更好的加速AI應用的開發(fā)。
目前,該平臺正在支撐建設(shè)兩座超大規(guī)模智算中心。其中,張北智算中心建設(shè)規(guī)模為12 EFLOPS(每秒1200億億次浮點運算)AI算力,將成為全球領(lǐng)先的智算中心。烏蘭察布智算中心建設(shè)規(guī)模為3 EFLOPS(每秒300億億次浮點運算)AI算力,位于“東數(shù)西算”內(nèi)蒙古樞紐節(jié)點。
阿里云智能全球銷售總裁蔡英華表示,智算不僅在于規(guī)模大,更是需要綠色、高效并且具備產(chǎn)業(yè)實踐。計算是一個龐大的復雜系統(tǒng),沒有體系化的核心技術(shù)能力,靠堆硬件堆不出算力,更無法帶來實際的產(chǎn)業(yè)價值。
實際上,智能計算不同于通用型計算,需要海量數(shù)據(jù)對AI模式進行訓練,算力被損耗在數(shù)據(jù)遷移、同步等環(huán)節(jié),千卡以上規(guī)模的算力輸出最低往往僅有40%左右。這導致了智能算力成本高昂,制約了產(chǎn)業(yè)發(fā)展。阿里云通過體系化的技術(shù)創(chuàng)新,解決了智能計算的損耗難題,將千卡并行計算效率提升至90%以上。
據(jù)介紹,小鵬汽車基于飛天智算在烏蘭察布建設(shè)智算中心“扶搖”,算力規(guī)模達600PFLOPS,將自動駕駛模型訓練提速近170倍。在生命科學領(lǐng)域,深勢科技采用飛天智算平臺之后,將集群性能優(yōu)化提升超過100%,讓分子動力學仿真模擬訓練效率提升了5倍。
此外,飛天智算還支撐了阿里巴巴的人工智能實踐,支撐阿里AI日均1萬億次調(diào)用。其中,拍立淘訓練速度提升了200倍,10億張圖片全量訓練時間從2.5個月縮短到8小時。達摩院大模型M6僅使用512張GPU,在10天內(nèi)就完成了10萬億參數(shù)模型訓練,能耗僅為GPT-3在同等參數(shù)規(guī)模下的1%。