久久久亚洲精品一区二区三区_精品无码午夜福利理论片_爱豆传媒在线观看视频_国产av综合第一页_精品国产乱码久久久久久鸭王1_广东少妇大战黑人34厘米视频_久久精品人人做人人综合_日韩国产成人无码av毛片_国产成人无码A区精油按摩_欧美一曲二曲三曲的区别小说

首頁 > 新車報道 > 新車報道 > 聯(lián)想:跨越智能算力“四座大山”,釋放異構(gòu)智算“乘數(shù)效應(yīng)”

聯(lián)想:跨越智能算力“四座大山”,釋放異構(gòu)智算“乘數(shù)效應(yīng)”

發(fā)布時間:2024-04-26 22:37:43

從2023年的ChatGPT,到2024年的Sora,AI和大模型正以不可思議的發(fā)展速度顛覆著業(yè)界的認(rèn)知,但大模型的火熱登場,也進(jìn)一步引爆了智能算力的需求。傳統(tǒng)算力時代,算力需求每18-20個月翻一倍,在深度學(xué)習(xí)出現(xiàn)之后,算力需求每6個月翻一倍,而到了大模型時代,對智能算力的需求幾乎是每年數(shù)百倍的增長。

根據(jù)中國信通院發(fā)布的《中國算力發(fā)展指數(shù)白皮書(2023年)》顯示,在目前的算力規(guī)模中,通用算力規(guī)模占比達(dá)74%,智能算力規(guī)模占比達(dá)25%,同比增加60%,成為當(dāng)前算力快速增長的驅(qū)動力,而預(yù)計未來幾年,智能算力的需求將比當(dāng)前呈現(xiàn)上百倍的增長。

但新的難題也由此產(chǎn)生,在智能算力的1.0時代,主要是采用垂直一體式的方案,針對性地滿足高性能計算、人工智能、大數(shù)據(jù)計算等不同的應(yīng)用負(fù)載,通用性和兼容性比較低;而在智能算力的2.0時代,則出現(xiàn)了異構(gòu)智算融合的趨勢,即將不同架構(gòu)的芯片平臺、不同的算法模型以及數(shù)據(jù)集最大化融合,讓用戶可以根據(jù)業(yè)務(wù)場景和計算任務(wù)選擇最適合的算力方案。在這樣的背景下,如何把智能算力的效率發(fā)揮到極致,如何提升數(shù)據(jù)中心的整體能效,讓智能算力的價值得到最大化體現(xiàn)呢?

 

在日前舉辦的聯(lián)想創(chuàng)新科技大會(2024 Lenovo Tech World)上,聯(lián)想正式發(fā)布聯(lián)想萬全異構(gòu)智算平臺,該平臺集成了聯(lián)想為滿足AI應(yīng)用大潮所打造的五大創(chuàng)新技術(shù),可以說為AI時代大模型訓(xùn)練和推理構(gòu)建出了穩(wěn)定高效的基礎(chǔ)設(shè)施算力底座,也讓智能算力能夠真正“用得上”、“用得好”、“用得精”。

與此同時,聯(lián)想還與中國智能計算產(chǎn)業(yè)聯(lián)盟共同宣布,發(fā)起成立異構(gòu)智算產(chǎn)業(yè)生態(tài)聯(lián)盟,聯(lián)合產(chǎn)業(yè)頭部生態(tài)伙伴共建聯(lián)想萬全生態(tài),助力中國智算生態(tài)繁榮發(fā)展與創(chuàng)新。

毫無疑問,站在AI產(chǎn)業(yè)大變革的今天,聯(lián)想基于自身在數(shù)據(jù)中心基礎(chǔ)設(shè)施的持續(xù)的創(chuàng)新和投入,以及最佳實踐和經(jīng)驗,推出聯(lián)想萬全異構(gòu)智算平臺,并發(fā)起成立異構(gòu)智算產(chǎn)業(yè)生態(tài)聯(lián)盟,相信這將會進(jìn)一步釋放出異構(gòu)智算的“乘數(shù)效應(yīng)”,為千行百業(yè)創(chuàng)造出更多具有想象空間的新業(yè)態(tài)、新服務(wù)和新模式,激發(fā)更大的新質(zhì)生產(chǎn)力。

跨越智能算力“四座大山”

隨著大模型時代的到來,可以發(fā)現(xiàn)智能算力與產(chǎn)業(yè)的融合正變得越來越緊密,從智慧醫(yī)療,智慧金融,智慧城市再到無人駕駛等等,智能算力已經(jīng)開始滲透到千行百業(yè)的方方面面,推動著“算力基建化”的步伐。

也正因此,去年底國家六部門聯(lián)合印發(fā)的《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃》中,就提出到2025年,計算力方面,算力規(guī)模超過300 EFLOPS,其中智能算力占比要達(dá)到35%,這也代表著我國的算力產(chǎn)業(yè)步入了高速發(fā)展的新階段,智能算力更成為了數(shù)字經(jīng)濟(jì)“主航道”中最為核心的驅(qū)動力。

 

聯(lián)想集團(tuán)副總裁、中國基礎(chǔ)設(shè)施業(yè)務(wù)群總經(jīng)理陳振寬

 

在聯(lián)想集團(tuán)副總裁、中國基礎(chǔ)設(shè)施業(yè)務(wù)群總經(jīng)理陳振寬看來,智能算力的火爆背后,同樣也為數(shù)據(jù)中心基礎(chǔ)設(shè)施帶來了諸多的挑戰(zhàn),主要體現(xiàn)在以下幾個方面:

挑戰(zhàn)一,場景日益豐富,算力復(fù)雜多元,如何選擇和匹配合適的算力?目前已經(jīng)有五種以上主流算法框架和十種以上算子庫來支持不同的應(yīng)用場景。同時,不同類型的GPU、服務(wù)器、存儲和網(wǎng)絡(luò)組成了上百種不同的集群配置,特別是場景、算法和集群之間的選擇和驗證,不但技術(shù)繁雜而且周期長,這都給用戶帶來了極大的壓力。

挑戰(zhàn)二,從千卡到萬卡,如何減少故障恢復(fù)時間,提升集群的可用性?以千卡訓(xùn)練集群為例,目前千卡集群每月至少有15次的故障斷點,在常規(guī)的斷點續(xù)訓(xùn)手段下,每次恢復(fù)訓(xùn)練需要幾個小時,產(chǎn)生的額外費(fèi)用超過百萬元,而隨著AI集群規(guī)模從千卡到萬卡,故障中斷次數(shù)及恢復(fù)所需時間呈指數(shù)級增長。

 

挑戰(zhàn)三,智能算力基礎(chǔ)設(shè)施的建設(shè)成本極高,如何改善和最大化AI算力利用率?AI對算力的需求是無窮盡的,然而隨著集群集成的芯片越來越多,我們不得不應(yīng)對算法效率不高、計算資源不足、互聯(lián)帶寬受限等眾多技術(shù)挑戰(zhàn)。數(shù)據(jù)顯示,當(dāng)前業(yè)內(nèi)MFU(模型算力利用率)普遍在30%左右,頂尖的集群利用率也只能做到50%,因此這就需要行業(yè)突破和解決GPU卡利用率、集群通訊效率、AI故障恢復(fù)、算法匹配度等系統(tǒng)性問題。

挑戰(zhàn)四,在“雙碳”政策的驅(qū)動下,如何最大化提升數(shù)據(jù)中心的整體能效?一直以來,數(shù)據(jù)中心作為“能耗大戶”,其建設(shè)和發(fā)展過程中也帶來了巨大的能耗挑戰(zhàn)。特別是在當(dāng)前算力升級帶來的能耗“飆升”的情況下,如何通過先進(jìn)的散熱技術(shù),突破芯片在系統(tǒng)中的散熱瓶頸,同時提升能效,降低數(shù)據(jù)中心PUE將“刻不容緩”。

由此可見,由大模型興起所產(chǎn)生的巨量算力需求讓本就供需不平的算力產(chǎn)業(yè)結(jié)構(gòu)進(jìn)一步“承壓”,特別是如何跨越智能算力面臨的“四座大山”已成為整個業(yè)界的新挑戰(zhàn)和新課題。

夯實大模型時代“算力底座”

也正是洞察到這種變化和痛點,聯(lián)想正式發(fā)布集五大技術(shù)創(chuàng)新為一體的聯(lián)想萬全異構(gòu)智算平臺,該平臺可幫助行業(yè)用戶跨越智能算力面臨的重重挑戰(zhàn),真正讓千行百業(yè)在智能算力時代“用得上”、“用得好”、“用得精”,具體來看:

針對算力匹配方面,當(dāng)下異構(gòu)智算融合已是大勢所趨,一是CPU,GPU,DPU,NPU等處理器的異構(gòu);二是AI算力集群,科學(xué)計算集群和通用計算集群的異構(gòu),唯有做好異構(gòu)算力協(xié)同工作,才能有效支持復(fù)雜計算任務(wù)所需要的綜合計算。

 

而聯(lián)想萬全異構(gòu)智算平臺搭載的“多維智能算力匹配魔方”技術(shù),構(gòu)建了AI場景與算法與集群硬件三者匹配關(guān)系的算力魔方知識庫,可標(biāo)識AI場景、算法、集群配置這三者的匹配關(guān)系。更重要的是,“算力匹配魔方”可針對不同場景,可以全自動規(guī)劃和調(diào)度最佳算法和集群配置,用戶只需輸入場景和數(shù)據(jù),即可自動加載最優(yōu)算法和調(diào)度最佳集群配置,由此為用戶跳過繁雜的算力選擇和驗證。

提升算力利用率和可用性方面,在AI基礎(chǔ)設(shè)施中,要提高計算效率有兩大關(guān)鍵要素: 一是提升算力的利用率,二是讓算力持續(xù)可用。因此,在聯(lián)想萬全異構(gòu)智算平臺五大創(chuàng)新技術(shù)中,有四項都是聚焦在了提升算力利用率和可用性的算法創(chuàng)新上。

其中,GPU內(nèi)核態(tài)虛擬化算法技術(shù),由聯(lián)想研究院開發(fā)的GPU驅(qū)動層的內(nèi)核態(tài)虛擬化算法,可最大化挖掘處理器潛力,讓vGPU利用率從80%提升到95%;此外,聯(lián)想集合通信算法庫技術(shù),能夠自動感知集群網(wǎng)絡(luò)拓?fù)洌⑦x擇和采用經(jīng)聯(lián)想增強(qiáng)的集合通信算法使數(shù)據(jù)傳輸在最佳路徑。以千卡規(guī)模集群為例,采用集成了聯(lián)想集合通信庫的聯(lián)想萬全異構(gòu)智算平臺做管理調(diào)度,可使網(wǎng)絡(luò)通信效率提升超10%,并且集群規(guī)模越大,效果越顯著;而AI高效斷點續(xù)訓(xùn)技術(shù),其核心能力是“以AI預(yù)測AI”訓(xùn)練故障,在斷點前針對故障特征做優(yōu)化備份,在斷點后可極速恢復(fù)。以千卡訓(xùn)練集群為例,目前聯(lián)想能將斷點續(xù)訓(xùn)恢復(fù)時間縮減到分鐘級,不僅能夠大幅提升訓(xùn)練效率,還可以幫助用戶節(jié)省額外支出百萬元/月。

針對集群的調(diào)度管理,聯(lián)想萬全異構(gòu)智算平臺內(nèi)置了AI與HPC異構(gòu)集群超級調(diào)度器,這是破局算力孤島,打開集群共享之門的“關(guān)鍵鑰匙”,該“調(diào)度器”最為精髓之處就是做出能指揮雙類型調(diào)度的最精簡架構(gòu),在AI的K8S調(diào)度和HPC的Slurm調(diào)度之上,通過切換“語言”的方式分別指揮AI和HPC調(diào)度器,1小時內(nèi)自動完成跨集群的資源調(diào)度和共享,使得用戶可以充分利用基礎(chǔ)設(shè)施的每一分算力。

 

而面向未來,聯(lián)想也將挑戰(zhàn)超過萬卡規(guī)模集群的通訊算法優(yōu)化,挑戰(zhàn)秒級的斷點續(xù)訓(xùn),深入研究相變式液冷技術(shù),布局模塊化液冷數(shù)據(jù)中心,而這些核心技術(shù)創(chuàng)新,也將助力AI算力朝著更強(qiáng)大、更穩(wěn)定、更高效和更綠色的方向高質(zhì)量發(fā)展。

客觀地說,當(dāng)前業(yè)界各種智算平臺已經(jīng)對異構(gòu)算力的管理和調(diào)度開展了不同技術(shù)方向的探索,市場上有些不同的異構(gòu)智算管理平臺,但聯(lián)想萬全異構(gòu)智算平臺仍有三個獨特的優(yōu)勢:

得益于聯(lián)想在智算和超算領(lǐng)域的長期耕耘,其AI與HPC異構(gòu)集群超級調(diào)度器屬于業(yè)內(nèi)首創(chuàng),是聯(lián)想在異構(gòu)智算領(lǐng)域打造的“獨門秘籍”; 同時,聯(lián)想分鐘級斷點續(xù)訓(xùn)的故障預(yù)測機(jī)制,同樣也是歷經(jīng)多年研發(fā)的,是分鐘級斷點續(xù)訓(xùn)能夠?qū)崿F(xiàn)的關(guān)鍵技術(shù),同樣在業(yè)界是“獨一無二”的;不僅如此,相比市場上的其他異構(gòu)管理平臺,聯(lián)想萬全異構(gòu)智算平臺納管豐富的多的異構(gòu)生態(tài),和提供更深入全面的集群管理,這些關(guān)鍵技術(shù)的創(chuàng)新都為夯實大模型時代的“算力底座”提供了堅實的基礎(chǔ),背后也體現(xiàn)出了三重全新的價值。

一是,用得上,指的是聯(lián)想萬全異構(gòu)智算平臺將算力管理與調(diào)度,數(shù)據(jù)治理與模型優(yōu)化、訓(xùn)練精調(diào)和推理應(yīng)用開發(fā)等多層次的能力實現(xiàn)了全面集成,能夠向下納管豐富的算力生態(tài),向上對接為各類場景優(yōu)化的模型及AI工具集,因此可為用戶提供更簡單、更高效、更穩(wěn)定的算力體驗。

二是,用得好,如果我們從用戶視角出發(fā)來看,不論是模型開發(fā),推理服務(wù)開發(fā),還是AI應(yīng)用開發(fā),計算效率就是業(yè)務(wù)的根基,高效計算才能讓AI應(yīng)用的迭代部署跟上市場需求,才能控制業(yè)務(wù)TCO成本使AI創(chuàng)作的投入產(chǎn)出合理化。為此,聯(lián)想萬全異構(gòu)智算平臺始終將突破計算效率的瓶頸作為平臺持續(xù)追求的差異化價值。無論是GPU內(nèi)核態(tài)虛擬化算法技術(shù)、聯(lián)想集合通信算法庫技術(shù)還是異構(gòu)集群超級調(diào)度器等,核心都是最大化提升用戶的算力利用率和可用性,讓用戶“用得好”AI算力。

三是,用得精,則是聯(lián)想萬全異構(gòu)智算平臺不但打造了一個能夠高度自動化完成AI全流程開發(fā)的平臺,同時也是可輸出高可用算力并不斷突破計算效率瓶頸的利器,借助這個平臺,行業(yè)用戶可自動完成AI計算并發(fā)布模型或發(fā)布推理服務(wù)。同時,平臺也為專業(yè)的AI開發(fā)用戶留有手動深入調(diào)整計算過程的空間,包括工具和模型的選擇,算力配置的調(diào)整,對任務(wù)的定制化監(jiān)控等,這樣就能使得每種資源都能在最適合的任務(wù)上發(fā)揮最大效能,真正讓用戶可以更加“精細(xì)化”管理AI算力資源,進(jìn)一步實現(xiàn)“降本增效”的價值。

釋放異構(gòu)智算“乘數(shù)效應(yīng)”

值得一提的是,在本次聯(lián)想創(chuàng)新科技大會2024上,聯(lián)想還與中國智能計算產(chǎn)業(yè)聯(lián)盟共同宣布,發(fā)起成立異構(gòu)智算產(chǎn)業(yè)生態(tài)聯(lián)盟。據(jù)了解,異構(gòu)智算產(chǎn)業(yè)生態(tài)聯(lián)盟框架由AI芯片層、AI設(shè)備與系統(tǒng)層和AI平臺與應(yīng)用層,能夠?qū)崿F(xiàn)從IaaS平臺、AI訓(xùn)練與推理到行業(yè)場景解決方案的全覆蓋。

新車報道更多>>

iPhone面容解鎖不需要攝像頭:網(wǎng)友實測遮住前攝也能解鎖 小鵬新總部“航站樓”匯天全新展廳首次公開,陸空一體飛行汽車等集體亮相 AI推理性能大提升:華為UCM技術(shù)開源,系統(tǒng)吞吐猛增22倍 個個太有梗!網(wǎng)友在劉強(qiáng)東外賣留言板搞笑“整活”:求職嘮嗑許愿啥都有 英偉達(dá)H100剛上天 谷歌立馬官宣:2027年要將TPU送入太空 國首臺!極紫外波段物質(zhì)吸收譜臺式化儀器研制成功 史上最高41層垂直堆疊芯片面世:功耗僅傳統(tǒng)芯片千分之一,為后摩爾定律時代指明新路 更多西門子家電正陸續(xù)接入小米米家,澎湃智聯(lián)、超級小愛都能用 全球最大內(nèi)河萬噸級純電動運(yùn)輸船下水:2.4萬度電 續(xù)航500公里 任正非的會客廳,成了車圈“急診室” AI瀏覽器,谷歌比OpenAI就差個老板直播帶貨 高德“鷹眼守護(hù)”再進(jìn)化:不開導(dǎo)航也能預(yù)警前方危險 蘋果未來三年產(chǎn)品路線圖曝光:無邊框iPhone、大小折疊機(jī)即將登場 小米SU7車主提車一年狂跑21萬公里 直言沒出現(xiàn)任何問題 大眾安徽與眾06大量車主遇“充電難”:充電像開盲盒 全憑運(yùn)氣 Reddit起訴Perplexity,指控后者未經(jīng)授權(quán)為AI抓取和使用數(shù)據(jù) 明星吐了,購置稅要征了,新能源車懸了? 限時5.88萬元起,東風(fēng)奕派雙車上市:升級主打聽勸 方程豹三次轉(zhuǎn)型的背后:勇敢者的游戲 全新MG4出道即爆,從雙榜單看10萬級純電新標(biāo)桿 24.99萬起帶激光雷達(dá),傳祺向往M8宗師版上市,零重力座椅也配齊 嵐圖追光L對比現(xiàn)款追光,加長1厘米也叫L?這些配置大改 魏牌高山7售價28.58萬元,帶激光雷達(dá),比陸尚強(qiáng)? 212越野車爬坡翻車 北汽緊急澄清安全與品牌混淆難題待解 破產(chǎn)汽車的“重生”潮“破產(chǎn)者”的真實生命力如何? 阿維塔06新車、高溫與電池安全質(zhì)量的反思與改革 金標(biāo)大眾與眾07申報曝光 首搭中德聯(lián)合架構(gòu)智能化轉(zhuǎn)型加速 款極氪001內(nèi)飾公布 質(zhì)感和智能化升級能否帶動銷量提升? 全新凌渡L上市即“爆單” 助力凌渡家族9月訂單量達(dá)上個月近三倍 全新領(lǐng)克07 EM-P:給“有為青年”的智能混動車