AI大模型時代啓幕 ChatGPT爆火將算力底座玩家聯想推至台前
1年前

從ChatGPT走紅到GPT-4降臨,人工智能技術大突變將整個世界迅速帶入算力時代。

算力,即對數據的處理能力,如果說數據是AI模型的“燃油”,那算力就是AI模型的“發動機”。目前AI算力已進入大模型時代,大模型的實現更需要強大的算力來支撐訓練和推理過程。在國內,以全球最重要的算力公司之一、算力基礎設施供應商聯想集團爲代表的“算力賣水人”,成爲算力生態鏈的重要玩家,同時爲科技進步和數字經濟發展以及綜合國力提升貢獻算力战略資源。

 

大模型盡頭是算力

據OpenAI的相關論文透露,ChatGPT的前身GPT-3就使用了3000億單詞、超過40T的大規模、高質量數據進行訓練。ChatGPT在其基礎上設有1750億參數,訓練集“投喂”了總計約320TB的文字信息,涵蓋超4000億詞和約31億個網頁。

並且,ChatGPT加入了人工打標的監督學習,即對話式模型給出結果後,由訓練師對結果做出評價並修改結果以更貼切對話內容。數據維度越多,模型參數量越多,模型越復雜,模型的准確度越高,對算力的指數需求越高。

同時在模型訓練方面,ChatGPT底層技術使用了強大的Transformer 算法,Transformer強於RNN等算法的原因是它添加了注意力機制,Transformer的綜合特徵提取能力、遠距離特徵捕獲能力、語義特徵提取能力,全部明顯增強。

因此,ChatGPT的總算力消耗約爲3640PFdays(即假如每秒計算一千萬億次,需要計算3640天),需要7-8個投資規模30億、算力500P的數據中心支撐運行。微軟專門爲Open AI打造了一台E級超級計算機,用來在Azure公有雲上訓練超大規模的人工智能模型。這台超級計算機擁有28.5萬個CPU核心,超過1萬顆GPU。

據OpenAI測算,自2012年以來,全球頭部AI模型訓練算力需求3-4個月翻一番,每年頭部訓練模型所需算力增長幅度高達10倍。

與僅能處理NLP的GPT-3.5相比,支持多模態的GPT-4能夠同時處理圖像及文本輸入,並生成文本輸出。GPT-4可以完成一些傳統的視覺語言任務,如圖像描述、生成字幕、圖像分類等;此外,它還具有較強的邏輯分析能力。GPT-4在完成這一系列更爲豐富和復雜的任務的同時,其對算力的需求也達到GPT3.0的數倍。

 

AI應用底座是算力基礎設施

ChatGPT帶來驚豔的背後,是大語言模型的功勞。目前國內算力玩家大概分成兩類,一類是以百度ERNIE、騰訊混元、京東ChatJD、華爲盤古、阿裏、字節跳動、科大訊飛等各行業領先公司,走的是ChatGPT這種生成式大模型路线;另一類是以聯想集團、浪潮信息等爲代表的算力基礎設施提供商,以“算力賣水人”的身份爲更多的AI場景落地提供保障。

而實際上,第一類走生成式大模型路线的算力玩家,在用算法、數據、算力三大要素訓練大模型時,也離不开聯想集團等基礎設施提供商的算力支撐。

經過多年的轉型發展和技術沉澱,聯想已經成爲全球領先的高性能計算解決方案提供商與智能基礎設施提供商。公司早在2017年就提出“智能化”轉型,2018年,董事長楊元慶提出了“端-邊-雲-網-智”技術架構與“硬件+軟件+服務”的商業模式。在接下來的幾年時間裏,聯想投入重金打造了智能基礎設施及數字底座,升級邊雲網基礎設施,建設了支撐數據智能的敏捷柔性技術中台,同時構建了包含智能供應鏈、智能營銷、智能銷售、智慧客服等能力的業務中台。

2021年4月,聯想集團將智能基礎設施這塊業務升級獨立出來,成立了新的基礎設施方案業務集團,即ISG,並明確了“新IT”的概念,即從Information Technology 到 Intelligent Transformation,基於“端-邊-雲-網-智”技術架構賦能各行各業,實現智能化變革所需要的技術、服務與解決方案。

值得注意的是,ISG業務提供的正是給ChatGPT這樣的AI模型應用所需的算力,聯想集團在多年前就已經意識到了數智化時代的核心就是算力,算力就是生產力,並爲此進行了大量的布局,現在回過頭來看,聯想集團早在AI算力革命到來之前就做好了提前布局和卡位。

如今,憑借着在服務器、存儲、高性能計算、雲邊計算等領域的深厚積累,以及包括AI服務器在內端到端的全棧型基礎設施產品,聯想集團已經身爲行業領先的“算力賣水人”。

服務器是算力輸出的重要載體,聯想目前也已成爲全球三大服務器供應商之一,擁有多種高密度存儲、人工智能負載優化的服務器產品。自2001年以來,聯想共創下800余項性能基准測試世界紀錄,是創造服務器世界紀錄數量最多的IT廠商;截至2022年12月1日,聯想保持着294項世界紀錄。

此外,聯想集團目前已擁有橫跨公有雲、私有雲和混合雲的交付能力,可以爲多種算力需求客戶提供更“普慧”的算力產品。並在異構計算與負載均衡、設備之間的互聯互通、數據安全與隱私保護、模型本身的伸縮性與擴展性等方面有長期且深厚的技術積累。

在2022年11月最新的全球HPC Green500榜單上,聯想集團交付的Henri系統以每瓦特電力消耗可執行65.091億次浮點運算的認證性能,成爲全球最節能的高性能計算系統。在最新公布的全球HPC TOP500榜單中,聯想以入圍160套、獨佔32%的份額,連續第10次蟬聯冠軍。

 

數字經濟時代,算力即國力

中國信通院對全球47個國家測算得出,2020年數字經濟增加值總規模達到 32.6 萬億美元。同年,中國數字經濟規模達到39.2萬億元,佔GDP比重38.6%,預計2022年這一比重有望升至41%。

在數字經濟加速發展的時代背景下,全球數據總量和算力規模呈現高速增長態勢。2021年我國算力產業規模達到2.6萬億元,直接和間接分別帶動經濟總產出2.2萬億和8.2萬億。在ChatGPT熱點持續發酵下,高算力需求快速增長,從需求層面看,2022年我國智能算力規模達到268百億億次/秒(EFLOPS),超過通用算力規模,未來5年我國智算規模年均復合增長達52.3%。

繼熱力、電力之後,數字時代算力成爲新的核心生產力,以算力爲核心的數字信息基礎設施已成爲國家战略性布局的關鍵組成部分。2020年4月,國家發改委就對“新基建”的含義首次進行闡釋,並將數據中心、智能計算中心爲代表的算力基礎設施列爲信息基礎設施。

在未來的大國競爭中,算力之強弱將直接深度影響到新技術的研發效率和研發成果。算力能幫助海量的數據搭建起精確的AI模型,並對其進行復雜的模擬訓練。可以說,算力是數字經濟時代最底層的驅動器,無人駕駛、智慧城市、智能交通、智慧金融、仿生科技、生命醫學、氣候預測以及農業精細化等,都離不开超大算力。以聯想集團爲代表的算力基礎設施供應商正在爲大國科技战略提供至關重要的算力战略資源。


追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:AI大模型時代啓幕 ChatGPT爆火將算力底座玩家聯想推至台前

地址:https://www.breakthing.com/post/48449.html