高溫考驗+算力需求,英偉達被"液冷"卡脖子
1年前

昨晚英偉達收漲461.83美元,再一次刷新歷史最高價,年內漲幅高達214.6%,在美股的一衆頂級科技股中獨佔鰲頭,成爲又一只萬億市值的科技巨頭。 

與此同時,從今年2月开始,中國台灣廠商AVC和雙鴻(AURAS)股價一路飆升,兩家公司的股價較4個月前均實現翻倍,顯然不是巧合。 

AVC是全球最大散熱模組廠商,也是英偉達AI服務器系統DGX H100目前的風冷散熱系統供應商,雙鴻則是Supermicro(超微電腦)服務器散熱系統的供應商。

 兩者都是和英偉達有着密切的關系,屬於一人得道雞犬升天的典型案例。 

由於AI帶來的數據量和計算量的爆發增長逐漸從幕後走向台前,未來兩年,AI行業中可能會出現算力被散熱“卡脖子”的情況。

 也許AI的盡頭是散熱。 

一、散熱是制約計算能力的最大阻礙之一 

當電流通過電阻時,所消耗的電能會全部轉化爲熱能,這種現象被稱爲電流的熱效應,自計算機誕生以來,從業者們用盡辦法將電子器件的溫度控制在合理的範圍內。

 從早期計算機誕生开始,由於早期的計算機功耗較低,而且整機體積較大,因此不需要單獨設計系統級的散熱解決方案,通常做法就是在計算機背部放置個簡易的風扇,以將熱流導出。 

隨着芯片制程技術的提升,芯片功能的集成化加速,輕巧、方便、處理性能強的發展模式逐漸佔據市場主流。高頻計算不僅僅帶來了高能量的消耗,同時也帶來了各種發熱、散熱的現實問題。 

7月4日,世界氣象組織宣布,熱帶太平洋再次形成厄爾尼諾條件,這可能導致全球氣溫飆升、破壞性天氣和氣候模式的出現。近年來,隨着全球溫度持續升高,數據中心在極端高溫下突發故障的現象已不鮮見。無獨有偶,近日中央氣象台持續發布高溫橙色預警,多省份局地溫度達40℃以上。持續高溫下,數據中心的散熱問題受到各方關注。去年夏天,在高溫的衝擊下,谷歌、甲骨文等科技巨頭的數據中心一度出現冷卻系統癱瘓,導致運行故障。前車之鑑歷歷在目,國內數據中心將如何迎接“烤”驗? 

傳統的服務器散熱方案與計算機散熱原理大致相同,區別在於服務器所使用的算力芯片由於能耗較高,往往將芯片級散熱系統作爲重點,通常來說就是將芯片熱量通過熱管、均熱片等傳導到多褶結構的散熱鰭片上,再通過風扇進行主動散熱。 

進入AI時代之後,高性能AI芯片的功耗在隨着算力同步大幅提升。10年前市面上能买到的最頂級的數據中心GPU是英偉達K40,其熱設計功耗(TDP)爲235W,2020年英偉達發布A100時,熱設計功耗接近400W,到了最新的H100芯片,熱設計功耗直接飆升到700W。預計明年單顆高性能AI芯片的熱設計功耗將會突破1000W。 

通過風冷式散熱方式明顯顯得力不從心。 

二、液冷將成爲AI時代的無二選擇 

AI的快速發展對於算力的需求和耗電量的提高,推動數據中心規模擴大、功率提高,使得液冷溫控技術成爲發展趨勢,進而冷卻液產品需求增加。根據PMR對直接數據中心液冷市場的預估,2022-2032年市場需求將快速增長,復合年增長率爲25.8%。 

今年6月,中國移動、中國電信、中國聯通共同發布的《電信運營商液冷技術白皮書》,當前,單相浸沒式液冷、冷板式液冷爲液冷技術的主要形式。浸沒式液冷是服務器完全浸入冷卻液中,全部發熱元件熱量直接傳遞給冷卻液,通過冷卻液循環流動或蒸發冷凝相變進行散熱的一種方式。冷板式液冷是服務器芯片等高發熱元件的熱量通過冷板間接傳遞給液體進行散熱,低發熱元件仍通過風冷散熱的一種方式。 

據IDC預計,2021-2026年,我國智能算力規模年復合增速達52.3%,隨之將帶來數據中心單機功率密度提升與能耗攀升,傳統的風冷已無法滿足日益增長的散熱需求,液冷技術重要性進一步凸顯。據《中國液冷數據中心發展白皮書》,預計到2025年,我國液冷數據中心市場規模超過1200億元。

目前單張 A100 功率達 400W,H100 達 700W,未來芯片制程難以提升的情況下,效能功耗比難以進步,單卡功率將只增不減。英偉達明確未來逐步切換液冷方案以適配 HGX 平台。Supermicro 推出適配英偉達 HGX H100 的液冷服務器方案。據 Supermicro 數據,使用液冷可以幫助 IDC 節省 40%的電力。 

三、多渠道發展,液冷技術提升加速 

根據接觸方式的不同,液冷可分爲間接接觸型(冷板式液冷)和直接接觸型液冷(浸沒式液冷和噴淋式液冷) 

冷板式液冷:將液冷冷板固定在服務器的主要發熱器件上,通過液體流經冷板帶走熱量,從而散熱。

該技術發展較早,成熟度較高,應用較爲廣泛,具有商用基礎,但是存在漏液和成本偏高的問題。

浸沒式液冷:將發熱元件直接浸沒在冷卻液中,通過冷卻液循環帶走服務器等設備運行產生的熱量,主要分爲單相和相變技術。

該技術需要全新的數據中心設計方案,需要特殊化定制和設計IT設備,成本較高,目前尚不能大規模應用,未來發展前景較好。

噴淋式液冷:在機箱頂部儲液和开孔,對發熱體噴淋冷卻液,從而達到降溫。降溫過程中,可能會出現冷卻液飄溢問題,會影響機房及設備環境。

根據《綠色高能效數據中心散熱冷卻技術研究現狀及發展趨勢》,我國數據中心約有45%的能耗用於IT設備,43%用於散熱冷卻設備。 

目前數據中心冷卻仍以風冷爲主,但隨着數據中心數量增加、大型機架佔比提升,數據中心高耗電的問題已不容忽視,政策對於PUE的要求也日趨嚴格,液冷逐步成爲冷卻重要方案之一。

 四、相關個股匯總 

高瀾股份300499:公司服務器液冷業務擁有三種解決方案:冷板式液冷、浸沒式液冷和集裝箱式液冷,可有效降低大型數據中心的PUE(數據中心總設備能耗/IT設備能耗)。

中石科技300684:公司宜興子公司主營產品包括液冷模組等,建立相關技術儲備和產品线,爲國內外多家服務器企業提供液冷等全方位的管理綜合解決方案。

英特科技301399:公司產品包括液冷散熱器,直冷式液冷散熱器應用在大數據中心。

同星科技301252:公司液冷相關產品有應用於數據中心及液冷服務器。 

科華數據002335:目前公司自主研發的液冷技術已運用在公司數據中心及儲能產品、解決方案中。領先的產品和技術是公司的長期核心競爭力,公司持續跟進客戶的技術產品需求,做好相關技術儲備,保持自身技術的領先性。 

精研科技300709:公司可爲消費電子、通信、激光投影、服務器等領域客戶提供風冷模組、液冷模組、液冷板以及模組子件熱管、VC等散熱部品。

4月26日,公司公告稱擬與王明喜等共同設立江蘇精研熱能管理有限公司。精研熱能注冊資本爲3000萬元人民幣,其中公司擬以貨幣資金出資2460萬元,佔注冊資本的82%。合資公司擬开展的業務主要爲散熱模組類產品。在人工智能大發展的背景下,高功耗的設備(如5G基站、服務器)、數據中心、人工智能設備等均需要高效、穩定的散熱方案以減少能耗、保證設備的性能和壽命。

鴻富瀚301086:子公司梅州鴻富瀚的液冷散熱產品可以應用於服務器。 

作者:句號

追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:高溫考驗+算力需求,英偉達被"液冷"卡脖子

地址:https://www.breakthing.com/post/78122.html