華人內卷大模型
1年前


中國科技大廠都希望能早點拿到芯片。


文/何伊然

編輯/劉宇翔


北京時間3月23日晚間,TikTok CEO周受資出席了美國衆議院能源與商務委員會聽證會,聽證會持續了超過5個小時,周受資回答了來自美國議員們的多個尖銳問題。

那場聽證會備受全球矚目,某種程度上影響着TikTok的命運。但如此重要的聽證會,字節跳動創始人張一鳴卻“缺席”了。有圈內人告訴《最話》,當時張一鳴也在美國,但不是在華盛頓,而是在西海岸,幾乎與聽證會同一時間,張一鳴沒看直播,專心在挖角OpenAI的頂尖華人工程師,开出的價碼是“一億現金+股權”。

這則消息尚未交叉證實,也不清楚天價的價碼最後能否挖到心儀的工程師,但圈內人都知道張一鳴對生成式AI有多“癡迷”。

幾乎全世界的科技大廠都在重注生成式AI,不但頂尖工程師的價碼水漲船高,就連算力的底座GPU也供不應求。

今年3月,已經擁有超強算力的微軟宣布已幫助OpenAI建設了一個新計算中心,配置了數萬塊A100。5月,Google推出了一個擁有2.6萬塊H100的計算集群ComputeEngineA3,服務想自己訓練大模型的公司。在中國,國金證券根據產業鏈信息,字節跳動今年已訂購了超過10億美元的GPU,字節到貨和沒到貨的A100與H800預計有10萬塊。另一家大公司今年以來的訂單量也達到了萬卡級別,金額至少超過10億元。而騰訊發布的騰訊雲新版高性能計算服務中心也採用了上萬塊H800芯片。

這些GPU都來自英偉達。僅字節一家公司的採購量,可能會超過去年全年英偉達在中國銷售的商用GPU的總和。

AI大模型對於GPU芯片有着巨大需求,現在在行業內外,GPU等同於英偉達的觀念已經深入人心。在AI浪潮中,GPU行業逐步走向了“一超多強”格局。英偉達創始人、CEO黃仁勳贏麻了。

但有贏家就有輸家。遊戲時代,N卡與A卡孰優孰劣一直是玩家們爭吵不休的話題,而在AI時代,由美籍華裔蘇姿豐擔任的AMD卻似乎掉隊了,不但缺少對標產品,在股價上英偉達市值萬億美元,而AMD只有1760億美元,兩者差距巨大。

AMD就真的門庭冷落,再也沒機會了嗎?


01

反擊

“在大型語言模型的推動下,人工智能的市場機會越來越大,到2027年市場潛力可能從目前的300億美元增加到約1500億美元。”

當地時間6月13日,AMD在美國舊金山召开了2023年數據中心與人工智能技術新品發布會。

打扮幹練的蘇姿豐帶着自信的神情登台,一口氣介紹了多款新品。

在“蘇媽”平靜的臉色下,或許也有着對AMD未來發展的擔憂。

踩在生成式AI的大潮上,英偉達今年股價漲幅200%,是資本市場當紅香餑餑。相比之下,AMD同期漲幅僅爲英偉達的50%,雙方差距在半年時間被明顯拉大。

根據2023年一季度財報,AMD營收爲53.53億美元,同比下降9%,這是公司自2019年以來首次營收出現下滑。適用於PC產品的Ryzen處理器銷售額僅是2022年同期的三分之一,足以看出消費電子在近兩年的窘迫處境。AMD預計,第二季度營收約仍會有19%的同比下滑。

目前,AMD的業務分爲四大板塊:數據中心、客戶端、遊戲與嵌入式業務。數據中心包含AMD所有服務器相關收入;客戶端收入指的是台式機與個人電腦,曾是AMD最核心業務;遊戲板塊涉及GPU產品线,索尼和微軟的遊戲主機是其穩定客源;嵌入式業務主要由2020年收購的賽靈思業務线構成。

在消費電子大起大落後,AMD在近兩年旗幟鮮明地選擇了數據中心和嵌入式業務優先的战略,強調人工智能是公司 “最大、最具战略意義的長期增長機會”。

蘇姿豐介紹了“面向AI和高性能計算的全球首款 APU 加速器” MI300A,該產品將多個CPU、GPU和高帶寬內存封在一起。在GPU和CPU領域都是“二把交椅”的AMD充分利用自己雙邊優勢,搞起了互補开發。

根據芯片參數,該APU加速卡擁有13個小芯片,總共包含1460億個晶體管:24個Zen 4 CPU核心,1個CDNA 3圖形引擎和128GB HBM3內存。

本次發布會最重要的產品當屬AMD針對大語言模型發布的MI300A優化版本MI300X。 

“當你將MI300X與競爭對手進行比較時,你就能發現,MI300X提供了2.4倍的內存和1.6倍的內存帶寬,有了這些額外的內存容量,我們對LLM是有巨大優勢的,因爲可以直接在內存中運行更大的模型。”

作爲大模型的最佳算力發動機,GPU對生成式AI有着不可替代的支撐作用。目前,英偉達憑借83.7%的市佔率領跑GPU市場,A100芯片價格在近期節節攀升,產量上也供不應求。2023年第一季度,英偉達GPU出貨量下降了15.2%。

ChatGPT爆火後,行業內對GPU飛漲的價格充滿怨言。

OpenAI創始人山姆·奧爾特曼近期表示,降低成本是ChatGPT當前首要目標。奧爾特曼透露,受到GPU資源的限制才導致ChatGPT目前難以开放更長的上下文窗口、提供微調 API 等服務。他也承認,多數企業根本養不起大模型。

據報道,OpenAI已經花費了微軟雲超12億美元。由於將計算資源集中指出ChatGPT,微軟其他部門可以使用的服務器受到了限制。此外,GPU訓練大模型需要大量的電力來保證這些資源的供應,這就導致了GPU的高能耗,成爲了“電老虎”。

在國內市場,華爲、京東、百度的高管也都公开抱怨大模型訓練高達千萬元一次的訓練成本。

發布會上,蘇姿豐強調隨着AMD芯片上內存增加,开發者有望減少GPU使用數量,從而節省成本,這顯然迎合了市場的需求。

蘇姿豐特意在單個MI300X GPU演示運行了擁有400億個參數的Falcon-40B大型語言模型,並讓它當場實時創作了一首關於舊金山的詩歌。

“夢想之城,總是讓你渴望更多。”或許,蘇媽在用AI表達自己的心聲。據介紹,Instinct MI300X將在今年第三季度向部分用戶交付使用,第四季度正式面世。

現場,AMD請來了Meta等公司人高管現場“背書”,強調人工智能开發者使用免費工具有利於人工智能芯片從“單一主導廠商”轉向更多種方案。

AMD擺明了是想挖英偉達的牆角。


02

差距

不過,資本的走勢才是市場最真實的反饋。

發布會後,英偉達的市值仍保持上漲態勢,AMD反倒出現了小幅度下降。捂着不肯公布新款產品的定價,也沒有官宣合作大客戶,或許讓市場對AMD的雄偉藍圖難以充分信任。

在OpenAI的“帶貨”下,英偉達GPU已經和生成式AI深度綁定。龐大的前期投入帶來了過高的沉沒成本,多數企業很難切換到其他替換芯片產商。AMD即便能夠找到合作方搭建起基於AMD架構的大模型算力中心,以此打开新的市場,也很難更改多數公司已做出的決定。

在大模型專用GPU業務上,英偉達有着明顯先發優勢。從業人士普遍認爲,現有競爭對手短期內無法追趕英偉達的產品,即便在硬件上縮小了差距,但在軟件服務上也很難相提並論。

英偉達首席科學家戴維·柯克很早就意識到算力的潛力,堅持要把給遊戲業打造的3D繪圖渲染GPU算力變得通用化,使之轉變爲通用算力中心。

早在2007年,英偉達就推出了革命性的GPU統一計算平台CUDA,开始基於CUDA持續積累算法和軟件生態。等到深度學習算法流行之後,GPU取代了CPU,CUDA變得勢不可擋。

既然英偉達跑通了路徑,那么AMD也在復制這一路徑,提升自己的軟實力。

發布會上,AMD披露了全新升級版AI 軟件生態系統开發體系理念——Open(software approach)、Proven(AI capability)和Ready(support for AI models)。AMD現場展示了用於數據中心加速的軟件棧工具AMD ROCm系統。 該系統不僅兼容CUDA,更要打造成开放平台並完善生態。

2022年,AMD主管數據中心業務副總裁有些自嘲地承認,英偉達構建了豐富的軟件生態系統,在芯片領域做的很全面,AMD不可能復制英偉達的成功之道。

但蘇媽顯然不會放棄,“我們仍處於AI生命周期的非常非常早的階段!”

發布會上,蘇姿豐屢屢強調生成式AI給行業帶來的衝擊仍只是起步階段,各家企業仍處於調整期。當前的領先者不一定就是未來十年的領先者,帶領AMD不斷打仗、闖出新生之路的蘇媽,她說這番話還是有幾分說服力的。

五十四歲的蘇媽沒有休息的意思,爲了繼續復興AMD,她需要再贏一次。


03

賽跑

身爲AMD歷史上第一位女性CEO,蘇姿豐是一位非常成功的職業經理人。

擁有麻省理工的博士學位,先後當選美國國家工程院院士和美國藝術與科學院院士的“蘇媽”是一位不折不扣的“學霸+卷王”。

在她接任CEO職位的時候,AMD深陷泥潭之中,公司市值僅剩不到20億美元,外界一度認爲這家老牌企業將要不行了。

短短八年時間,通過擁抱遊戲主機廠商,和台積電开展深入合作,加碼研發投入,蘇姿豐用超強的執行力確保AMD每一款新品都能保質保量問世。與此同時,競爭對手英特爾卻屢屢跳票,AMD逆轉了不利形勢。

2022年初,AMD市值第一次超越了英特爾。不到十年,蘇姿豐帶領AMD市值翻了90倍,她也成爲世界上薪水最高的女性CEO。

國內外媒體常常將黃仁勳與蘇姿豐放在一起討論。

兩個人都是出生於中國台灣省台南地區的“60後”,都在幼年時代移民美國,都是常春藤名校畢業的工科生,都是工作中專攻研發創新的“拼命三郎”……還有消息稱,兩個人有遠親關系,從輩分上說,黃仁勳是蘇姿豐的表舅。

說起來也有趣,黃仁勳和AMD的緣分比蘇姿豐還悠久。1983年,黃仁勳大學畢業後的第一份工作就是在AMD擔任芯片設計師,在職期間還拿下了碩士學位。

這段經歷,黃仁勳提及的不多,只說是一段快樂的日子,離職後他從對技術的崇拜中走出來,更加意識到市場和管理的重要性。

雖然是同行,黃仁勳和蘇姿豐同台的次數極少,外界並不知道兩人的私交如何,但在商業場上,二人頻頻用溫和的言語上演針尖對麥芒的正面碰撞。

2019年初,黃仁勳調侃AMD推出Radeon VII顯卡不夠出色,說道,“這是一次奇怪的發布會,也許AMD的人今天起牀也是這么想的”。蘇姿豐則在採訪中回應稱:“我猜他應該還沒有見過這張卡吧!”

不知道黃仁勳會不會真正重視AMD的MI300X,但除了產品,無論是黃仁勳還是蘇姿豐都面臨着一個棘手的市場難題,那就是:他們的產品是否還能賣到世界第二大市場。

6月27日,有媒體報道“拜登政府考慮擴大對華芯片限制”,根據報道,“美國商務部最早將於7月要求停止向中國客戶提供英偉達和其他芯片公司生產的芯片產品。”

對此,英偉達首席財務官科萊特•克雷斯很快表態稱,雖然限制對華出口人工智能芯片不會立即產生重大影響,但這“將導致美國產業永久喪失機會”。他說,“從長遠來看,如果實施禁止向中國出售我們的數據中心圖形處理單元(GPU)的限制措施,將導致美國產業永久喪失在全球最大市場之一競爭和領先的機會,並對我們未來的業務和財務業績產生影響。”

去年9月,美國就曾要求英偉達停止對華出口兩款用於人工智能的頂級計算芯片。爲滿足出口管制規定,幾個月後,英偉達向中國市場推出了專門的“降級版”芯片。雖然這次美國尚未公布具體細節,但“延期豁免”應該是意料之中的事。

但無論如此,爲了建設大模型的算力底座,除了花費重金挖頂級人才,中國的科技大廠們都希望能早點拿到芯片,最壞的情況是:人才沒挖到,芯片也沒拿到,那么大模型競賽勝利的天平就傾斜到手裏已經有足夠多芯片的一方。

對於客戶的急需,英偉達、AMD估計不會視而不見,而會搶市場,如果英偉達的產能跟不上,AMD多少還是有些機會的。

這是黃仁勳和蘇姿豐又一次比拼執行力的時候。

追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:華人內卷大模型

地址:https://www.breakthing.com/post/73098.html