半導體行業觀察 英偉達
2年前

轉載 周期人

三年前,在一場名爲“固態電路大會”的芯片設計師會議上,我(本文作者)與 Facebook 或Meta的人工智能負責人Yann LeCun進行了交談。LeCun 當時正在向芯片設計人員發表主題演講,討論他們應該如何考慮讓他們的芯片能夠更好地處理 AI 程序,特別是 LeCun 幫助开創的深度學習版本。

當 LeCun 完成他的主題演講並且我們在後台接受ZDNet 採訪時,他提出的觀點之一是 Meta 和其他所有人都需要一個替代Nvidia的公司,因爲該公司的芯片已經連續十多年佔領機器學習的主導地位。

他說,不管怎樣,我們都需要打破這種局面,或者 Meta 將構建自己的芯片,類似於Alphabet的谷歌如何構建自己的“TPU”芯片來處理 AI。

“換句話說,我們需要的是目前佔主導地位的供應商的競爭對手,”LeCun 說,暗指英偉達。

“可能不是因爲他們不擅長,而是因爲他們做出了假設,如果有一套不同的硬件做出不同的假設,可以用來補充當前 GPU 擅長的東西,那就太好了,”值得一提,圖形處理單元是由英偉達首創。

事實證明,這兩種選擇都沒有實現。LeCun 顯然沒有制造自己的芯片,而且他仍然沒有 Nvidia 的替代供應商。

周一,Meta宣布了其所謂的AI Research SuperCluster或“RSC”,這是一款致力於爲 LeCun 和他的團隊所做研究提供動能的超級計算機。該機器包含 6,080 個 Nvidia 的“A100”GPU 芯片,這是其當前的頂級部件。

Meta 的 AI 負責人、工程先驅 Yann LeCun 一直很清楚需要 Nvidia 的替代品,但顯然,他一直找不到任何替代品。

這就是當今人工智能的趨勢:越來越大的計算機來處理越來越大的神經網絡。LeCun 和他的同事告訴全世界事情就是這樣發展的,而 Nvidia告訴全世界他們將成爲實現這一目標的最優選擇。

顯然,這對 Nvidia 來說是一個巨大的勝利,擁有巨大的吹噓權,因爲 Meta 將該系統稱爲“當今運行的最快的 AI 超級計算機之一”,並承諾“當它完全建成後,它將成爲世界上最快的 AI 超級計算機” 2022 年年中。”

這也是Pure Storage的一大勝利,它提供了所有基於閃存的存儲,價值近 200 PB(1 PB 等於一千萬億字節)。

哦,這也是我本月早些時候採訪的一家公司Smart Global的一大勝利。Smart 的Penguin Computing部門生產高性能計算機,也爲 RSC 銷售了幾台機器。

真的,對於英偉達來說,這不僅僅是一場勝利,它是一個鮮明的例子,說明在一些公司投資的規模上,英偉達根本沒有競爭對手。

盡管英偉達唯一的公开 GPU 競爭對手Advanced Micro Devices銷售內置於許多超級計算機中的出色 GPU 芯片,但事實並非如此。

盡管有許多有價值的競爭對手是初創公司,但這種缺乏有意義的反對也是如此,他們推出了令人驚嘆的芯片和致力於人工智能的整個計算機系統,包括Cerebras SystemsSambaNovaGraphcore。在我們說話的時候,還有更多的人正在接受資助。

盡管 Meta 等公司渴望另一種選擇,但他們都無法打破這些公司的購买習慣。在某些情況下,這些公司已經籤下了知名客戶。例如,Cerebras與GlaxoSmithKline等公司取得了重大勝利,這些客戶正在使用該機器進行強化研究,從而產生了原創性發現。迄今爲止,這種孤立的勝利並沒有扭轉英偉達的局面。他們是證明規則的例外。

盡管 Graphcore 等公司在某些情況下愿意在選擇的性能基准測試上與 Nvidia 匹敵,但仍缺乏替代方案。

由於外界對我們任何人都不完全清楚的原因(我最近沒有就此事與 LeCun 談過),像 Meta 這樣的公司最好的選擇仍然是現任者 Nvidia。

我們可以推測,我建議系統擴展到 6,080 個 GPU 以構建世界上最大的 AI 計算機的能力,目前超過了任何新貴在特定用例中在性能或性能方面所能提供的任何優勢。效率。(我假設金錢不是 Meta 的對象,盡管這可能是錯誤的。)

英偉達的首席執行官黃仁勳(中)放棄了與英特爾的競爭,因爲後者顯然勢不可擋。他現在可能認爲其他人應該效仿他,放棄與英偉達的對抗。

正如 LeCun 所指出的,GPU 在 AI 處理方面有其局限性,但如果你想要在一種巨大的計算牆中堆疊最多數量的磚塊,它是一塊非常有用的磚塊。

一個重要的細節是,英偉達在 2020 年收購 Mellanox 時從Mellanox那裏獲得的資產被證明是一種將許多芯片連接在一起的重要方式。Meta 也在其新聞稿中突出提到了連接性。

一年回報。

英偉達的首席執行官黃仁勳本人可以提供更簡潔的解釋,他是個直言不諱的人。2015 年,在 Nvidia 於 AI 領域佔據主導地位的曙光之際,該公司正在逐漸放棄推翻英特爾在服務器微處理器業務上的控制權。在那年的 CES 上,我問黃爲什么他推翻英特爾的战鬥沒有成功。他的回答很有啓發性。

“我認爲英特爾在提高至強的性能方面做得非常好,”英特爾的主要服務器芯片,這是黃的回應。“我認爲英特爾已經取得了很大進步。”

換句話說,老牌英特爾只是保持足夠好,以至於來自挑战者的替代品沒有優勢。有人想知道英偉達在人工智能大战中是否也是如此。只要領先品牌不斷進步,沒有什么好到可以推翻領先品牌的。

人工智能領域可能還需要替代品。深度學習的基礎可能會發生巨大變化。LeCun 本人曾建議,未來的道路涉及神經網絡,這些網絡消除了他們今天使用的數十億“參數”,從而產生了完全不同的東西,他稱之爲“基於能量的學習”。

目前,主導地位屬於英偉達。問題是,世界上有多少其他公司像 Meta 那樣認輸,與現任者並駕齊驅,而不是尋找替代品。

除了這些其他初創公司獲得英偉達之外,還有什么可能改變?我一直認爲, Nvidia 面臨的主要挑战一直是RISC-V开源芯片運動。它仍然可能產生影響。並且也許 AMD 在銷售用於 AI 的 GPU 方面會變得更強大,以對抗 Nvidia。

我建議作爲一種非常非常外部的可能性,Meta 可以使用所有這些 GPU 來設計下一個偉大的內部芯片,就像谷歌的 TPU 一樣。畢竟,谷歌已經展示了使用深度學習設計芯片的方法。就好像 LeCun 只是在使用 Nvidia 來實現他對定制 Meta 芯片的夢想。

這種前景更像是希望外星人到達地球以解決氣候變化問題。

目前,Meta 正在計劃更多的是 Nvidia。據介紹,RSC 的“第二階段”將“將 GPU 的數量從 6,080 個增加到 16,000 個,這將使 AI 訓練性能提高 2.5 倍以上。”

Nvidia 股價最近爲 223.24 美元,自年初以來下跌了 24%,在過去 12 個月中上漲了 60%。


追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:半導體行業觀察 英偉達

地址:https://www.breakthing.com/post/2394.html