熱點丨GTC2023-黃仁勳:AI的iPhone時刻已經到來
1年前

聚焦:人工智能、芯片等行業

歡迎各位客官關注、轉發




前言

GTC 2023上,英偉達創始人兼CEO黃仁勳提出全新概念:[我們正處於AI的iPhone時刻。]

黃仁勳所謂AI的iPhone時刻,即AI技術正在迎來爆發式增長,將成爲數十年來最有前途的技術領域之一。

正如此前的互聯網一樣,生成式AI也將重塑每個行業。

作者 | 方文三 圖片來源 |  網 絡 

老黃向AI企業喊話:A100芯片是大模型必備

由OpenAI公司开發並風靡全球的對話機器人ChatGPT,其背後所依賴的GPT-3.5模型是在搭載英偉達A100芯片的計算系統上訓練而來的。

對於研究大型語言模型的公司來說,算力是其中最重要的一環,AI大模型的推理和訓練高度依賴英偉達的GPU芯片。

缺少芯片會導致算力不足,計算能力不足意味着無法處理龐大的模型和數據量,最終的結果是模型存在智商差距。

鑑於英偉達在高性能GPU方面的技術領先地位,一些雲計算專業人士認爲,1萬顆英偉達A100芯片是一個好的AI模型的算力門檻。

而微軟爲OpenAI構建的用於訓練其模型的AI超級計算機就配備了1萬顆英偉達的GPU芯片。

市場研究公司TrendForce在一份報告中計算得出,要處理1800億參數的GPT-3.5大型模型,需要的GPU芯片數量高達2萬顆,未來GPT大模型商業化所需的GPU芯片數量甚至會超過3萬顆。

據英偉達官方介紹,用8000片A100芯片訓練具有3950億個參數的多專家模型(MoE)需要7天,但使用8000片H100芯片可以將訓練時間縮短到20小時,速度提升9倍。

換言之,H100將大語言模型的處理成本降低了一個量級。

在GTC大會上,英偉達還發布了全新的GPU推理平台,包括4種不同配置,針對不同工作負載進行優化。

分別對應了AI視頻加速、圖像生成加速、大語言模型(LLM)加速和推薦系統和LLM數據庫,包括L4 Tensor Core GPU、L40 GPU、H100 NVL GPU和Grace Hopper超級芯片。

GPU通用計算加速的又一方向

黃仁勳帶來的另一項革命性技術,也關乎英偉達自身的產品研發,是一項聚焦先進芯片設計制造的技術:英偉達cuLitho計算光刻庫。

它可以通過計算技術大幅優化芯片制造流程,利用GPU技術實現計算光刻,可以使傳統光刻技術提速40倍以上,爲2nm及更先進芯片的生產提供助力。

按照過去15年的趨勢,如果某個foundry(集成電路代工廠)現有3座數據中心,那么未來10年內就要100座這樣的數據中心。

功耗方面,45兆瓦可能還能接受,但如果是45千兆瓦,問題就比較大了。

包含於計算光刻中的OPC(光學臨近效應修正)含有大量矩陣乘法運算,這種運算很適用於GPU加速。

計算光刻也是GPU通用計算加速的某個應用方向,站在這個角度看,就不難理解英偉達發布cuLith加速庫了。

借助cuLitho,台積電可以縮短原型周期時間,提高晶圓產量,減少芯片制造過程中的能耗,並爲2nm及以上的生產做好准備。

台積電將於6月开始對cuLitho進行生產資格認證,並會在2024年對2納米制程开始風險性試產,2025年开始量產。

算力雲化趨勢不改

雲計算實現了計算的服務化,而AI對算力的需求更大,巨量的雲端算力勢在必行。

硬件廠商的AIGC軟硬結合生態初顯雛形,公司預計英偉達 DGX Cloud有望通過雲端服務加速強算力硬件及AI應用軟件向下遊商業公司滲透。

英偉達 DGX Cloud是一項人工智能超級計算服務,它可以讓企業快速訪問爲生成式人工智能和其他开創性應用訓練高級模型所需的基礎設施和軟件。

英偉達 DGX Cloud提供英偉達 DGX AI超級計算專用集群,每個DGX Cloud中都集成了8個英偉達 H100或A100 80GB Tensor Core的GPU,每個節點合計有640GB的GPU,這個巨大的GPU可以滿足高級AI訓練的性能要求。

押注未來,不止AI

經典計算以晶體管爲計算單元,通過提高芯片上的晶體管密度來提高算力,但晶體管的密度不能無限大,因此經典計算算力有限。

而量子計算則可以利用量子疊加態來提供量子並行性,一次性完成所有計算,並從中舉出最優方案。

英偉達 DGX Quantum是全球首個GPU加速的量子計算系統,可以實現GPU和量子處理單元(QPU)之間的亞微秒級延遲。

該產品結合了通用量子控制系統Quantum Machines OPX+和英偉達 Grace Hopper超級芯片,這個平台可以爲高性能和低延遲量子經典計算的研究人員提供了一種革命性的新架構。

這是首個結合GPU和量子計算的系統,其中最主要的是H100 NVL,它將英偉達的兩個H100 GPU拼接在一起,以部署像ChatGPT這樣的大型語言模型(LLM)。

與前者相比,現在一台搭載四對H100和雙NVLINK的標准服務器速度能快10倍,可以將大語言模型的處理成本降低一個數量級。 英偉達靠AI賺得盆滿鉢滿

1993年創立的英偉達發明了全球第一塊GPU,人們當時想不到,它在2016年之後促使人工智能發生了飛躍性的變化。

在OpenAI的ChatGPT與谷歌的Bard爭得不可开交的情況下,作爲AI淘金潮中的賣水工,英偉達可謂是賺得盆滿鉢滿。

生成式AI的快速發展帶動了對算力需求急劇增長,尤其是大型語言模型(LLM)需要規模龐大的算力。

而英偉達正好是AI算力的主要提供商。在數據中心GPU領域,英偉達市佔率常年穩定在80%附近。

由於人工智能領域的算力需求約每3.5個月翻一倍,所以導致英偉達芯片常年供不應求。

英偉達數據中心業務在2022年第四季度爲公司帶來了60.5億美元的收入中的36.2億美元。

這也意味着,提供A100等芯片的數據中心業務已經在上個季度爲英偉達貢獻了近六成的收入,與此同時,英偉達股價今年以來更是狂漲79%。

英偉達最新股價截圖,截至最新收盤總市值6471億美元。

公开數據顯示,英偉達數據中心業務在2023年Q1正式超越遊戲業務成爲第一大業務。

其2023財年Q3財報顯示,數據中心業務同比增長31%,達到38億美元,而遊戲業務收入下降51%至16億美元。

自今年以來,英偉達股價漲幅已超80%。

結尾:

水瓶座的黃仁勳善於解決問題並擁有獨特的洞察力,能夠看到問題的本質,從而找到創新的解決方案。

這種創新精神使得水瓶座的人在科技行業表現出色,具有的獨特思維方式和領導能力,將英偉達帶來了新的創新和發展機遇。

今年以來,量子計算+人工智能的交叉研究越來越多,隨着英偉達此次在GTC大會上更新GPU、入局量子計算,二者融合將進一步加快。

不過,其野心不止於此,通過押注量子計算,這表明英偉達不僅看好量子計算的未來發展,而且想在下一個量子計算時代延續優勢,爲用戶提供算力支持。

部分資料參考:中國經營報:《黃仁勳提AI“iPhone時刻” 欲推計算光刻革命?》,騰訊科技:《人工智能貫穿GTC2023全場,英偉達新顯卡爲ChatGPT提速10倍》




END



追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:熱點丨GTC2023-黃仁勳:AI的iPhone時刻已經到來

地址:https://www.breakthing.com/post/50264.html