“AI的iPhone時刻”,這句話,黃仁勳在2023春季GTC大會上強調了三遍。某種意義上,這句話背後隱藏的含義是:我們正進入一個新技術紀元。
黃仁勳 | 圖源:GTC 大會而它始於2022年:這一年,首先出現了圖像生成模型,包括DALL-E、MidJourney以及开源的Stable Diffusion,然後是ChatGPT,發布僅兩個月,用戶便已經突破1億,接着是文心一言、GPT-4、Microsoft 365 Copilot、Bard聊天機器人。毫無疑問,生成式AI領域的發展速度前所未見。
ChatGPT | 圖源:Unsplash這種快速發展的態勢不斷引發外界關注,而外界的持續關注又讓其熱度一直處於高位。通過GTC大會上演講的議題數量,我們可以一窺生成式AI的關注度。在GTC大會3天650場演講中,僅與生成式AI相關的演講就超過70場,甚至還有一場黃仁勳與OpenAI公司聯合創始人Ilya Sutskever的特別對話。
生成式AI的大贏家
不久前,A16Z在一篇名爲《生成式AI平台,誰主沉浮?》的文章中寫道,“迄今爲止,生成式AI領域最大的幕後玩家,可能是運行了絕大多數AI工作負載的英偉達。”
公开數據顯示,英偉達數據中心業務在2023年Q1正式超越遊戲業務成爲第一大業務。其2023財年Q3財報顯示,數據中心業務同比增長31%,達到38億美元,而遊戲業務收入下降51%至16億美元。自今年以來,英偉達股價漲幅已超80%。
無論是股價,還是數據中心業務的增長,英偉達的蓬勃發展與生成式AI的火熱密不可分。
因爲生成式AI中的近乎一切都會在某個時刻通過雲托管的GPU(TPU)。無論是對於訓練模型的模型提供商和科研實驗室、執行推理和微調任務的托管公司或是兩者兼顧的應用程序公司,算力都是生成式AI的命脈。
生成式AI的快速發展帶動了對算力需求急劇增長,尤其是大型語言模型(LLM)需要規模龐大的算力。
以GPT爲例,根據OpenAI公布的信息,GPT-1有1.17億個參數,GPT-2有15億個參數,而GPT-3則有1750億個參數。那么,訓練GPT-3需要多少算力?調研機構TrendForce在一份報告中提到,訓練GPT-3大概使用了20000個NVIDIA A100GPU算力,而ChatGPT商業化後所需的GPU數量將達到30000個以上。
而英偉達正好是AI算力的主要提供商。在數據中心GPU領域,英偉達市佔率常年穩定在80%附近。據Top500.Org數據顯示:英偉達GPU產品在全球Top 500超算中心的滲透率逐年提高,由2013 H1的72.2%提升至2021H2的90.3%,研究文獻中引用英偉達GPU的次數是頂級AI芯片初創公司總和的90倍。
由於人工智能領域的算力需求約每3.5個月翻一倍,所以導致英偉達芯片常年供不應求。
英偉達 H100 GPU | 圖源:GTC 大會本次GTC大會,有一半以上的內容跟ChatGPT和生成式AI有關。其中,爲滿足生成式AI和大語言模型的算力需求,英偉達發布了專注於ChatGPT的AI/GPU訓練和推理兩類新的芯片方案:
訓練方面:英偉達H100 GPU基於Hopper架構及其內置Transformer Engine,針對生成式AI、大語言模型和推薦系統的开發、訓練和部署進行優化,在大語言模型上比前代A100提供了快9倍的AI訓練、快30倍的AI推理。
英偉達四種配置的全新推理平台 | 圖源:GTC大會推理方面:英偉達推出全新GPU推理平台:四種配置(L4 Tensor Core GPU、L40 GPU、H100 NVL GPU、Grace Hopper 超級芯片)、一個體系架構、一個軟件棧,分別用於加速AI視頻、圖像生成、大型語言模型部署和推薦系統。
此外,英偉達還公布了DGX Cloud,聯合微軟Azure、Google Cloud和Oracle Cloud Infrastructure,將DGX AI超級計算機“通過瀏覽器引入每一家企業”。
綜上,我們可以看出,爲滿足業界當前急劇增長的算力需求,英偉達圍繞算力體系“各個出擊”,試圖構建一套包含硬件、軟件和雲服務的全方位解決方案。
英偉達押注未來,不止於AI
縱使如此,該方案依然存在不足,因爲AI、ChatGPT等大語言模型的處理能力受限於芯片有限的表面積。
量旋科技聯合創始人、資深科學家馮冠儒博士表示,經典計算以晶體管爲計算單元,通過提高芯片上的晶體管密度來提高算力,但晶體管的密度不能無限大,因此經典計算算力有限。而量子計算則可以利用量子疊加態來提供量子並行性,一次性完成所有計算,並從中舉出最優方案。
因此,量子計算將成爲重要的前沿科技之一,有望延續接近物理極限的摩爾定律繼續發展。
作爲全球主要的算力提供商之一,英偉達自然不會錯過量子計算。
NVIDIA DGX Quantum | 圖源:GTC 大會在GTC大會上,英偉達宣布的第一個全新產品就是與Quantum Machines合作的NVIDIA DGX Quantum。作爲全球首個GPU加速的量子計算系統,NVIDIA DGX Quantum將全球最強大的加速計算平台(由NVIDIA Grace Hopper超級芯片和CUDA Quantum开源編程模型實現)與全球最先進的量子控制平台OPX(由Quantum Machines提供)相結合。
據黃仁勳介紹,它可以實現GPU和量子處理單元(QPU)之間的亞微妙級延遲。
這種組合使研究人員能夠建立異常強大的應用,將量子計算與最先進的經典計算相結合,實現校准、控制、量子糾錯和混合算法。
並且,DGX Quantum還爲开發人員配備了統一軟件棧——混合GPU-Quantum編程模型NVIDIA CUDA Quantum。作爲一個混合型量子-經典計算平台,NVIDIA CUDA Quantum能在一個系統中整合和編程QPU、GPU 和 CPU。目前,它已經开源,爲开發者提供更多支持。
實際上,這並非英偉達首次涉足量子計算。早在2021年11月舉行的GTC大會上,英偉達推出用於加速量子計算的下一代SDK——cuQuantum,它能使大型量子電路的模擬速度大大加快,使量子研究人員能研究更廣闊的算法和應用空間。
之所以進入量子計算,或許是英偉達看到了混合量子-經典計算的機會。爲了在量子計算早期就發揮其作用,混合量子-經典計算應運而生,混合計算的優勢是大部分繁瑣的任務仍然交由經典計算處理,而量子計算僅處理器其擅長的任務。
爲此,英偉達在2022年7月發布了一個量子版本的統一計算平台QODA(Quantum Optimized Device Architecture,量子優化設備架構),用於加速人工智能、高性能計算、健康、金融和其他學科的量子研發突破。
QODA 旨在通過創建相幹的混合量子-經典編程模型,讓量子計算更易於訪問。作爲一個开放、統一的環境,QODA 適用於當今一些功能強大的計算機和量子處理器(QPU),將提高科學生產力,並實現量子研究的更大規模。
比如,利用 QODA,HPC 和 AI領域專家可以輕松地將量子計算添加到現有的應用程序中,利用當今的量子處理器,以及使用英偉達 DGX 系統和科學超級計算中心與公共雲中可用的大量英偉達 GPU 模擬未來量子機器。
寫在最後
無論是生成式 AI,還是量子計算,背後的關鍵因素都是算力。如今,算力早已融入人們的日常工作和生活,而人們對算力的需求也在不斷增長。作爲主要的算力提供商,英偉達自然成爲主要贏家。不過,其“野心”不止於此,通過押注量子計算,這表明英偉達不僅看好量子計算的未來發展,而且想在下一個時代(量子計算)延續優勢,爲用戶提供算力支持。
$英偉達(NASDAQ|NVDA)$
本文作者可以追加內容哦 !
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。
標題:從GTC大會看英偉達的野心:不止於AI
地址:https://www.breakthing.com/post/49464.html