從GTC大會看英偉達的野心：不止於AI

相關報導

泡沫玩家

從GTC大會看英偉達的野心：不止於AI

1年前

從GTC大會看英偉達的野心：不止於AI

“AI的iPhone時刻”，這句話，黃仁勳在2023春季GTC大會上強調了三遍。某種意義上，這句話背後隱藏的含義是：我們正進入一個新技術紀元。

黃仁勳 | 圖源：GTC 大會

而它始於2022年：這一年，首先出現了圖像生成模型，包括DALL-E、MidJourney以及开源的Stable Diffusion，然後是ChatGPT，發布僅兩個月，用戶便已經突破1億，接着是文心一言、GPT-4、Microsoft 365 Copilot、Bard聊天機器人。毫無疑問，生成式AI領域的發展速度前所未見。

ChatGPT | 圖源：Unsplash

這種快速發展的態勢不斷引發外界關注，而外界的持續關注又讓其熱度一直處於高位。通過GTC大會上演講的議題數量，我們可以一窺生成式AI的關注度。在GTC大會3天650場演講中，僅與生成式AI相關的演講就超過70場，甚至還有一場黃仁勳與OpenAI公司聯合創始人Ilya Sutskever的特別對話。

生成式AI的大贏家

不久前，A16Z在一篇名爲《生成式AI平台，誰主沉浮？》的文章中寫道，“迄今爲止，生成式AI領域最大的幕後玩家，可能是運行了絕大多數AI工作負載的英偉達。”

公开數據顯示，英偉達數據中心業務在2023年Q1正式超越遊戲業務成爲第一大業務。其2023財年Q3財報顯示，數據中心業務同比增長31%，達到38億美元，而遊戲業務收入下降51%至16億美元。自今年以來，英偉達股價漲幅已超80%。

無論是股價，還是數據中心業務的增長，英偉達的蓬勃發展與生成式AI的火熱密不可分。

因爲生成式AI中的近乎一切都會在某個時刻通過雲托管的GPU（TPU）。無論是對於訓練模型的模型提供商和科研實驗室、執行推理和微調任務的托管公司或是兩者兼顧的應用程序公司，算力都是生成式AI的命脈。

生成式AI的快速發展帶動了對算力需求急劇增長，尤其是大型語言模型（LLM）需要規模龐大的算力。

以GPT爲例，根據OpenAI公布的信息，GPT-1有1.17億個參數，GPT-2有15億個參數，而GPT-3則有1750億個參數。那么，訓練GPT-3需要多少算力？調研機構TrendForce在一份報告中提到，訓練GPT-3大概使用了20000個NVIDIA A100GPU算力，而ChatGPT商業化後所需的GPU數量將達到30000個以上。

而英偉達正好是AI算力的主要提供商。在數據中心GPU領域，英偉達市佔率常年穩定在80%附近。據Top500.Org數據顯示：英偉達GPU產品在全球Top 500超算中心的滲透率逐年提高，由2013 H1的72.2%提升至2021H2的90.3%，研究文獻中引用英偉達GPU的次數是頂級AI芯片初創公司總和的90倍。

由於人工智能領域的算力需求約每3.5個月翻一倍，所以導致英偉達芯片常年供不應求。

英偉達 H100 GPU | 圖源：GTC 大會

本次GTC大會，有一半以上的內容跟ChatGPT和生成式AI有關。其中，爲滿足生成式AI和大語言模型的算力需求，英偉達發布了專注於ChatGPT的AI/GPU訓練和推理兩類新的芯片方案：

訓練方面：英偉達H100 GPU基於Hopper架構及其內置Transformer Engine，針對生成式AI、大語言模型和推薦系統的开發、訓練和部署進行優化，在大語言模型上比前代A100提供了快9倍的AI訓練、快30倍的AI推理。

英偉達四種配置的全新推理平台 | 圖源：GTC大會

推理方面：英偉達推出全新GPU推理平台：四種配置（L4 Tensor Core GPU、L40 GPU、H100 NVL GPU、Grace Hopper 超級芯片）、一個體系架構、一個軟件棧，分別用於加速AI視頻、圖像生成、大型語言模型部署和推薦系統。

此外，英偉達還公布了DGX Cloud，聯合微軟Azure、Google Cloud和Oracle Cloud Infrastructure，將DGX AI超級計算機“通過瀏覽器引入每一家企業”。

綜上，我們可以看出，爲滿足業界當前急劇增長的算力需求，英偉達圍繞算力體系“各個出擊”，試圖構建一套包含硬件、軟件和雲服務的全方位解決方案。

英偉達押注未來，不止於AI

縱使如此，該方案依然存在不足，因爲AI、ChatGPT等大語言模型的處理能力受限於芯片有限的表面積。

量旋科技聯合創始人、資深科學家馮冠儒博士表示，經典計算以晶體管爲計算單元，通過提高芯片上的晶體管密度來提高算力，但晶體管的密度不能無限大，因此經典計算算力有限。而量子計算則可以利用量子疊加態來提供量子並行性，一次性完成所有計算，並從中舉出最優方案。

因此，量子計算將成爲重要的前沿科技之一，有望延續接近物理極限的摩爾定律繼續發展。

作爲全球主要的算力提供商之一，英偉達自然不會錯過量子計算。

NVIDIA DGX Quantum | 圖源：GTC 大會

在GTC大會上，英偉達宣布的第一個全新產品就是與Quantum Machines合作的NVIDIA DGX Quantum。作爲全球首個GPU加速的量子計算系統，NVIDIA DGX Quantum將全球最強大的加速計算平台（由NVIDIA Grace Hopper超級芯片和CUDA Quantum开源編程模型實現）與全球最先進的量子控制平台OPX（由Quantum Machines提供）相結合。

據黃仁勳介紹，它可以實現GPU和量子處理單元（QPU）之間的亞微妙級延遲。

這種組合使研究人員能夠建立異常強大的應用，將量子計算與最先進的經典計算相結合，實現校准、控制、量子糾錯和混合算法。

並且，DGX Quantum還爲开發人員配備了統一軟件棧——混合GPU-Quantum編程模型NVIDIA CUDA Quantum。作爲一個混合型量子-經典計算平台，NVIDIA CUDA Quantum能在一個系統中整合和編程QPU、GPU 和 CPU。目前，它已經开源，爲开發者提供更多支持。

實際上，這並非英偉達首次涉足量子計算。早在2021年11月舉行的GTC大會上，英偉達推出用於加速量子計算的下一代SDK——cuQuantum，它能使大型量子電路的模擬速度大大加快，使量子研究人員能研究更廣闊的算法和應用空間。

之所以進入量子計算，或許是英偉達看到了混合量子-經典計算的機會。爲了在量子計算早期就發揮其作用，混合量子-經典計算應運而生，混合計算的優勢是大部分繁瑣的任務仍然交由經典計算處理，而量子計算僅處理器其擅長的任務。

爲此，英偉達在2022年7月發布了一個量子版本的統一計算平台QODA（Quantum Optimized Device Architecture，量子優化設備架構），用於加速人工智能、高性能計算、健康、金融和其他學科的量子研發突破。

QODA 旨在通過創建相幹的混合量子-經典編程模型，讓量子計算更易於訪問。作爲一個开放、統一的環境，QODA 適用於當今一些功能強大的計算機和量子處理器（QPU），將提高科學生產力，並實現量子研究的更大規模。

比如，利用 QODA，HPC 和 AI領域專家可以輕松地將量子計算添加到現有的應用程序中，利用當今的量子處理器，以及使用英偉達 DGX 系統和科學超級計算中心與公共雲中可用的大量英偉達 GPU 模擬未來量子機器。

寫在最後

無論是生成式 AI，還是量子計算，背後的關鍵因素都是算力。如今，算力早已融入人們的日常工作和生活，而人們對算力的需求也在不斷增長。作爲主要的算力提供商，英偉達自然成爲主要贏家。不過，其“野心”不止於此，通過押注量子計算，這表明英偉達不僅看好量子計算的未來發展，而且想在下一個時代（量子計算）延續優勢，爲用戶提供算力支持。

$英偉達(NASDAQ|NVDA)$

追加內容

本文作者可以追加內容哦 !

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。

標題：從GTC大會看英偉達的野心：不止於AI

地址：https://www.breakthing.com/post/49464.html