英偉達全球首發超級AI芯片:比上一代快50%,訓練大模型成本更低
1年前

老黃總能押對寶。

黃仁勳向數千名开發者和圖形專業人士發表講話,宣布更新 GH200 Grace Hopper 超級芯片、英偉達 AI Workbench,並將把生成式 AI 引入英偉達 Omniverse。

隨着生成式 AI 技術繼續席卷整個數字化與超互連世界,英偉達創始人兼 CEO 黃仁勳決定以雷霆萬鈞的氣勢重回全球頂級計算機圖形會議 SIGGRAPH。

1黃仁勳:生成式 AI 开啓了人工智能的“iPhone 時刻”

本周二,黃仁勳在洛杉磯舉行的一場特別演講中對數千名觀衆表示,“生成式 AI 時代即將到來。如果大家愿意,也可以稱之爲人工智能的 iPhone 時刻。”

他帶來的亮點包括下一代 GH200 Grace Hopper 超級芯片平台、英偉達 AI Workbench(新的統一工具包,可在英偉達 AI 平台上引入更精簡的模型調整和部署方式),以及搭載生成式 AI 和 OpenUSD 的英偉達 Omniverse 重大升級。

這些公告,無疑是將過去十年來 AI、虛擬世界、加速、模擬和協作等領域的所有重量級創新整合在了一起。

黃仁勳表示,“圖形和人工智能密不可分。圖形需要 AI,AI 也需要圖形。”他同時解釋道,AI 將在虛擬世界中學習技能,AI 也將幫助人類創建虛擬世界。

在五年前的 SIGGRAPH 大會上,英偉達通過將 AI 與實時光线追蹤引入 GPU 重塑了整個圖形世界。黃仁勳指出,“當我們用 AI 重新發明計算機圖形學時,也相當於是在爲 AI 重新發明 GPU。”

結果就是:系統變得越來越強大。以英偉達 HGX H100 爲例,它包含 8 個 GPU 和共計 1 萬億個晶體管。與基於 CPU 的系統相比,其速度表現得以顯著提升。

黃仁勳向觀衆們強調,“正因爲如此,全球數據中心才迅速轉向加速計算。這才是真正的「买得越多、越省錢」。”

2全球首發 HBM3e 內存,帶寬達每秒 5TB

爲了延續 AI 的強勁發展勢頭,英偉達打造了 Grace Hopper 超級芯片 GH200。它將 72 核 Grace CPU 與 Hopper GPU 結合起來,已經於今年 5 月全面投入生產。

黃仁勳還宣布,已經投入生產的英偉達 GH200 還將迎來一個附加版本,其中搭載頂尖 HBM3e 內存。

他隨後又宣布將推出下一代 GH200 Grace Hopper 超級芯片平台。該平台能夠接入多個 GPU,從而實現卓越的性能和易於擴展的服務器設計。

新平台專爲處理世界上最復雜的生成式工作負載而構建,具體涵蓋大語言模型、推薦系統和向量數據庫等,而且將提供多種配置選項。

相比前一代平台產品,雙配置方案的內存容量增加了 3.5 倍、帶寬增加 3 倍,由此構建起一台搭載 144 個 Arm Neoverse 核心、8 千萬億次 AI 性能及 282 GB 最新 HBM3e 內存容量的服務器。

HBM3e 是一種高帶寬內存,帶寬達每秒 5TB。該內存比當前的 HBM3 快 50%,可提供總共每秒 10TB 的組合帶寬,使新平台能運行比前代大 3.5 倍的模型,同時通過快三倍的內存帶寬提高性能。

預計各領先系統制造商將在 2024 年第二季度,向市場交付基於該平台的新一代計算系統。

英偉達創始人兼 CEO 黃仁勳發表主題演講,SIGGRAPH 專業圖形大會座無虛席。

數據中心的硬件正在快速向加速計算轉變,這是黃仁勳一直在強調的一個趨勢。相比 CPU,GPU 在能效上有很大的優勢,黃仁勳演講中舉的例子是同樣 1 億美元成本,相比 x86 架構 CPU,GH200 將能提供超過 20 倍能效提升。

3英偉達 AI Workbench:加速定制生成式 AI 的普及

爲了加快全球企業以定制化方式採用生成式 AI,黃仁勳還宣布推出英偉達 AI Workbench。它將爲开發人員提供統一且易於使用的工具包,可在 PC 或工作站平台上快速創建、測試和微調生成式 AI 模型,而後將其擴展至幾乎任何數據中心、公有雲或英偉達 DGX Cloud。

AI Workbench 消除了企業 AI 項目的入門復雜性。通過在本地系統上運行的精簡界面开放訪問,开發人員可以使用自定義數據微調 Hugging Face、GitHub 和 NGC 等流行 repo 中的模型,之後在各平台上輕松實現模型共享。

雖然目前市面上已經有數十萬種預訓練模型可供使用,但基於开源工具的定制化微調往往仍然艱難且耗費時間。

黃仁勳指出,“爲了推動這種能力的大衆化普及,我們必須讓模型幾乎能夠隨時隨地運行。”

在 AI Workbench 的幫助下,开發人員只需點擊幾下即可自定義並運行生成式 AI。這款工具能夠將所有必要的企業級模型、框架、軟件开發套件和庫,都整合到統一的开發者工作區當中。

黃仁勳總結稱,“每個人都可以參與 AI 开發。”

領先的 AI 基礎設施提供商——包括戴爾科技、HPE、惠普、Lambda、聯想和超微等也在積極擁抱 AI Workbench,希望借助它的力量將企業生成式 AI 功能帶到开發者需要的任何地方,包括本地設備。

黃仁勳還宣布英偉達與擁有 200 萬用戶的初創公司 Hugging Face 建立合作夥伴關系,將幫助數百萬开發者輕松構建起大語言模型及其他先進 AI 應用,在超級算力的加持下擁抱生成式 AI。

开發人員還可訪問 Hugging Face 平台中的英偉達 DGX Cloud AI 超級計算系統,利用它訓練並微調各種高級 AI 模型。

“這將是一項全新服務,努力將世界上最大的 AI 社區與世界上最好的訓練和基礎設施對接起來。”

爲了進一步加快生成式 AI 的應用,英偉達又發布了最新版本的企業軟件套件英偉達 AI Enterprise 4.0。

英偉達 AI Enterprise 將爲企業提供訪問生成式 AI 所需要的工具,同時爲大規模企業部署提供安全性和 API 穩定性支持。

4Omniverse 迎來大更新:融合生成式 AI 與 OpenUSD 以推動工業數字化

黃仁勳還公布了英偉達 Omniverse 的大版本更新。這是一套 OpenUSD 原生开發平台,可用於跨工具構建、模擬與協作,爲开發人員和產業公司提供新的基礎應用程序及服務。OpenUSD 框架與生成式 AI 技術將幫助用戶優化並增強其 3D 流程與虛擬環境。

他還提到了英偉達對 OpenUSD 的貢獻,推動這套用於描述、模擬和跨 3D 工具協作的框架向前發展。

Omniverse 平台此番更新,涵蓋 Omniverse Kit(用於开發原生 OpenUSD 應用程序和擴展的引擎)、英偉達 Omniverse Audio2Face 基礎應用以及空間計算功能方面的改進。Cesium、Convai、Move AI、SideFX Houdini 和 Wonder Dynamics 等客戶現已通過 OpenUSB 接入到 Omniverse。

爲了擴大在 Adobe Substance 3D、生成式 AI 和 OpenUSB 發展規劃中的合作,Adobe 和英偉達宣布將 Adobe Firefly(Adobe 打造的創意生成式 AI 模型家族)以 API 的形式在 Omniverse 中开放。

Omniverse 用戶現在可以與其他 OpenUSD 空間計算平台(例如 ARKit 和 RealityKit)相兼容的內容、體驗及應用程序。

黃仁勳宣布爲开發人員和企業提供廣泛的框架、資源和服務,借此加速通用場景描述(即 OpenUSD)的普及度,爲地理空間數據模型、指標組合與仿真就緒(簡稱 SimReady)和 OpenUSD 規範等作出貢獻。

黃仁勳還公布了英偉達構建的四種新 Omniverse Cloud API,可供开發人員更加無縫地實施並部署 OpenUSD 管线與應用程序。

from text and answering USD knowledge questions.

ChatUSD——ChatUSD 是一個大語言模型(LLM)智能體,可幫助开發人員和藝術家處理 OpenUSD 數據及場景,根據文本提示生成 Python-USD 代碼腳本並回答關於 USD 的問題。

RunUSD——一個雲 API,通過檢查上傳文件與 OpenUSD 版本間的兼容性,並配合使用 Omniverse Cloud 生成渲染,從而將 OpenUSD 文件轉換爲全路徑跟蹤的渲染圖像。

DeepSearch——一個 LLM 智能體,可以在未標記資產的海量數據庫內進行快速語義搜索。

USD-GDN Publisher——一項一鍵式服務,可幫助企業和軟件开發商從 USD Composer 等基於 Omniverse 的應用程序處,向 Omniverse Cloud 圖形交付網絡(GDN)發布高保真、基於 OpenUSD 的體驗,並將結果實時傳輸至網絡瀏覽器及移動設備。

這些貢獻,也標志着英偉達上周宣布與皮克斯、Adobe、蘋果和 Autodesk 共同創立的 OpenUSD 聯盟正迎來技術演變新成果。

5強大的新型桌面系統與服務器

黃仁勳表示,英偉及全球各工作站設備制造商正着手推出功能更強大的新型 RTX 工作站,以便爲各類需求提供更豐富的算力,用以支持生成式 AI 和數字化時代下的更多开發與內容創作需求。

這些系統(包括來自 BOXX、戴爾科技、惠普和聯想的系統)基於英偉達 RTX 6000 Ada Generation GPU,並採用英偉達 AI Enterprise 和英偉達 Omniverse Enterprise 等軟件。

另外,英偉達還發布了三款全新的桌面工作站 Ada Generation GPU,分別爲英偉達 RTX 5000、RTX 4500 和 RTX 4000,旨在爲全球專業人士提供最新的 AI、圖形與實時渲染技術。

黃仁勳詳細介紹了英偉達如何與全球數據中心系統制造商合作,繼續通過搭載有全新英偉達 L40S GPU(一種強大的通用數據中心處理器設計)的英偉達 OVX 來增強生成式 AI 與工業數字化實踐。

強大的新系統將通過英偉達 Omniverse 平台爲最密集、最復雜的應用程序提供加速計算,具體包括 AI 訓練與推理、3D 設計和可視化、視頻處理及工業數字化等。

6英偉達研究院帶來更多新功能

在英偉達研究院的不懈努力下,更多創新成果也即將揭开面紗。

在本次大秀的現場體驗環節中,英偉達研究人員將展示生成式 AI 的工作流程,幫助藝術家們快速創建和迭代 3D 場景材質,使用文本或圖像提示詞快速生成自定義紋理材質,並進行更精細的創意控制。

英偉達研究院還演示了 AI 如何通過新的 3D 功能,將視頻會議體驗提升到新的水平。該研究院最近發表一篇論文,探討了 AI 如何通過最少的捕捉設備爲 3D 視頻會議系統提供支持。

Maxine 的量產版本現已在英偉達 Enterprise 中开放,允許專業人士、團隊、創作者等用戶利用 AI 的力量獲取高質量音 / 視頻效果,甚至借助標准麥克風和網絡攝像頭即可實現。

(AI前线)

——————————————————————

AI人工智能ETF(SH512930) 主要聚焦AI中上遊的“賣鏟人”。 成分股包含通用軟件、芯片設計、IT服務等多個AI重要領域,涵蓋科大訊飛、中際旭創、金山辦公、中科曙光、浪潮信息、新易盛、三六零、德賽西威、寒武紀、昆侖萬維等被市場高度關注的上市公司。

$AI人工智能ETF(SH512930)$

$科大訊飛(SZ002230)$$浪潮信息(SZ000977)$

#券商股行情結束了?##儲能股活躍,固德威領漲##又有“N字頭”飆升#

# 券商股行情結束了?#
追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:英偉達全球首發超級AI芯片:比上一代快50%,訓練大模型成本更低

地址:https://www.breakthing.com/post/87076.html