華泰證券:AI芯片行業競爭白熱化 特斯拉(TSLA.US)Dojo領銜異軍突起
1年前

華泰證券發布研究報告稱,AI芯片競爭格局已趨白熱化,雲計算和互聯網大廠正在自研芯片之余,一些初創AI芯片企業(如Cerebras、Graphcore等),以及芯片行業以外的企業,包括特斯拉(TSLA.US)等,正在異軍突起,試圖針對AI應用中內存和傳輸速度的瓶頸,在芯片的內存共享和低延時技術路线上另闢蹊徑。2021年8月,特斯拉在AI Day首次介紹Dojo超算,並計劃利用其加速Autopilot和完全自動駕駛(FSD)系統的迭代。Dojo基於D1 芯片的晶圓上(System on Wafer)系統級方案,也採用多晶圓堆疊技術,每個機櫃集群Dojo ExaPOD算力達到1.1 ExaFLOPs,已在今年7月开始量產。

華泰證券主要觀點如下:

AI芯片競爭趨白熱化,異軍突起,從內存和傳輸設計另闢蹊徑

英偉達GPU一直爲AI訓練端首選。華泰認爲只有少數芯片能與其匹敵,如谷歌TPU和AMD MI300系列。當算法开始穩定和成熟,ASIC定制芯片憑着專用性和低功耗,能承接部分算力。因此,頭部雲計算及互聯網大廠出於削減TCO、提升研發可控性及集成自身生態等考量,均陸續發力自研芯片。另外,初創AI芯片企業(如Cerebras、Graphcore等),以及芯片行業以外的企業,包括特斯拉等,正在異軍突起,試圖在芯片設計上另闢蹊徑,通過大尺寸芯片突破內存共享和低延時的技術路线,有效應對AI應用中內存和傳輸速度的瓶頸,該機構認爲或將成爲英偉達最大的競爭對手。

Cerebras:整片不切割打造晶圓級大芯片,但良率和有效運行佔比暫成疑

美國AI芯片初創企業Cerebras Systems成立於2015年。2019年8月,發布第一代WSE(Wafer-Scale Engine,晶圓級引擎)芯片,定價爲200-300萬美元。21年4月推出7nm的WSE-2,面積46,225 mm2,擁有2.6萬億個晶體管,內核數達85萬。WSE與傳統芯片最大的不同在於整片晶圓不進行切割,並對內存和橫向擴展採用了獨特的設計。WSE-2採用40GB SRAM內存,可平均分配到整個晶圓芯片的表面。對比當時旗艦的GPU A100也爲台積電7nm制程,片上內存80GB HBM。WSE-2具備27.5PB/s Fabric通信帶寬,對比A100採用GPU互連達到600GB/s Fabric帶寬。

Graphcore:Bow IPU多晶圓堆疊3D封裝,正積極切入中國市場

英國初創企業Graphcore專注於研發人工智能芯片及打造計算機系統。2022年3月推出Bow IPU,採用台積電7nm制程和SoIC-WoW(System on IC Wafer on Wafer)多晶圓堆疊3D封裝技術,FP16算力達350TFLOPS,對比A100的312TFLOPS,面積和晶體管數量也相若。IPU具有多指令和多數據並行的特點。爲了減少內存延遲,IPU摒棄了共享內存並在架構上採用大規模分布式的片上SRAM,讓存儲器與每個內核緊密耦合。IPU芯片上集成了900MB內存,320GB/s傳輸速度,通過增加冗余內核和芯片面積提升良率。Graphcore正在努力切入中國市場,爲大型互聯網公司提供硬件服務。

Dojo:從D1芯片到算力達1.1 ExaFLOPs的ExaPOD

類似於Bow IPU,Dojo也是採用多晶圓堆疊技術。D1 Dojo芯片採用台積電7nm制程工藝,芯片面積爲645平方毫米,晶體管數量達500億。25顆D1芯片(5x5排列)集成到一枚Dojo Training Tile上,以二維Mesh結構無縫互連。6枚Dojo Training Tiles(整塊12英寸重構晶圓)安裝在銅質散熱盤上(tray)。2個盤子安裝在一起成爲1個櫃子(cabinets),包含4,248個內核(354 x 6 x 2)。10個櫃子成爲機櫃集群Dojo ExaPOD,而每個ExaPOD算力達到1.1 ExaFLOPs(1018浮點運算)。相當於500片H100 (約1500萬美元)或約3200片A100的算力(約3200萬美元)。

爲自動駕駛而生,Dojo超算爲公司四大全棧自研科技支柱之一

2021年8月,特斯拉在AI Day首次介紹Dojo超算,基於D1 Dojo芯片的晶圓上(System on Wafer)系統級方案。特斯拉計劃利用Dojo對海量視頻數據進行無監督學習,加速Autopilot和完全自動駕駛(FSD)系統的迭代,同時爲其人形機器人Optimus提供算力支持。在22年9月的AI Day上,特斯拉公布Dojo已建立完整的散熱盤(tray)上系統。同時也宣布了未來路线圖,表示AI團隊正在研發新版本的Dojo超算組件。根據特斯拉23Q2財報發布會和科技媒體The Verge7月20日報道,特斯拉Dojo超算已在今年7月开始量產,而總算力達100ExaFLOPs的超算系統將於2024年底量產。

風險提示:AI技術落地和推進不及預期、行業競爭激烈、中美競爭加劇。

追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:華泰證券:AI芯片行業競爭白熱化 特斯拉(TSLA.US)Dojo領銜異軍突起

地址:https://www.breakthing.com/post/96676.html