$辰安科技(SZ300523)$
硅谷AI考察報告民生胡團隊
——來自AI前沿的第一手信息
爲了近距離了解硅谷AI前沿發展最新動向和第一手信息,近期,我們專程前往硅谷學習考察,先後參觀了微軟、Google、英偉達、Meta等公司總部,與衆多業內人士進行了深入交流,收獲多多,感觸頗深。通過交流過所了解到的很多關於算力和大模型的前沿認知,與國內目前資本市場的理解不盡相同,甚至天差地別,這些差異也許蕴含着重要的投資機遇。爲此,特將此次學習考察收獲第一時間與各位分享。
此行中我們最大的感受是,在美國AI已經不是剛开始引發好奇與爭議的新鮮事物,而是像水和電一樣融入到社會生產、公司經營和百姓生活的各個方面。同時,AI技術進步的速度處於一個“寒武紀”的時代,幾乎每一周甚至每一天,都有讓人興奮的新技術或者新產品橫空出世並且迅速應用到實際場景中,因而美國的VC、PE可以說是幾乎無孔不入,深入到AI各個方面去尋找投資機會。
以谷歌爲代表的全球科技巨頭普遍認爲,本次AI革命是人類未有之大變局,它是人類進步的一個空前的拐點。我們曾經指出,這一次,AI將計算機歷史上最大想象空間的互聯網最高流量入口、公有雲最大的市場、統一萬物的操作系統合三爲一,即使這樣我們可能仍然低估了它的意義:這或將是人類發展史上最偉大的科技革命!
圖片
我們從底層技術路徑與算力、行業應用以及大模型與垂直模型的發展趨勢三個方面來介紹硅谷AI學習考察之行的收獲:
1 大模型的底層技術與算力需求
第一,GPT大模型的底層技術是谷歌的TransFormer,其核心的意義在於給定前文後推理出下一個最有可能的字符來進行輸出,一些巨頭的基礎大模型差別在於解碼單向結構還是編解碼雙向結構。ChatGPT可以支持對前文32000個字符分析再推理出下一個字,這已經是一個非常龐大的數量級,且ChatGPT只允許根據前文分析推理不允許加入後文來分析推理(decoder only)。谷歌最先推出的大模型Bard是前後文都可以用來分析推理(編解碼雙向結構),但後來改成與ChatGPT類似只能用前文推理的PaLM大模型,可能最終還是這種模式更接近於我們人類語言的方式。
第二,大模型本質上更像依賴AI基礎設施的“煉丹”,是推理並不是認知;目前視頻生成受制於對基礎設施的高要求仍存在一定局限性。雖ChatGPT在QA、總結等領域表現令人震驚,但實際上還是推理而不是認知,包括生成圖片其實本質上也是生成文本,但是在生成視頻上AI推理難度很大,因爲視頻的每幀都是大量圖片,需要非常強大的AI基礎設施去支撐。形象地說,大模型訓練就像煉丹,AI基礎設施越好火力越旺,但是一开始都不知道大模型到底有沒有用,有一定的運氣的成分在裏面。
第三,大模型後來者的追趕難度並沒有大家想象那么大,中國大模型追趕海外也會比較快。OpenAI本身並不是技術絕對領先於其他科技巨頭,核心在於專注於TransForemer往通用人工智能方向發展,而微軟、谷歌、Meta都有很多賺錢的業務不太重視大模型。OpenAI做出來之後大公司發現AI有前途,自己資源更好肯定會加緊追趕。硅谷專家預測6個月到1年以後,全球大廠大模型水平基本看齊。中國大模型追趕海外也會比較快,中國本身是一個很好的市場,現在大模型所有的技術大家都了解,無非就是資源的集中堆積。OpenAI做這么好都“委身”給微軟,本身就是因爲訓練太花錢。
圖片
第四,海外AI巨頭算力儲備A100芯片基本在50萬片以上的量級,英偉達在把算力資源向雲服務方向發展,同時也在布局自身大模型。目前海外巨頭平均A100量級估計在50萬片以上,H100可能每家一兩百張,六七月份才能大規模上线。英偉達的實際優勢是軟硬件結合,它的硬件上面有一層框架tensor RT,英偉達有幾百人的工程設計團隊做框架,比如pytorch必須有Tensor RT才能跑,這個中間層軟件一般硬件公司寫不了。英偉達不止做硬件,做Tensor RT還要做下層的基礎設施,未來英偉達有望形成一個雲品牌,同時自己也在布局大模型,可能會對整個AI生態造成極大影響。
圖片
第五,推理芯片的市場遠大於訓練芯片,甚至也遠大於訓練市場加上雲端推理市場的總和,中國在邊緣AI算力市場空間非常大。邊緣計算應用於物聯網等小設備對制程要求不高,現在市場的格局分散,而推理芯片的市場遠大於訓練芯片,甚至也遠大於訓練市場加上雲端推理市場的總和,中國可以借助自己的制造業優勢,把物聯網這一塊的制程降低,然後專用一點的這種小體量低算力的AI推理芯片推向市場,這是巨大機會。其實終端設備的體量是極大的,世界上能夠提供雲服務的提供商,數據中心的量跟海量的終端設備的數量比,芯片需求也還是很小的,大概就是2/8的比例。
圖片
在大模型的底層技術與算力需求方面,我們認爲:
1、算力需求沒有天花板。當前大模型的主要算力需求來自於文字訓練,未來從文字到圖像再到視頻,從訓練到推理,從雲端到邊緣端,算力需求的持續高增長是確定性非常強的。
2、GPU芯片的市場格局或將發生變化,在微軟等巨頭的強力支持下,AMD較爲薄弱的軟件生態有望取得長足進步,AMD將對NVIDIA形成強有力的挑战。
3、芯片是中美競爭的最大鴻溝。兩國達到一個數量級的算力儲備既是目前亟待解決的瓶頸,也是未來確定的投資機遇。尤其是在邊緣側推理算力,既是被低估的遠超訓練算力的市場,也給了中國展現制造業優勢的機會。
2 關於AI行業應用
第一,大模型適用於需要一定容錯率的行業,ChatGPT开始做商業化付費使用plus其實並不賺錢,核心是爲了擋掉一些亂用而把成本變得過高的用戶。大模型應用在要求100%准確的行業目前難度比較大,更多的是比如客服咨詢、藝術創作、會議記錄、寫文章、數據分析等。大模型的商業化在B端已經看到成果了,比如:微軟的全家桶office,減少制作時間、提升完成度、提升復購率;客服:給地產公司、醫療公司節省前端客服的成本。視頻制作:一鍵生成visla.us只能生成demo視頻等工具,就不需要找工作室了,節約人力成本。GPT4到現在只有一個半月,市場還在討論如何應用,再過六個月能看到更多更清晰的落地。
第二,微軟M365 產品主要在大規模交付、隱私和安全方面發力。微軟現在主要的目標是怎樣去大規模的交付,尤其是解決一些個性化的AI特徵,另外就是安全與隱私方面的准備。M365是微軟現在最核心的產品。對於企業整個工作流,整個的協作平台,整個工具、存儲、安全都在M365的目錄下面。Copilot是對於現有的產品线的生產能力做大幅度的提升。M365有兩套不同的運算,依托Azure的數據中心做全球的擴張,M365內部也有自己的數據中心;M365是把openAI嵌入產品,不是用公用的openAI。M365在中國落地技術上有難度:1)運算資源;2)法規:數據透明度、敏感信息的管理。
我們認爲,在美國,AI技術的應用已經非常普遍,例如客服咨詢、藝術創作、會議記錄、寫文章、數據分析等衆多行業。但需要注意的是,目前大模型的應用應該定位在“副駕駛員”,需要一定的容錯率而非確定性的決策工作。此外,以微軟爲代表的海外大模型應用目前進入中國仍存在較大難度,這些難度不僅僅是在數據安全與合規政策的要求方面,大模型與算力資源的本地化部署方面也面臨諸多挑战。
3 大模型與垂直模型的發展趨勢
第一,谷歌和微軟的大模型大概率閉源,而Meta可能是最重要的开源“攪局者”。谷歌因爲搜索會被大模型顛覆是沒有退路的,再开源大模型就沒有優勢了,而且AI未來會成爲重要賺錢工具,所以大概率閉源。微軟則是完全依靠OpenAI,希望GPT賦能MS365 Copilot等效率辦公工具和Bing搜索引擎,微軟大概率也不會把AI开源。而 Meta最重要的業務是社交,AI可以作爲聊天助手,Meta的思路是做出大模型然後开源,成爲大模型裏面的“攪局者”。比較來看,Meta的大模型1750億參數,估計GPT4參數5000億左右,Meta开源了超過650億個參數的大模型,估計精確度比ChatGPT低20%左右。很多公司和學習使用Meta的开源模型做微調,在模型參數很小的基礎下效果和GPT等差不多。开源的意義在於可以發動全世界上百萬工程師一起參與微調。
第二,大模型走向移動端是個趨勢。未來大模型开源生態中大公司做大模型,小公司做微調,大模型還會被簡化到在各個移動終端上,比如原來的32位浮點運算改成INT8等,提升運算速度。大語言模型在开源中會有一個很好的生態圈,大語言模型就像水、電一樣,在一些細分領域讓开源生態做。开源社區有些聰明的人可以把模型蒸餾的很小,比如把36位浮點運算改成INT4,可以把體積縮小十倍,小到可以在電腦和手機端裝,未來可能會有很多有創意的應用开發出來。未來iOS或者安卓可能會內置大模型,以後所有的移動端應用跑一次給蘋果一定費用。
第三,大模型繼續發展中參數量的增加核心要考慮ROI。處於科研角度,當然參數越多越好,但是處於商業使用的角度,每多一個參數就會增加成本,包含收集成本、訓練成本。ChatGPT 3.0用了1750B的參數量,而GitHub上有一個仿GBT的模型只用了70B的參數就達到了90%GPT的效果。從商業應用層面,需要找ROI最高的參數。
第四,大模型最終會通喫一些通過互聯網即可獲得數據的垂直行業,可能無法覆蓋某些數據無法獲得的垂直領域模型。現在谷歌正在做一件事讓AI像人一樣實時學習互聯網的內容,而數據在线下無法獲得的領域,可能會出現线上的大模型和本地模型做交互的形式,但這個涉及難度比較大的耦合問題。
我們認爲:
1、 中國可能是以Meta爲代表的开源大模型的最大受益者。
2、我們對於國內大模型追趕全球領先水平的進度應該保持信心,在已經給定了技術路线方向與开源大模型基礎上去追趕,實際上節省了從頭开始的試錯成本。尤其是對大模型通用性要求並不高的垂直行業龍頭,借助开源大模型可以迅速搭建垂直大模型,加快垂直領域的應用落地。
3、大模型部署在邊緣側與移動端是一個必然的趨勢,尤其在近期谷歌發布移動端大模型和ChatGPT在蘋果手機上的App正式上线之後,這一趨勢逐步被市場認知,大模型是非標准化的各類AIoT終端等待已久的統一操作系統。
本文作者可以追加內容哦 !
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。
標題:深度研究值得關注且與辰思有相關
地址:https://www.breakthing.com/post/62175.html