事件:3月16日百度將發布生成式對話產品“文心一言”,且公司計劃該產品將與搜索、智能雲、自動駕駛Apollo、小度等業務整合。
百度AI專家:
文心一言調用超大規模算力主要想用思元590替代A100,從適配性來講,需要提前完成V3、Net50等模型驗證。除了對話式的生成內容,百度還做了延伸,後面會有相應的產品規劃發布,有視頻、語音類的一些處理,橫跨了計算機視覺、自然語言處理一系列的技術領域。
以思元590、玄思100服務器爲主要拳頭合作方的兼容測試下,目前表現初步達到預期,後面會在CV、NLP等一些網絡訓練、精度收斂方面進行更多的兼容性及穩定性的測試,來保證最終的模型符合百度文心一言對外發布的狀態。
文心一言只是AIGC下的產品之一,百度去年已經發布了文心一格,繪畫的。文心系列的大模型有很多,其實現在炒得比較熱,把ChatGPT炒起來了。從百度的視角來看,文心一言只是起點,而不是終點,它後面對超大規模算力的調用是無止境的。
Q:寒武紀思元590和英偉達A100後續的需求量和評價,怎么考慮?
A:從我們視角來看,這都屬於供應商,不能被某一個供應商來卡脖子。希望同時進行一些備貨,除了英偉達A100和寒武紀590,其他性能差一點的替代品也考慮。
Q:目前百度在自研下一代的昆侖芯,和寒武紀590還有其他的一些競品相比,你們覺得指標可以嗎?
A:我們對雲端推理芯片廠商、雲端訓練芯片的廠商,我們拉通做了個對比。
1)雲端推理芯片:我們看了英偉達,阿裏,百度、寒武紀、燧原、依圖這幾家。例如英偉達當時是T4,阿裏寒光800、百度昆侖二代、寒武紀思元270,遂愿是aries、依圖是求索。從工藝層面都是相對11- 16nm之間,最小的是遂愿11納米,寒武紀270是16nm。
在已經量產的情況下,我們會考慮到它們自身業務體量和軟件編程生態。對於英偉達,阿裏、百度,我們認爲它自身的業務體量做不大。同時它也會對外輸出GPU的雲服務。對於寒武紀、燧原、依圖,我認爲自身業務除了芯片之外,其他的一些閉環的場景業務就很少或者忽略不計。從生態來說,這幾家大廠都是有自研的一套雲端生態。
從最終的結論來看,在互聯網巨頭、AI獨角獸和芯片創業公司各有一個代表性的人選。互聯網巨頭我們選的是自家百度,百度自有的業務體量、資源投入能力都是綜合比較強的。AI獨角獸我們選的是依圖,自有體量一般,資源投入能力中等偏上。芯片創業公司我選的是寒武紀,它沒有具有的業務應用場景,它依靠外部融資和合作夥伴場景迭代。
從性能表現,我們有分了三個梯隊。我們是以INT8算力功耗密度爲比較的參數。第一梯隊是阿裏,但是阿裏的芯片,在市場上反饋犧牲了通用性,導致使用場景相對較窄。第二梯隊是百度、寒武紀、遂愿,我們認爲達到了英偉達T4的性能水平。第三梯隊是依圖。
從量產的成熟度考慮,已經量產並且已經對外獨立商業輸出的就是阿裏、百度、寒武紀。
2)運算訓練芯片:主要對比了英偉達A100、華爲海思昇騰910、燧原的燧思、天數智芯的b1-v1。當時A100和昇騰910已經量產了,燧思和b1-v1進度微慢點。在編程軟件生態環境下,因爲英偉達是支持的CUDA生態。海思昇騰910不兼容CUDA,它自研的是華爲那套mindSpore开發框架,兼容國際上主流的其他开發框架。燧思也不兼容CUDA,它只是和國際組合的一些AI框架進行了一些兼容測試。B1-v1是兼容CUDA的。
從性能表現來說,以FP16算力功耗密度爲比較參數,我們認爲第一梯隊是華爲昇騰910,第二梯隊是燧原和天數智芯。從量產成熟度評價來說,已經量產並且對外輸出的是華爲和燧原,天數智芯的還沒量產。
在國內雲端訓練芯片整個市場的參與者之中,我們從大類來分,我們認爲ICT巨頭就是華爲自身的業務閉環的場景足夠大,資源投入也足夠強,這樣它不管是場景的內測、技術產品化,產品商業化的能力比較強。
在芯片創業公司,遂愿、天數之芯都沒有自有的業務用場景,依靠外部的融資和合作夥伴在場景迭代,我們在研究以後,有一句話的核心結論。國內的雲端AI芯片市場玩家包括互聯網巨頭、AI獨角獸和芯片創業公司,阿裏、華爲分別在推理和序列領域處於市場的第一梯隊。
Q:百度在推理市場適配寒武紀370時,寒武紀的軟件適配性、通用性是什么情況?
A:百度自有的一些基於飛漿上面的一些接口也好,或者你主體引擎也好。
我們也用了寒武紀的基礎軟件平台,他這套軟件平台雖然如他介紹所說針對雲邊端智能處理器打造軟件开發平台,我們從百度視角來說,我覺得他們他訓練軟件平台對一些國際主流的框架可能做了一些出廠前的適配,但是對飛漿兼容性要弱一些。我們認爲從這軟基礎軟件平台的友好度有待於提升。
Q:可以用起來,但是需要優化?
A:它支持一些圖形圖像、語音、推薦、以及NLP的訓練任務,和飛漿可以有分場景的結合。
Q:現在思元590和850這一代軟件的表現,如果放在之前的評價體系裏面,它會是一個什么樣的情況?比如和華爲的910去比,和之前現在市面上的一些訓練卡對比,能和A100打的。
A:當時還沒有出思元590的時候,我們認爲昇騰910是國內唯一可以接近A100的卡。剛才也提到了,590在目前內部導入測試的一些模型的任務的完成進度來看,優於昇騰910。思元590和A100不好直接去點對點的對比,我只能說在整體性能上,至少在AIGC這種業務對於算力的需求上,是可以一定程度上代替A100。
Q:除了硬件指標、工藝等方面的提升以外,思元590的軟件部分有進步嗎?例如:1)軟件的成熟度,會不會出現任何的bug,軟件崩潰、使用/調試不完善。2)以百度文心的覆蓋程度來說,是不是會比上一代覆蓋的領域要多一點,適配的方案更多。有一個定量或者定性的判斷嗎?
A:定性的角度來看,590的軟件和之前思元系列的軟件相比,還是有一定程度上提升的。但是百度作爲使用方,還是給他提出了很多的BUG或者反饋意見,但是相對來說就沒有特別傻瓜的、業內一看就比較的那種錯誤。
Q:國內在這一塊的軟件开發人才是比較少的。寒武紀的軟件,如果對比其他的類似廠商,不算百度昆侖芯,類比遂愿、天數、登靈漢博這一類的你們合作過的廠商,他們的軟件能力如何去評價比較?
A:我認爲寒武紀、遂愿相對來說屬於在創業的企業裏邊進步比較大的,它底子相對弱,起始點低一點,但它進步相對大一點。從我們的感受來說,它們第二代和第一代相應的軟件的使用度、適配度、穩定性各方面的提升是比較大的。
我從這裏邊得出的結論是寒武紀基礎軟件平台的研發實力和相應的解決方案能力,是有大幅度提升的。在推理的加速引擎方面,因爲百度自己有基於飛漿的輕量級title推理引擎,從百度的視角來看,寒武紀所謂的magic這套東西,可能覺得還是班門弄斧了,和百度相對比較健全的軟件架構,以及穩定性還有差距。
Q:主要寒武紀的卡剛出來了,之前沒在這個場景裏面長期跑過?而且寒武紀自己沒有業務,對於業務的適配還要後面再跟上?
A:是的,寒武紀它產品業務必須通過客戶來搞。百度是自成體系的,從產品生命的周期來看,它就伴隨着微循環、微反饋、迭代的合理性和迭代速度方面要比寒武紀好很多。
Q:目前寒武紀和你們的適配過程中,軟件多久更新一版?
A:小迭代可能需要三五天到一周,他有一小團隊,可以在百度某一個地方常駐。
Q:也就是說寒武紀客戶支持能力和研發能力還可以?因爲三五天一小迭代,速度還是比較快的。
A:不光百度,還有不少服務器廠商也是寒武紀的測試方或者合作方客戶。從寒武紀的視角來看,他肯定有一個大客戶名單,百度、浪潮顯然在其中。對於大客,寒武紀肯定在每一個產品的分測過程配備了相應的測試團隊或軟件響應團隊,來保證即使反饋大客。但我覺得僅限於類似於百度、浪潮這樣的大客戶,不可能面面面俱到。
Q:百度今年訓練卡的採購量,包括思元590、英偉達A800的採購量有了解嗎?
A:2023年計劃思元大概佔10%-20%。
Q:今年寒武紀能否保證你們的供應量,我知道它現在手裏面有八九千片,不知道給你們供應多少?
A:它是否能保證爲百度供貨,我們內部並沒有統一的口徑。直白來講,我們對寒武紀在目前ZZ環境下能否及時供貨,大批量供貨或者是按合同供貨,我們是持有懷疑態度。
Q:思元除了590,370和270這兩張卡後續有採購的計劃嗎?我了解到商湯和阿裏开始商用了。
A:百度現在正好也在搞超大中心,也在做這方面的布局,所以還是有些需求的。對於這兩款產品,我們內部叫分階段的商用的計劃,從小批量到中批量逐漸做一些商業合同的合作。
Q:小批量會從什么時候开始?2023H1?
A:2023上半年夠嗆,可能2023年內會有一些合作。
Q:你們超算中心的國產化率有要求嗎?
A:50%以上。
Q:國產化率50%以上,但是目前我們國內可以商用的卡不多,你們怎么去考慮這個事?
A:這是一個大概三年的目標,從去年开始,到明年基本達到50%的國產化率。這也是響應國家的政策號召,想在超算中心也建立一個能讓國內的AI芯片創業企業不斷進行測試,不斷進行友好入場的合作方式。其實這個東西有時候是一些不便於直說的ZZ原因,在裏邊達成了一些口號。
Q:從這個角度來講,如果能用國產,你們肯定會採用,達不到50%也沒有辦法對吧?
A:我們只能說盡力,這是ZZ任務。
Q:目前來說,您這邊的超算中心是我了解到第二個,第一個是商湯。是不是以後所有AIGC的超算中心,國產化率都有50%的要求?
A:現在中美關系的背景下,所有超算中心長期都要往提升國產化率的方向去靠攏。至於50%的數字,完全是出於ZZ角度。我理解50%是一個可以浮動的範圍,之後商湯、百度都是按照一定的範圍,去完成相應的ZZ任務。
Q:最近國內的GPGPU的服務器供應商主要是浪潮,百度是如何考慮後續合作的?
A:從百度的視角來說,浪潮一直是一個長期穩定的合作夥伴,互補型的一些服務器會繼續進行一定程度上的合作。跟AI芯片一樣,所有的互聯網公司,都要下場自研AI芯片,但是留給寒武紀、燧原這樣專業芯片的市場空間還是足夠大的,因爲互聯公司都是有自己的場景應用的考量。同樣的,對於服務器來說,我是按照同樣的邏輯。我們認爲浪潮是一個通用型的AI服務器提供商,我們會在扣除百度特有的場景之外的通用型AI服務器領域,更多的選擇和浪潮進行合作。
Q:浪潮信息可能受實體清單影響,你們現在和浪潮溝通下來的情況是怎樣的?
A:肯定會有對浪潮的供應鏈,包括產品的備貨速度有影響,但是目前來看影響可控。因爲很簡單,浪潮前期的叫存料、備貨積累,包括和百度長期的合作已克服了歷史上一些曲折轉折。我們認爲合作關系短期看沒有太大影響,長期看中美角力之後會有什么新的轉機。百度從來不會把雞蛋放在一個籃子裏。
Q:您認爲590下半年會有小批量採購嗎,按您剛才說的節奏,我理解明年的量是不是會釋放的更大?
A:590目前還在各個大客戶處導入測試,量產我估計應該是今年底或明年上半年。從百度的整體的量級來看,10%-20%會逐漸向思元更新一代的產品去轉換。
Q:字節今年10萬,百度肯定不比他少,按10%-20%來算,百度應該有1-2萬片的需求吧?
A:目前看是這個趨勢。坦白說,有一些是政府出面,有一些其他的力量在中間權衡,希望國產AI芯片和國產的服務器,包括國產的文心一言之類,能有更緊密的合作。國家現在有些相關的部門已經出面了,通過一些其他的形式,希望把AI產業鏈從算力到算法到數據這一層基本在國家的可控範圍內。
Q:如果百度給寒武紀規劃的比例10%-20%,別的國產GPU企業、AI芯片企業,我們給他們的份額大概能到多少?
A:我們認爲寒武紀和歲元在國內相對來說更靠譜一些,所以會給寒武紀的量大一點,給其他的AI芯片創業公司的量會少一點。
Q:訓練芯片的軟件適配成本較高,590軟件的適配已經完全做好了嗎?
A:590的適配工作大概從去年底开始,軟件適配的工作量非常繁重,還在進行中。按照以往的經驗,我估計大概需要半年時間,到年中左右完成。
Q:在適配環節,百度和寒武紀雙方派出的對接團隊規模是怎樣的?
A:百度10-20個人。寒武紀有常駐的5-8人,還有每周來开例會的一些人,开例會的人會和常駐的人輪換。反正會議能碰到一起,我們一個team最多十來個人,他們team最多十來個人的。
Q:聽您的評價,從去年底拿到片子,到現在3個月時間的進展還算順利?
A:文心一言要在3月中旬要對外正式發布,文心一言在百度內部是壓倒一切的最重要的產品,所有的研發資源都向他傾斜。我覺得這個事還加速了590的測試,正常這節奏應該沒這么快。
Q:寒武紀第一批給我們送了多少樣片?
A:寒武紀是分期供應,第一期我估計是個位數。
Q:後面還考慮做大算力的昆侖芯訓練芯片嗎?
A:規劃還有,時間待定。百度昆侖芯已經作爲獨立法人公司,和百度集團獨立了。獨立之後,按照自己的公司的運作,他們的團隊目前來看和我們的信息並不通暢,但我大概也了解一些。他們現在有一些業務方向,有一些優先級調整。剛才您關心的一點,它現在相對來說是擱置了一段時間,後面我認爲還會再啓動,啓動的時機等待外部情況的變化。
Q:微軟調度了1萬張卡給OpenAI做訓練,商湯的反饋是我們國內最多也就調動2000張卡,這個技術有難度嗎?
A:我目前了解到這一塊國內目前沒有哪個達到1萬張量級的,不可能的,現在沒有水平。現在的確從百度視角來看,現在幾千張卡在測試就不錯了。從技術積累來說,涉及到集群做調度還是有一些協同性的難度。我認爲包括商湯、百度,離微軟的差距還是短時間內是無法追上。
#文心一言發布會來襲,百度投資價值幾何?#$百度(NASDAQ|BIDU)$$寒武紀-U(SH688256)$
$漢得信息(SZ300170)$
本文作者可以追加內容哦 !
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。
標題:百度文心一言產業鏈解讀
地址:https://www.breakthing.com/post/47794.html