商湯，被低估的“AI原生時代盜火者”

相關報導

錦緞研究院

商湯，被低估的“AI原生時代盜火者”

1年前

商湯，被低估的“AI原生時代盜火者”

本文系基於公开資料撰寫，僅作爲信息交流之用，不構成任何投資建議。

公元2023年，“百模爭流”。從中關村到硅谷，創新之火，如火如荼，赤誠可鑑卻優僞難辨。維特根斯坦說：凡是能夠說的，都能夠說清楚；凡是不能說的，必須保持沉默。在一重產業革命級別的技術範式轉折之中，識別真正的硬核創新者，識別大模型時代產業趨勢，我們須摒棄能說會道的投機者，去跟隨如維特根斯坦所說的這類既可以自證又懂得沉默的盜火者。在審讀過多數AI公司之後，在我們看來，商湯是其中更被低估的盜火者之一。直到大模型火焰點燃中國千行百業之後，更多的人將驟然領悟，它爲何必然是新周期裏那個中國的“普羅米修斯”式AI公司之一。

01AI原生時代盜火者

蒸汽機，交流電，互聯網，每一次工業革命級技術發軔之後，平均都至少將用50年時間，劃分出一個指數級的經濟增長時代。這其中，最重要的一重現象，就是新企業的進入與老企業的退出。圖：1980年至2010年信息技術革命黃金30年內美國新老企業進入與退出率。來源：《美國增長的起落》特別是在顛覆性技術交替的5-10年內，產業界的新舊勢力碰撞將異常激烈。這一過程，便是新技術原生代登上歷史舞台的窗口時刻。通常來說，在此之後，主導產業經濟的力量，將從屬於新技術原生時代的力量集群們。一如汽車誕生之後，馬車在社會分類消費支出的份額之中迅速歸零（見下圖），馬車夫和車行老板們在經濟系統裏的榮耀，在歷經幾個世紀的穩態後，一朝泯滅。圖：1869年至2013年美國部分大類耐用品在社會分類消費支出份額中的變化。來源：《美國增長的起落》這警示着我們，每當新一輪技術革命肇始之際，我們務必將眼界與籌碼投向從屬於新周期的原生型公司之上，而勿要沉湎於過往的线性經濟邏輯中——這便如：我們不能指望馬車夫和馬車行老板們造出汽車一樣。換言之，在方興未艾的大模型時代，我們更須着眼於AI原生時代的盜火者。它們至少存在以下幾個顯著特徵：1.具備前瞻的算力思維。2.具備智能算力工程能力。3.具有智能算法技術池積累。4.具備以算力、算法統籌千行百業不同特質的數據之能力，並可以快速迭代設配，具有爲不同產業至少帶來數量級效益增厚的潛力甚至能力。這四點不難理解：算力（算力工程能力）是AI原生時代所有商業模式的第一性，算力思維是與互聯網時代流量思維最大優先級的區別特徵。算力思維同時也是算法技術的根基，驅動着智能在通用以及專用領域的持續湧現。唯有具備軟硬一體（算力與算法的統一）思維能力基礎，才能在智能革命競爭中走得更遠，直至融入千行百業之中勝出。（該系列邏輯已在此前系列研究報告中，不復贅述。）通觀海內外AI業界，具備這四項能力的AI原生力量實則比我們認爲的要少很多，而來自中國的商湯則是其中之一：1、前瞻性：最早布局AIDC人工智能超算中心的AI公司。商湯2018年籌備落子的AIDC，於2022年正式於上海臨港投用，基於2.7萬塊GPU實現對外輸出算力突破5.0 exaFLOPS，可支持最多20個千億參數量超大模型並行訓練。某種意義上，這是中國人工智能從單一場景應用正式轉向通用人工智能的標志。在此之前，全球範圍內規模性算力中心多以傳統串行計算爲主、並行計算爲輔。商湯此舉意味良多——彼得蒂爾在移動互聯網時代總結道：每個通向偉大的公司都有自己的“祕密”。商湯究竟在2018年時看到了什么，因何最早敢爲天下先，以數十億真金百億投向AIDC這一通用人工智能基礎設施，正是其得以從容不迫地穿越至AI原生時代的關鍵祕密。關乎商業競爭的祕密不足爲外人道，但我們已能看到日日新大模型體系順遂地落地，並以天爲單位不斷進化。更重要的是，商湯的AIDC本身已經成爲一個可以產生現金流的生意——通過並行算力的對外服務，以及對產業的賦能，已經使它在AI原生時代初期即手握兩個關鍵商業模式：算力即服務；模型即服務。比較起2023年前諸多在行業場景裏摸爬滾打，最終卻不得不接受數以億計沉沒成本的1.0代AI公司，商湯有效地將在1.0時期募集的資金高效留存並順利地過度到了2.0時代。這是證明這家公司擁有超級AI战略視角的關鍵佐證。2、可靠性：領先的智算工程能力。關於智算工程能力，商湯的可靠程度在整個中國AI大模型領域應是最不容指摘的公司之一：（1）AIDC這一萬卡（GPU）級別的智能計算中心，本身即是智算工程的產物。AIDC歷時數年的設計建設，亦是智算工程能力進一步磨礪的過程。（2）以數據說話：商湯針對新大模型的自動化數據標注服務目前已將智能標注效率提升百倍；大模型推理部署服務可將大模型推理效率提高600%；大模型並行訓練服務支持單集群3200卡5000億稠密參數模型訓練。而這也衍生出了商湯在AI原生時代第三個關鍵商業模式：工程能力即服務。可以預期的是，隨着大模型在千行百業的不斷滲透，將衍生出海量的基於AI大模型的創業公司。屆時，它們遠不必從零到一的在大模型服務上苦思冥想，以商湯爲代表的中國AGI先行者，已經集結了算力底座-MaaS-算力工程調優維護等全流程生產力平台工具——如果說算力是水電，MaaS是房屋，那么工程能力便是物業維護，全程護航中國AI原生時代的不斷進取與突破。3、可信性：600多篇頂級學術論文，超過12000件人工智能專利及專利申請積累。根據我們的最新統計，商湯科技自2014年成立以來，在各項全球競賽中已獲得70多項冠軍，發表了600多篇頂級學術論文，並擁有超過12000件人工智能專利及專利申請。專利與學術論文是技術的影子，它不是事實本身，卻映射事實的輪廓。透過這樣的商湯這一放之全行業亦不遑多讓的AI技術能力輪廓，我們大致可以看到：（1）從所謂AI四小龍之一，到AIDC战略的落地，再到最先穿越至AI原生時代，以及更高效率地落地日日新大模型，AI工程能力逐日擢升，商湯AI技術能力的演進並最終脫穎而出，是一個一步一個腳印、可逐幀回溯的過程，具有充分的可信性。（2）商湯從單一場景通向通用原生時代，整個過程中投向研發的錢，都以技術爲載體實現了逐一落地，並也因此高效地全程支撐了其超級AI战略視角的執行，並保障了其迄今爲止的技術領先性。4、領先性：大模型的迭代適配能力。談到技術領先性，除了超級AI战略視角，以及在專利技術領域投下的影子，更重要的還體現在大模型的不斷迭代適配，對於關鍵實體產業的真實賦能能力之上：商湯已在通用模型領域，實現語言模型、圖像模型、多模態模型與AIGC（內容生成）“四箭齊發”，同時據商湯2022年年報顯示，截至去年年末，在專用模型領域，則已累計對外輸出商業模型達6.7萬個。以中國當前產業高質量轉型階段的關鍵抓手——智能汽車制造領域爲例，商湯的智能汽車整車廠合作夥伴超過30家，AI模型及技術服務滲透涉及車輛超過800萬輛。一言以蔽之，商湯已率產業之先拿到了通向AI原生時代的那張船票。

02不要聽他怎么說，而要看他怎么做

中國的AI原生時代盜火者正在砥礪而行。但必須事實求是地是，當前而言，我們仍處於大模型的“盲人摸象”階段，每一個角度似乎都是真相，但其實又只是拼圖。正因爲遠景的模糊，使得噪音不斷。故而識別其中的趨勢，一個簡單的方法論在於：不要聽他怎么說，而要看他怎么做，以及做的怎么樣。根據最樸素的經濟學原理，AI能給產業帶來什么價值，無非是從供給需求兩個維度去看：即，供給端能有什么效率提升；需求端能有什么效用收獲。從商湯科技的系列動作值中，我們其實可以清晰看到針對系列問題的求解邏輯與路徑：

什么是優質供給？基礎算力基座+大模型體系+生成式AI應用

什么是有效需求？從專用，走向通用，再走向專用。

【1】什么是大模型時代的優質供給？

當一個供給不夠優質的時候，談論需求無異於緣木求魚。智能手機的iPhone，新能源汽車的Model 3，之所以被人反復咀嚼就是由於其在供給端做出了劃時代的貢獻。AI其實並不新，作爲一個發展了數十年的行業，之所以在2023年引起全球的高度關注，就是由於ChatGPT讓人看到大模型帶來的奇點效應。但大模型僅僅只是开始質變的原點，未來真正的優質供給仍在緊鑼密鼓的構建中。大模型時代，亟待賦能的是千行百業，真正優質的供給需要動態體系化的AI基礎設施。該怎么理解動態體系？1）大模型時代的基礎設施需要成體系算力無疑是資本市場最火的投資賽道，但目前市場講的算力概念有所偏狹，僅局限於IDC，服務器，甚至是GPU。但實際的AI算力基礎是“算力、數據、基礎算法”三位一體的，智能算力必須靠體系才能發揮作用，而不是簡單的硬件堆砌，不然IDC企業豈不是這一輪AI的領航員？可以作爲佐證的是，最近隨着大家搶着下單完英偉達的A100後，發現高質量的數據竟然是更高的門檻，而算法大部分人還只能依托於开源。根據商湯聯合創始人楊帆的闡述：算法當然可能體現基模型、計算法，或者說體現成一些AI運算的一些工具。算力呈現的不僅是硬件的資源，還包括一整套的基礎軟件體系，是不是能夠把幾千張卡連在一起去做一個訓練。數據也不僅是數據本身的積累，還包括處理數據的能力、整合數據的能力、使用數據的know-how。商湯從成立之初便在這三要素上蓄力，比如前瞻性的擴容智能算力（AIDC）就是一大佐證，公司當前AIDC運行GPU接近3萬片，能夠輸出高達5000p的總算力，躋身國內智能算力第一梯隊。顯然供公司的布局不限於此，伴隨着 AI技術的升級，商湯开始嘗試將自己這些先進的能力提煉出來，定義成一個AI基礎設施——AI大裝置SenseCore。這個大裝置不僅成爲公司迭代大模型的核心引擎，而且也能爲業內提供一個足夠低成本、低門檻的服務。

圖：商湯AI大裝置SenseCre爲大模型體系提供算力支持 2）大模型時代“喜新厭舊”，需要及時動態迭代由於要面對千行百業，大模型現在離人們的期待還有着巨大的差距，根據用戶/客戶進行及時的優化，是模型迭代的最優路徑。或者說，客戶就是最好的產品經理，而這對於更新提出了近乎變態的要求，畢竟傳統企業的產品最快也是按年爲計量單位來進行迭代的。商湯於2023年4月份，基於其AI大裝置SenseCore，推出了“日日新SenseNova”大模型體系，包括語言大模型，以及文生圖、2D/3D數字人生成、大場景/小物體生成大模型。這個大模型體系的名字就隱含了動態迭代的愿景。那么一個季度後，他們做的如何呢？商湯首席科學家王曉剛的訪談中對市場關切的這一問題做出了明確的回應：“我們的這種更新，每天也都是不斷的去接到用戶的調用，還有很多客戶，實際上是對我們模型有全方位的測試和評估，也會給出我們方向的建議，所以我們收到反饋以後，其實每隔幾天都會進行一個快速的更新。”簡單來說，“日日新”大模型的更新周期，是以天爲單位的，也的確符合這個模型的“出廠設定”。正是由於這樣的更新速度，基於“日日新”這一生成式大模型，目前公司通用大模型已經覆蓋視覺、語言、多模態、內容生產四大領域。這種大模型快速开發、迭代能力，反映的就是很強的AI系統工程能力——據7月7日，第六屆世界人工智能大會（WAIC 2023）期間，商湯帶來的最新分享顯示，“商湯日日新SenseNova”大模型體系，已於日前再度實現了重大迭代升級：千億級參數的自然語言處理模型商湯商量SenseChat 2.0版本，突破了大語言模型輸入長度的限制，並推出不同參數量級的模型版本，可無縫適配移動端、雲端等不同終端及場景的應用需求，降低部署成本。生成式大模型商湯秒畫SenseMirage 3.0的模型參數從今年4月首次發布以來的10億提升至70億量級，能夠實現專業攝影級的圖片細節刻畫。如影SenseAvatar 2.0數字人生成平台相較1.0版本的語音和口型流暢度提升30%以上，實現4K高清視頻效果，並帶來AIGC生成形象及數字人歌唱功能。3D內容生成平台瓊宇SenseSpace 2.0的空間重建效率提升20%，渲染性能提升50%，每100平方公裏場景的建圖時間僅需38小時即可完成（1200 TFLOPS/秒算力支持）。另一3D內容生成平台格物SenseThings 2.0對小物體的紋理及材質還原達到毫米級精細度，並突破對高反光和鏡面物體的採集難題。於AI玩家而言，鍛造優質供給的最終目的，就是爲了讓 AI技術更加低成本、低門檻、高效率的進入到各個場景裏面。在絕大部分企業還在三要素—“算力、數據、算法”—中顧此失彼的時候，商湯“大算力+大模型”的AGI战略，在供給側無疑取得了得天獨厚的先發優勢。【2】什么是大模型時代的有效需求？7月18日，Microsoft在合作夥伴大會上官宣Copilot的定價爲：每用戶每月額外支付30美元。隨着微軟吹響AI+辦公應用落地的發令槍，AI的商業化探索，正式成爲每一個頭部AI供應者現在需直面的頭等大事。但到底什么是有效的需求，目前的爭議遠遠大於供給側的技術路线之爭。我們認爲，大模型時代的有效需求，是先解決用戶的通用性問題，然後再解決用戶的專用性問題。這就像計算機的發明，首先解決的是計算這個通用性剛需，然後再是垂直向下解決如辦公、娛樂、畫圖、視頻等專用個性化需求。爲了解決通用性問題，AI的供應商，需要提供牢靠的通用性量子能力，比如行業的文本能力已相對成熟，但視頻、圖像等能力尚待突破，最終必然要構建多模態能力。而針對專用問題，勢必要下沉到行業中去，與行業的專用數據和產業規律浸泡在一起，尋找最短路徑的解決方案。

圖：突破供給瓶頸後，AI將在需求側解決“通用”和“專用”兩個層次的問題 1）從專用走向通用追本溯源，AI以前沒有進入大衆生活最重要的原因，就是由於其不夠通用。在上一輪AI熱潮中，我們還是只能用相對比較高昂的代價解決某些特定的問題，比如人臉識別、拍照防抖、自動駕駛。就好像專業的運動員，只能在特定的項目上表現優異，而人們期待的是一個“全能選手”。簡單來說，以前的AI的智能不夠通用。大模型促使AI時代躍遷到AGI時代，其中的G就是通用的意思。正是由於大模型時代的到來，使得AI終於有了“人”的影子，我們便可以暢想，AI能夠替代或者幫助人去做哪些事情。具體來說，2023 年起的大模型湧現，標志着AI已經從專用任務轉向通用任務，或是以自然語言人機接口的方式呈現，能讓機器遵循人的主觀意志實現更廣泛的功能。比如在算法方面，大模型的表達能力越來越強、規模越來越大，自主學習能力越來越強，從專用向通用趨勢顯著，你可以讓AI扮演你的老師、助手、夥伴。回歸到商業模型視角，不管是to B還是to C，大模型不再局限於某一個垂類，而是提供通用型的量子能力，解決“剛需”，比如文本、圖像、視頻等跨模態的需求。用專業一點的話來講，大模型需要演化成MaaS（Model-as-a-Service，模型即服務），利用大模型的通用能力，提供泛化的服務。一體兩面，判斷一個公司的大模型是否靠譜，最簡單的方法就是看其模型能否提供通用的服務。而這無疑，是一個高階的要求，因爲從專用走向通用，需要積累大量的 know-how。大部分人對商湯的印象還停留在機器視覺龍頭公司的階段，實際上過去8年，商湯靠專用積累實現蛻變，將技術迭代泛化到通用，多模態和多場景已然不然話下。我們以智能汽車這一大家高度關注的領域爲例。這一場景對智能的要求是方方面面的，細分場景包括駕駛域、坐艙、車路等，交互又包括語音、文本、觸控等多種方式，非常復雜。對於這一問題，商湯的絕影智能汽車提出了“駕、艙、雲”三位一體的战略，規劃未來在智能汽車領域成爲通用人工智能核心供應商。僅僅在座艙，公司打造的車艙大腦就分爲四個層次：1）車端，包括攝像頭和各種感知硬件，感知車控包括娛樂在內的各種車內狀態，以及各種長短的記憶模塊；2）雲端，在強大的AIDC基礎設施和日日新大模型的加持下，發揮雲端決策和推理能力，協同調動車內資源，去控制車內各部分和APP，輸出強大豐富的內容，生成車內智能化的操作系統；3）往上附加，絕影智能車艙支撐了十多項各種應用，大大提升駕乘安全性，豐富娛樂功能，提供智能化教育服務，最終大幅度提升在車內的各種操作，還有工作效率；4）另外，通過虛擬助手的方式，跟乘客實現擬人化的交互。商湯作爲一家to b企業，做大模型需要更多的考慮AI的泛化能力，更高的泛化能力意味着解決某一領域全棧需求的能力及整體解決方案的壁壘越強。

圖：商湯面向客戶提供多種MaaS服務 2）從通用再次下沉專用但爲了更好的讓AI提高各行各業的滲透率，除了極強的通用能力外，還要結合行業的專業知識，即“從群衆中來，到群衆中去”。AI供應商需要利用大模型的通用能力去應對多樣化、碎片化的應用場景，這一步需要積累衆多的行業大量的know-how。對商湯而言，在日日新大模型體系下，生成式AI應用就是降維的事情。當前公司已經推出的商量SenseChat（語言大模型）、秒畫SenseMirage（文生圖創作平台）、如影SenseAvatar（AI數字人視頻生產平台）、瓊宇SenseSpace（3D場景生成平台）、格物SenseThings（3D內容生成平台）等，正高效嵌入千行百業之中：1)在金融領域，商湯與銀行、保險、券商等客戶展开合作，利用數字人進行智能客服、智慧營銷等工作，並通過接入大語言模型能力，提供投研分析、研報撰寫等新功能，實現降本增效。2)在醫療場景，商湯基於海量醫學知識和臨牀數據打造了中文醫療語言大模型“大醫”，提供導診、問診、健康咨詢、輔助決策等多場景多輪會話能力，未來也即將支持醫學圖像、文本、結構化數據等多模態綜合分析，並可不斷提升醫療語言理解和推理能力。3)移動終端，依托商湯大模型的輕量化版本，輕松實現在移動終端的部署和運行，帶來多種智能交互解決方案，包括針對信息獲取的問答交互，針對生活場景的知識交互，針對語言和圖像生成的內容交互等。4)线下場景，商湯通過大模型能力爲電網巡檢帶來長尾故障識別、復雜缺陷判斷等智能解決方案。基於瓊宇2.0的空間重建，商湯爲濟南馬山鎮區域开發、合肥中國視界園區、上海瑞金醫院等打造實景空間的數字孿生，提升運營管理效率。在珠寶行業，依托格物2.0商湯爲珠寶品牌進行珠寶首飾復刻，細致展現商品工藝特點，提升顧客購物體驗。以上可見，商湯正積極通過大模型的多模態能力組合賦能產業升級，並爲中國的AI原生時代帶來諸多引領行業的全新突破。

03結語

AI 已然成爲數字經濟時代的新基建，硬核創新者，已經在錘煉供給——落地需求——優化供給——升級需求的正循環中，轉動了智慧的飛輪。我們有幸看到大模型時代產業趨勢的盜火者，已經手捧火炬接棒未來。 往期推薦