“GPT全家桶”,喂不飽商湯科技
1年前


來源:科技新知  作者:王思原   編輯:伊頁 新故事難填舊虧損。

加碼追風大模型,終究沒能讓商湯科技找回投資者們的信心。

4月10日,商湯發布了“日日新SenseNova”大模型體系,且一口氣展示了多個產品,有類ChatGPT產品“商量”(SenseChat)、與Midjourney畫風一致的秒畫平台、AI數字人視頻生成平台如影,以及瓊宇、格物這兩個3D內容生成平台。

數量衆多的產品矩陣,儼然有“AI全家桶”之勢,但這並沒有達到二級市場的預期。4月11日向上跳空开盤後,一路下探,連續多個交易日收陰,股價重新下殺到3港元以下。

事實上,商湯科技作爲最早把人工智能大模型技術寫入招股書的公司,確實是有着足夠的實力,也有獨有的優勢。但這並不意味着商湯能夠趁着東風翻身把歌唱,能否抓住市場給到的機會,目前暫得不出一個利好定論。

逃不過的“套殼質疑”

與其他借着GPT概念發布產品的國內公司一樣,商湯大模型一經亮相,便遭到質疑。

有網友發現商湯在演示秒畫平台時,竟然出現了與AI模型站Civitai上一模一樣的圖片,甚至該模型底部還有顯示Civitai的文字注釋。因此,被質疑自研文生圖是“直接從Civitai下的圖”。

而商湯方面回應到:“秒畫SenseMirage包含商湯自研AIGC大模型,也提供第三方社區开源模型支持導入多個平台的开源模型或上傳用戶本地模型。用戶可免除本地化部署流程,並基於开源模型自訓練模型,高效地生成更多樣的內容。”

換成通俗易懂的話來講,就是商湯雖然訓練了自己的大模型,但秒畫是一個平台,平台上提供第三方开源模型,其他第三方網站上的模型也可以正常導入進來。

打個更好理解的比方是,自己雖然是超市老板,但超市裏的貨僅有少量自產,多數還是來自其他廠商的鋪貨。

而對於商湯所謂的自研大模型,也被網友詬病爲“雲端stable diffusion”。這些猜測並非無據可依,從發布會上展示的一個例子可以看出,雖然是中文的prompt,但風格卻是中譯英的翻譯腔調。譬如“驚人形象、顏色分級應該是專業的”等。

值得稱道的是,商湯發布的很多產品都是直接拿落地Demo進行演示,並非概念十足的PPT。

在演示“商量”的醫療場景案例時,當用戶提出症狀後,“商量”並沒有給出病情診斷,而是進行多次詢問,根據用戶的患病時長、其他症狀等,才給出了可能的病症和求醫科室建議,更加類似現實中的人工問診。

“秒畫”爲文生圖創作平台,它的邏輯與Midjourney類似,用戶除了自選風格外,還可以自添加批量圖片,自訓練圖片風格。

“如影”是商湯推出的AI數字人視頻生成平台,用戶僅需上傳一段真人視頻素材,就可以生成出來聲音及動作自然、口型准確、多語種精通的數字人分身。

雖然這些平台都還未對公衆大範圍开放,實際水平暫未可知,但從這些落地演示中不難發現,商湯的想法與其他廠商略有不同,布局大模型更像是爲了賣算力、賣服務。商湯方面也直言,“日日新SenseNova”將爲政企客戶提供了多種靈活的API接口和服務,供合作夥伴在後續接入。

當然這也是商湯的優勢所在,只是能夠領先多久,能夠帶來多少實質營收,並不明朗。

算力不等於實力

短期來看,這一輪AI大模型的商業競賽中,算力無疑是重中之重。

AI大模型與傳統“回復式”AI不同,它是由許多個簡單的神經元組成。這些神經元之間相互連接,形成了一個龐大的神經網絡。這些神經網絡需要從大量的數據中學習,以便更好地完成任務,例如自然語言處理、圖像識別等。

而在訓練時又涉及到大量的矩陣運算、梯度計算和參數更新等復雜的計算過程。這些計算需要在大規模的數據集上進行,以便模型可以學習到足夠多的信息。龐大的計算量,自然需要使用高性能計算機、GPU集群等強大的計算資源來完成。

這也是全球入局GPT的企業,瘋狂搶購GPU硬件的原因。

商湯恰恰擁有極爲充足的GPU儲備,“在去年停售之前就有1萬張A100芯片了,完全可以覆蓋訓練一個千億參數量的語言模型的消耗。”

業內人士表示,“要訓練像ChatGPT這樣的生成式AI,所需的算力至少需要1萬張英偉達A100芯片的支持。”據公开信息統計,國內目前僅有6家公司具備這樣的硬件實力,分別爲商湯、百度、騰訊、字節、阿裏、幻方。

只是商湯與幾個互聯網大廠的算力儲備相比也有較大差距。相關消息顯示,當前阿裏雲雲上至少有上萬張A100,整體能夠達到10萬張,阿裏集團所擁有的量級爲阿裏雲的5倍;百度則是有自研量產的GPU芯片,更無需擔心算力問題。

而除了英偉達專用顯卡外,商湯也有採購國內的GPU。據悉,在其大裝置裏面已經適配了很多寒武紀和海光的GPU卡。

不過,國產GPU適配也是個問題。一位業內專家表示,“當前的大模型訓練,確實是只有A100與A800能夠勝任,國內GPU卡的易用性與性價比都無法去比較”。即當前國產GPU不太能夠支持超大模型的訓練,還需要投入更多去進行優化。

那么也就是說,未來一段時間內,高端GPU受綜合因素影響短缺,還可以通過豐富的訓練經驗、更大的成本投入來進行掩蓋;但從長期來看,如何能持續獲得高端GPU,才是商湯需要考慮的問題。如果禁運依舊存在,並且國產GPU無法適配超大模型的訓練,那么與國際尖端AI企業、最先進的大模型之間的距離,將會被持續拉开。

一方面,不能否認商湯在算力儲備上的硬實力,但另一方面,也不能忽視商湯在優質數據語料上的缺失。

“在國內,大部分高質量中文語料都在行業內,而不在公域的互聯網內,即便是大廠也很難拿到細分行業的關鍵數據。”一位AI公司聯合創始人稱。

如果數據不足,模型就無法進行更多面的學習。這可能導致模型的准確性下降,使其無法很好地完成任務。缺失的數據可能使模型更加容易受到對抗性攻擊和幹擾,導致魯棒性降低,使其更容易被攻擊者攻擊和欺騙。

好在商湯的商業模式更偏向算力提供,客戶可以自己上傳數據進行訓練。但這就會涉及到另一個問題,大廠有自己的大模型,沒有理由與商湯合作,而一些中小廠因爲比較垂直,數據量並不算多,在構建大模型並不困難的大背景下,結合算法效率的優化,完全可以自己組建大模型團隊進行訓練。這樣還能保證自己的數據安全,畢竟誰也不會想將自己最核心的數據交於他人。

此外,國內的AI大模型正在進入“百模大战”,除了百度、華爲、阿裏這些大廠外,昆侖、知乎這些腰部企業也都陸續“入局”。在「科技新知」看來,未來一個比較明顯的趨勢是,各行業、領域的頭部企業幾乎都會推出更爲垂直的大模型產品,賽道內的小廠也更傾向選擇站在自己行業巨人的肩膀上。屆時商湯能夠把自身擺在什么位置,尚值得思考。

當然這只是依據預期推測得出的結論,大模型發展勢必會給商湯帶來新的增長點,只是這又能否改變其長期虧損的困境? 日日新解不了老問題

雖然商湯布局AI多年,在計算機視覺等一些細分領域有着不錯的積累,但此前受限於商業化落地、研發投入等因素,其盈利能力一直堪憂。

2022年商湯科技實現營業收入38.09億元,同比減少18.97%;實現歸母淨利潤-60.45億元,同比增長64.73%,經調整淨虧損同比增長233.9%至47.36億元。

這表明其去年內的業績遭遇了較大程度的下滑。一方面,兩大主要業務智慧城市及智慧商業貢獻的收入,出現下滑導致了淨虧損額的擴大;另一方面,虧損加劇是受研發投入、金融資產及合約資產減值,及外匯虧損淨額所致。

整個2022年,商湯在研發支出上合計40億元,同比增長11%;研發人效相比去年進一步提高90%,人均每年研發模型數9.35個;累計商用模型數提高了93%至6.7萬個。

縱然有AI企業特有的“燒錢”標籤加持,但面對逐年升高的研發投入,以及持久無法兌現的業績,商湯的投資者們並沒有太多耐心。

去年6月30日,商湯上市前投資者、基石投資者股權基本解禁,而也就是在解禁後短短一天之內,商湯科技的市值蒸發了915億港元。隨後半年,阿裏、軟銀、環球資本等投資方已紛紛減持套現。

如果與OpenAI的經歷放在一起來看,從2019年微軟向其注資10億美元开始,已經“燒”了130億美元也還未換來樂觀收入。根據研究機構PitchBook的數據,OpenAI今年有望產生僅2億美元的收入。

在業績不佳,資本市場不看好的前況下,商湯比起同期入局的互聯網巨頭而言,未來能否有持續資金投入,是個不小的疑問。

樂觀的是,商湯大模型可以很好地賦能當下四大主要業務,並且借助此前的客戶渠道,將日日順大模型體系推銷出去,但最終能夠帶來多少的增值,也還有待市場檢驗。

上市後的商湯不斷向資本市場講着故事,從智慧汽車到元宇宙,再到如今的大模型,幾乎覆蓋到了每一個大風口,但結果是概念越造越多,錢越賺越少。並且資本市場一旦流動性降低,對講故事模式就越來越沒興趣,而在大模型時代具備先天優勢的商湯,能否一改常態,倒也不妨多給一些耐心。

追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:“GPT全家桶”,喂不飽商湯科技

地址:https://www.breakthing.com/post/53787.html