大模型時代,商湯如何應對“日日更新”的必答題?
1年前

出品 | 創業最前线

作者 | 曉光

編輯 | 方芳

美編 | 邱添

審核 | 頌文

2023過半,但大模型的熱度絲毫未減。不久前在“AI屆的春晚”WAIC2023大會上,大模型當之無愧成爲了頂流。

人們如此關注大模型,是因爲大模型的本質是加速了AGI時代(通用人工智能時代)的到來,之前AI領域被局限的商業化空間,變得十分廣闊。雖然大模型商業化才剛剛开始半年,但是已經很快地融入教育、醫療、制造、辦公、律師、遊戲、藝術等多個領域,滲透程度和滲透效率都是前所未有的。

在今年的沃斯世界經濟論壇上,微軟的CEO薩蒂亞這樣形容大模型帶來的AGI時代——我一生中從未見過,美國西海岸的先進科技可以在幾個月內,以非常真實的方式出現在印度農村,對於知識型工作者來說,也許這一次完全等於工業革命。

不過大模型從入局到真正落地並推向市場,難度不小,資金、人才、基礎設施、場景及商業化落地等,成爲每個玩家都要跨過的“障礙賽”。

所以在國內掀起“百模大战”的時刻,我們也需要回答,什么樣的大模型才能稱得上智能生產力?各行各業行業未來需要怎樣的大模型和服務?

1、大模型+大裝置,仍然是AGI湧現的基礎

爲了回答這個問題,商湯在幾個月前提出了“商湯日日新SenseNova”大模型體系,並且在不久前的WAIC2023大會上,又釋放出了該體系及體系下的產品全方位升級更新的信息。

對於大模型服務於人類,商湯的第一重思考是——把底座做牢固。因爲大模型的形成並不復雜,它是“大數據+大算力+強算法”結合的產物。

爲了讓大模型的底座更牢固,商湯一直在通過“大模型+大裝置”持續推動AI基礎設施能力的躍進提升,公开資料顯示,商湯歷時多年建設了業界領先的AI大算力,其擁有超過2萬7千塊GPU芯片卡,可輸出5000P的總算力,是亞洲目前最大的智能計算平台之一。

基於大裝置的能力,商湯目前已構建了計算機視覺、自然語言處理、AI內容生成、多模態、決策智能等多個領域的大模型,而且大裝置也成爲了商湯降低AI模型的生產成本、讓大模型深入百業的根本。

站在“大模型+大裝置”的AGI战略布局上,商湯日日新SenseNova大模型體系,正在實現着飛速升級。

有業內人士對「界面新聞·創業最前线」表示,在大模型的基礎上,具備知識圖譜、能對行業知識和數據進行提煉的小模型,在專業領域中的能力一定會超過大模型,這就讓商湯大模型的“體系化”更有意義。

我們也可以這樣理解,“日日新SenseNova”體系,是AGI“湧現效應”的外在表現,就像人到了18歲之後突然有了能力和心智上的突破一樣。現在,“日日新SenseNova”大模型體系在智能座艙、交通、金融、醫療、電商等方面,都有了低門檻、低成本、高效率的創新應用和突破。

(圖 / 日日新大模型目前落地的應用場景)

有位一級市場的投資人甚至這樣對「界面新聞·創業最前线」表示——企業當然可以選擇不接軌大模型,畢竟謀局落子、各有千秋,但未來打敗你的也不是大模型,而是有着AI大模型加持的對手。

2、讓大模型更垂直、更專業

需要強調的是,商湯的“日日新”是一個大模型“體系”,商湯內部對它的定位,是提供一個大模型的超市,在這個“日日新”大模型超市裏面,有數據、模型訓練以及部署的三位一體的飛輪,以此來作爲上下遊合作的基礎。

並且大模型超市也可提供自然語言、內容生成、自動化數據標注、自定義模型訓練等多種大模型及能力,同時結合決策智能大模型,爲AGI實現提供重要起點。

目前,“日日新SenseNova”體系包含了中文語言大模型“商量”,作爲千億級參數的自然語言處理模型,商湯商量SenseChat 2.0版本突破了大語言模型輸入長度的限制,並推出不同參數量級的模型版本,可完美適配移動端、雲端等不同終端及場景的應用需求;還有文生圖生成模型“秒畫”、AI數字人視頻生成平台“如影”、3D背景建築生成平台“瓊宇”和3D物體生成平台“格物”等等。

(圖 / SenseChat 2.0的技術升級)

具體到應用上,之前許多大模型都是通才,但它缺乏行業深度,之前大家被GPT震驚的時候,認爲它什么都會,但如果你是一個行業的資深用戶,你會發現通用大模型在安全、金融、語音這些垂直領域還不是全才。

目前商湯發布的這幾個大模型,都在各自的領域裏稱得上是“行業專家”。有位券商的計算機行業研究員對「界面新聞·創業最前线」說,他對日日新大模型體系中人(AI數字人)-物(3D物體生成)-場(3D背景建築生成)的搭建印象很深。

負責3D物體生成的格物2.0版本,現在支持了多種物品品類的復刻,達到毫米級別,特別是格物還解決了傳統的重建技術中,對高反光、鏡面物體的採集和復刻這一行業難題。珠寶首飾,小家電,金屬物件都能被格物“復原”出來,不僅可以避免傷害和改變物品的情況,還能精確還原物品的外觀和特徵。

如果一家博物館,想對幾萬件動物標本進行3D化處理,依賴激光重建技術還原一個標本就要千把塊錢,這項投入高達數千萬元,沒財力的博物館根本不能去做,而今格物2.0可以完成效果更好的重建,還可以把成本打到很低。

再例如,格物還包含一鍵成圖和一鍵成片等再創作服務,通過一鍵成圖功能,用戶可以生成與物品使用場景相融合的海報,或者試穿試戴的真人海報,相比其他AI技術只能部分還原商品細節,一鍵成圖可以100%還原物品的各個視角和效果。

(圖 / 格物現階段的能力)

基於此,該研究員預判道,商湯的大模型體系在技術上,可以爲電商帶來“通用”的顛覆性解法。

在格物的加持下,許多商家不用再去自研商品的上身效果呈現,就能對一件商品各個視角和效果重塑,提升客戶的沉浸體驗;直播間的實景搭建也不用再耗費太多的真金白銀,基於3D內容生成平台瓊宇,不僅有身臨其境的背景,而且搭建效率、渲染效率也能大幅提升;另外,直播間的“人海战術”也不用太頻繁,因爲通過如影的數字人搭載商量的語言能力,“硅基生命”也可以進行完備的介紹。

公开資料顯示,日日新大模型體系下的商量、瓊宇、格物、如影都在各自的賽道上創造了不小的技術突破,現在已經與一批頭部廠商开始了合作。

基於日日新大模型體系,不僅可以對現實生活中的“人、物、場”進行全面構建,融合不同垂直領域的專業知識,還能構建更懂行業、更具專長的交叉行業大模型,從根本上降低大模型的下遊應用成本和門檻,也使得商湯的收入更加多元化,提升抗風險能力大大增強。

商湯智慧生活等新興業務收入增長加速,且佔比大幅提高,多元化的收入結構標志着商湯的業績成長或步入上升通道,同時也印證了商湯一直堅持投入大模型、賦能百業战略的前瞻性。

3、產業應用場景:最佳練兵場

對於商湯來說,其定位一直是ToB的企業,B端的大模型需求,更多的考慮AI的“泛化能力”,泛化能力通俗來講就是指學習到的模型對未知數據的預測能力。

許多企業客戶知道自己要什么,他們會對大模型的應用給出一個“輪廓”,但是需要商湯用泛化能力,去穩定的預測、迭代,並一步步逼近真實的痛點。

所以,應用場景成爲檢驗大模型能力的關鍵,特別是不同行業還給出了商湯“跨場景”的考驗。

以商湯打造的車路雲協同的交通體系爲例,商湯憑借多模態、多任務通用大模型,开發了路側視覺感知大模型,又結合瓊宇2.0及格物2.0構建了一個智能交通孿生與仿真系統,再利用商量2.0的感知推理和人機交互能力,實現了車路雲共同向大模型對話式交互的演進。

我們看到的交通場景應用是,在車艙外,商湯可以展开端雲協同;在車艙內,打造了一個更懂用戶的“車艙大腦”,帶來集安全、娛樂、教育及效率於一體的智能座艙體驗。

(圖 / 在汽車行業的“跨場景”應用)

與此同時,商湯日日新大模型體系還積累了大量的場景優勢與場景經驗,這對於通用型技術的开發也有巨大的助推作用。 

在醫療行業,商湯由於有着大裝置的超大算力和醫療基礎模型群的堅實基礎,商湯能夠化身“醫療大模型工廠”,基於特定需求,幫助醫療下遊的臨牀長尾問題高效訓練模型,滿足着不同醫療機構個性化、多樣化的臨牀診療需求。

公开資料顯示,商湯已經與行業夥伴合作推出醫療語言大模型、醫療影像大模型、生信大模型等多種垂類基礎模型群,覆蓋CT、超聲、內鏡、病理、醫學文本等不同醫療數據模態。

在具體應用上,商湯爲鄭州大學第一附屬醫院打造影像、病理、心電三大智能遠程診斷平台,借助大模型輔助地區特色病、疑難病的診療,有效推動醫療長尾問題的解決。

另外,基於海量藥學知識和專家經驗,鄭大一附院還與商湯合作研發了行業前沿的用藥咨詢語言大模型,將爲患者提供更智慧便捷高效的线上用藥咨詢服務和體驗,再次實現了大模型從醫到藥的“長尾滲透”。

這些解決方案,現在已落地全國多家頭部三甲醫院,商湯正在用跨場景、跨行業的AI技術,助力醫院在診療、科研、決策等各個層面,實現智慧化轉型升級。

所以在B端,商湯的能力不是模型,也不是模型群,而是擴大自己在行業中的大模型工廠,對企業客戶的痛點解決得更精准。一旦企業客戶習慣於商湯帶來的大模型後,客戶較高的轉換成本也會爲商湯形成較深的護城河。

接下來的大模型軍備賽,或許不再是局限於大模型訓練的追逐,也不是問AGI到底能顛覆什么產業,因爲不同的產業應用場景已成爲大模型的最佳“練兵場”。把不同的賽道整合進一個體系裏,構建起產業生態,才會把價值鏈做到足夠長,這時候,我們要問:“AGI究竟不能顛覆什么?”

*注:文中題圖來自攝圖網,基於VRF協議。返回搜狐,查看更多

追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:大模型時代,商湯如何應對“日日更新”的必答題?

地址:https://www.breakthing.com/post/81601.html