商湯速度:在20多個場景,已爲40多家企業交付AI大模型
1年前

作者:孫妍 來源:IT時報

ChatGPT开啓了AI的下一個時代,行業普遍認爲“大力出奇跡”,算力決定了市場競爭力。

在6月2日舉行的臨港新片區智算大會上,臨港新片區發布了到2025年算力產業規模突破100億元的行動方案,並成立智算產業聯盟。商湯科技成爲該聯盟成員,也成爲臨港新片區智算產業鏈鏈主。

2023年4月10日,商湯科技推出“日日新SenseNova”大模型體系,自我定位是做大模型超市,同時,商湯AI大裝置還能提供“大模型+大算力”的研發體系,直擊AI大爆發時代的“算力焦慮”。

截至今年5月,商湯大裝置已累計服務超40個核心客戶,其中大模型客戶10家以上,並已在超過20個落地場景中實現大模型交付。商湯科技董事長兼CEO徐立在大會上提到大裝置在氣象預測、自動駕駛、遙感、遊戲以及大語言模型等多行業的最新進展。

商湯大裝置爲40多家企業“生產”大模型

目前臨港新片區總算力超過3EFLOPS(FP32),約佔上海市近20%。臨港新片區計劃到2025年,總算力超過5EFLOPS(FP32),AI算力佔比達到80%,建成公共算力服務平台,算力產業總體規模突破100億元。

商湯人工智能計算中心(AIDC)就坐落在上海臨港,也是臨港新片區智算產業鏈鏈主。商湯AIDC目前總算力達5000Petaflops,已有近3萬塊GPU,當前算力可支持20個千億參數超大模型同時訓練,其中國產化算力達500Petaflops。

也是在這個AIDC,商湯大裝置正在爲20多個落地場景、40多個企業“生產”大模型,涵蓋智能駕駛、生物制藥、芯片設計、智慧商業、高校科研等前沿領域。

在徐立演講的开場視頻中,臨港三維場景呈現在觀衆們眼前,以往如此高精度的三維場景重建需要人工數周乃至數月才能完成渲染,如今在大算力和神經渲染技術加持下,只需要數小時就能完成。“在AGI時代,模型的能力可以用算力來衡量。在AI大模型時代,模型參數量將以指數級速率提升,而數據量隨着多模態的引入也將大規模增長,由此帶來了對算力需求的劇增。”徐立說道。

高效率、低成本、規模化,是每個企業對下一個AGI時代的共識。如何達成這一共識?除了輸出算力外,商湯自動化數據標注服務可將智能標注效率提升百倍;大模型推理部署服務可將大模型推理效率提高600%;大模型並行訓練服務支持單集群3200卡5000億稠密參數模型訓練;大模型增量訓練服務能夠將增量微調成本降低90%。商湯還开放模型及AI开發工具鏈,幫助开發者提升效率。

大模型到底是不是“大力出奇跡”的暴力美學?從ChatGPT這一代表來剖析,GPT-4只用了Open AI總數據集的1%,這意味着並不是把所有數據都喂給AI,AI就能聰明。更重要的是,Open AI用最優秀的科學家去做標注,這說明數據的有效性比數據量更重要。

“新二八定律是80%的AI大模型加20%的提示工程,”商湯科技聯合創始人、大裝置事業群總裁楊帆也認爲,模型並非單純的暴力美學,背後是大量的軟件工程系統問題,商湯大裝置長期沉澱了大量的專家認知和工具,具備端到端產品應用解決方案能力。AI產業即將迎來一個更加繁榮的大航海時代,商湯大裝置將通過提供大規模、高效率、低成本的AI基礎設施,讓產業生態百花齊放。

“日日刷新”的AI大模型 跑出商湯速度

2023年,商湯在AI大模型領域跑出了“日日刷新”的速度,高潮是4月推出的“日日新”大模型。

在時下最火熱的對話式自然語言處理大模型領域,“商湯商量SenseChat”在4月初發布後短短一個多月時間裏,在多語言能力疊加表格生成處理能力、歷史知識和歸納能力、多輪對話和長文本理解能力等多方面又獲得顯著提升,並在多個權威測試數據集和評價榜單中位居行業引領地位。商湯AI代碼助手也通過快速迭代實現了619%的推理效率提升,這意味着可以在相同算力資源下支持6倍的用戶數量,大大降低使用成本。

3月,商湯开源的“書生2.5”多模態大模型在檢測、分割、分類三大主流視覺任務下二十多個權威數據集上全面領先,這爲自動駕駛、機器人等通用場景任務提供高效精准的感知和理解能力支持。

4月,全球中期氣象預報AI大模型“風烏”首次實現在高分辨率上對核心大氣變量進行超過10天的有效預報,且在80%的評估指標上超越GraphCast模型。對於人工智能基礎科學(AI For Science)而言,在氣象氣候預報任務中,全球中期天氣預報是最重要的預測任務之一。得益於對高分辨率全球大氣數據建模,“風烏”還可以模擬台風等極端氣象,准確預測台風軌跡。

5月,商湯推出的SenseEarth 3.0遙感大模型不僅擁有業內最全的解譯類別,且在解譯效率、泛化能力、解譯精度等衆多指標上均實現了技術突破。

近日,商湯還聯合提出了通才AI智能體GITM,能在緊密模擬真實世界的暢銷遊戲《我的世界》中做到像人類一樣生存、探索和創造,並在主世界所有技術挑战上實現了100%的任務覆蓋率,在標准任務“獲取鑽石”上,較目前最佳成績提升47.5%。

此前,商湯構建的業界首個感知決策一體化的端到端自動駕駛解決方案UniAD,在多項關鍵數據集與指標上超越了SOTA方法,使車道线的預測准確率提升了30%,預測運動位移的誤差降低了近40%,規劃誤差降低了近30%。

在大會上,商湯還與中國信息通信研究院聯合預發布《新型AI智算基礎設施白皮書》,《白皮書》提到,每在算力上投入1元,將帶動3—4元的GDP增長,特別是在AI For Science領域,AI能將科研周期從數年降低至幾天。

追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:商湯速度:在20多個場景,已爲40多家企業交付AI大模型

地址:https://www.breakthing.com/post/65547.html