商湯版ChatGPT來襲，中國激战千億“大模型”

相關報導

投資人說

1年前

商湯版ChatGPT來襲，中國激战千億“大模型”

大模型只是起點，奔向 AGI 之路才是重點。

來源 | 鈦媒體 作者 | 林志佳 出品 | 投資人說

隨着ChatGPT爲代表的預訓練大模型帶來新一輪人工智能（AI）熱潮爆發，繼百度、阿裏、360之後，又一家大廠推出GPT大模型產品。

獲悉，4月10日，AI 公司商湯科技正式發布全新“日日新SenseNova”大模型體系，以及自研的中文語言大模型應用平台“商量”（SenseChat），參數量達千億，可實現文本生成、圖像生成、多模態內容生成等能力與場景應用。

商湯科技董事長兼CEO徐立表示，上述這些生成式人工智能（AIGC）產品將在醫療、短視頻、教育、營銷以及开發等產業領域應用落地。

商湯科技聯合創始人、首席科學家王曉剛表示，目前已經有一些合作夥伴和客戶开始內測其產品。

未來，商湯版的GPT主要面向企業端（B2B）業務。

此外，商湯“日日新SenseNova”大模型體系已全面支持了智能汽車、智慧生活、智慧商業、智慧城市等業務板塊，而且商湯將向客戶提供涵蓋圖片生成、自然語言對話、視覺推理和標注服務等API接口。

事實上，自2022年12月开始，美國OpenAI公司推出的 AI 產品ChatGPT以及背後的GPT大模型，已經引發了一場 AI 新浪潮。

但 AI 技術的終極目標通用人工智能（AGI）可不是誰都能獲得的。

《奇點臨近》作者雷庫茲韋爾曾表示，直到2029 年，人類才有超過50%的概率开發出AGI。

而作爲 AI 技術積累最深厚的中國公司，如今商湯抓住了大模型這波新浪潮，以期在未來幾年內實現重大突破，從而邁向 AI 領域這顆皇冠上的明珠——AGI的前沿研發與商業化進程。

GPT大模型熱潮來襲

如今，火爆全網的 AI 聊天大模型應用ChatGPT訪問量已飆升至8.89億次。

它也是歷史上最快達到1億月活的應用，而且整個熱潮已蔓延至微軟、谷歌等很多大廠开始關注大模型。

過去40天，大模型集中爆發，GPT-4、微軟Microsoft 365 Copilot、Midjourney V5、Google PaLM API、英偉達新顯卡接連出場。

尤其是微軟，將GPT-4接入Word、Excel、PowerPoint等Microsoft 365 Office辦公套件中，即推出一款新的 AI 驅動的產品Copilot（副駕駛），像助手一樣用 AI 幫助人們生成文檔、電子郵件、PPT等，從而讓 AI 接入了生產力。

此外，創造出ChatGPT的美國OpenAI公司還推出插件功能，實現了“App Store時刻”，讓生成式 AI 真正變革了人類的生產力。

GPT-4加持的微軟Word平台，支持自由編輯 AI 生成的文本

天津大學自然語言處理實驗室負責人、教授熊德意表示，從 AI 發展角度看，這是一個重要的裏程碑，其意義要高於7年前的“阿爾法狗”。

實際上，過去60多年間，利用 AI 技術，智能化、數字化和人口紅利共同推動了中國工業與產業快速發展，尤其是深度學習十年間的快速進步。

真正讓 AI 在很多領域突破了“工業紅线”，在諸多特定的垂直場景中帶來了效率的提升。

不過，定制化AI模型的开發模式，依然面臨研發成本高、周期長等問題，而且現在80%的應用場景都是低頻的、長尾的需求，但卻面臨投入大量人力、收集巨量數據，卻不能解決小數據、小樣本等實際應用問題。

而谷歌2017年發布的Transformer框架催生了新的研究範式，即基於一個強大的多模態大模型，使整個網絡結構完全由Attention機制釋出。

讓機器同時學習大量的文字，通過強化學習和人類反饋不斷強化大模型的學習能力，從而更高效地解決海量的开放式任務，讓 AI 實現了從“數據飛輪”到“智慧飛輪”的演進，最終邁向 AGI 人機共智。

AI 對於开發者來說是一種模式的變化，下一步對很多內容創作者來說，一樣會面臨工作模式的巨大變化。

未來人們不需要具備底層的制作能力，而是需要更多暢想、連接、協同的能力，這些能力才是跟AI協同共創的核心商業能力。

而這種生產力模型的變革，可能會產生互聯網SaaS（軟件運營服務）應用和工具鏈，或者基於這些工具鏈新生成的社區，也就是我們可能會擁有下一階段的‘小紅書’、B站等一系列互聯網應用。

商湯科技董事長兼CEO徐立，今年2月談及ChatGPT引發的商業產業變革時表示。

作爲 AI 行業的領頭羊，商湯科技擁有很強的技術實力和積累，能夠參與到這場大模型軍備賽當中。

自2018年起，商湯科技便致力於 AI 大模型的研發，有着超過5年的技術積澱和實踐經驗。

目前，商湯已成功研發了320億參數量的全球最大的通用視覺模型，在自動駕駛、工業質檢、醫療影像等多個領域得到廣泛應用。

“‘好的原材料’就是要深入到各個行業裏積累非常多的know-how。美國公司OpenAI能夠把ChatGPT做出來，背後也有多年積累，從小模型到大模型的研發，中間積累了非常多的know-how。”

王曉剛表示，商湯具有非常類似的優勢，內部有非常多的研發人員能深入到一线，用大模型去解決實際問題，有很好的技術積累。

王曉剛強調，我們要擁抱全新研究範式，這裏面的關鍵是我們要轉變觀念。

十年前，商湯還沒有誕生，我們創始團隊在當時做的決定就是-All In Deep Learning（深度學習）。

我們之前在傳統視覺技術裏也有較長積累，但是，當新技術來了，我們就果斷地去擁抱新技術。

今天也一樣。

實際上，本輪國產大模型競賽中，有三個能力極爲重要：

算力、數據和應用場景。

而在國內致力於To B（企業端）業務的大廠中，商湯處於第一梯隊。

商湯科技前瞻布局，既依托SenseCore AI大裝置，以5000 Petaflops超大規模算力和出色的並行計算能力，爲大模型研發提供強大的算力基礎設施，堪比芯片行業的“光刻機”；

同時還有數據算法和強大的產業化能力，在智慧城市、智慧商業等領域的長期耕耘，商湯積累了海量真實世界的高質量視覺數據，支持商湯在視覺技術方面的持續突破。

領先的算力布局，以及豐富的視覺數據和技術積累，爲商湯多模態大模型的研發提供有力基礎。

徐立曾表示，AI 的核心是解決“工業紅线”問題，而商湯SenseCore AI 大裝置相當於粒子對撞機，成爲業內稀缺的大模型專用基礎設施，可以解決 AI 軟件所需算力支撐挑战——類似光刻機，解決芯片的“工業紅线”。

因此，如今基於“大模型+大算力”，商湯擁有了 AGI 時代的“光刻機”，成爲 AGI 和大模型時代的基礎設施服務領導者，對整個行業具有重要的應用價值和战略意義。

“需要好的頂層設計，很好地把原材料設計成一個體系，商湯能朝着 AGI 的目標努力。除了大裝置和基礎設施以外，還要能從算法、框架上，把整個系統設計好。”王曉剛表示。

王曉剛稱，如今，商湯研發想要做的事情就是怎么樣去用好這些新技術。

它帶來的新範式包括人機共智，一起去創造新智慧。

核心在於怎樣用好我們的這個大模型，能夠去形成正向的反饋，而不是一味地說“很害怕被顛覆了”。

千億商湯大模型有何新亮點

最近幾天，國內科技大廠的GPT AI 大模型密集呈現，從百度的文心一言，到阿裏通義、華爲盤古和京東言犀，引發國內企業的大模型“逐鹿潮”。

相對於其他大模型產品，商湯此次推出的千億大模型真正服務於To B（企業）端客戶，而非一個被網絡調戲的工具。

我們梳理了四大亮點和優勢，從體系、語言大模型平台，到應用場景和行業落地，打通大模型產業閉環。

首先是國內首個大模型體系。

4月10日，商湯科技正式發布商湯“日日新SenseNova”大模型體系，基於數據、模型訓練以及部署的三位一體的飛輪，提供自然語言生成、圖片生成、感知模型預標注、模型研發等多種能力，並持續更新多模態大模型，同時結合決策智能大模型，是實現AGI的重要起點。

據悉，商湯“日日新SenseNova”大模型體系的名稱取自《禮記大學》中，湯之盤銘曰：

“苟日新、日日新、又日新”，商湯希望在模型的迭代速度及處理問題的能力上可以日日更新，不斷解鎖AGI更多可能。

實際上，大模型最核心的需求就是構建體系架構。

而在前期，商湯前瞻性打造了人工智能基礎設施SenseCore AI大裝置——27000塊GPU（圖形處理器）芯片，5000 Petaflops超大規模算力、是亞洲最大的智能計算平台之一、支持20個千億參數超大模型同時訓練、支持最大4000卡並行單任務訓練，可持續7天以上不間斷穩定訓練——這是國內爲數不多接近GPT所需算力的重要基礎設施公司。

如今，基於AISaaS服務架構，商湯已經打造了CV（計算機視覺）、NLP（自然語言處理）、AIGC（人工智能內容生成）多個AI大模型。

未來基於這些核心優勢，在“日日新SenseNova”大模型體系和SenseCore AI大裝置的支持下，商湯的多模態大模型持續演進，同時結合決策智能大模型，爲AGI的實現提供重要起點。

第二大亮點是首個自研中文語言大模型應用平台。

在“日日新SenseNova”大模型體系當中，商湯科技4月10日還推出了自研的中文語言大模型應用平台“商量”，具備領先的語言理解、生成能力，將科技與人文相互交融。

作爲高效聊天助手，它可以秒解復雜問題，提供定制化建議，還能輔助創作一流文本，並具備不斷學習進化的特性等。

具體來說，在用戶價值方面，“商量”可以實現單輪、多輪對話和超長文本理解能力，而且憑借“商量”中文語言大模型強大的長文本理解能力，幫助用戶快速通過與大模型互動來獲取知識、尋找答案；

在技術能力優勢方面，商湯擁有千億參數中文語言大模型，具備問答、理解與生成等全面的中文語言能力。

支持企業服務、城市管理、汽車出行等600+垂直領域，並擁有邏輯推演與智能、兼具理解廣度與深度、知識自動及時更新等能力。

無論是一人一句編故事，還是連續對話能力，“商量”都能准確、快捷的回答出來。

此外，“商量”已經在行業實現了應用，尤其在醫療行業和編程領域。

從現場實際demo當中可以看到，基於大模型應用平台，它能夠准確、快捷地回答關於腹部痛等關鍵性問題，給出醫療參考方案。

第三大亮點是生成式AI應用，真正爲短視頻、直播產業帶來生產力提升。

此次，商湯把GPT大模型應用於生成式 AI 領域，重構人與空間在數字時代的結合。

商湯基於“日日新SenseNova”大模型體系，自研了包括秒畫、如影、瓊宇、格物等視頻內容的制作和生成工具平台，爲短視頻、直播產業帶來生產力的提升。

以“秒畫”爲例，其是商湯科技打造的AI內容創作社區平台，可幫助用戶輕松地創作高質量的藝術作品，自動生成元素和細節，並可不斷學習與提升。

其中，“秒畫”具備超10億參數自研文生圖生成模型，支持二次元、三次元等多種生成風格；

推理速度快，單卡支持每2秒生成1張512分辨率的圖片；

用戶可基於單卡A100，5分鐘內定制屬於自己的LoRA模型20張訓練圖片；

匯聚了1萬+开源模型，基於平台發布的模型可設置爲ToB服務API，結合商湯大算力對外提供商業化服務，支持用戶訓練個性化繪模型，滿足不同繪畫風格需求。
“秒畫”帶來個性化文生圖能力（來源：商湯）

而另一種“瓊宇”、“格物” 3D內容生成平台，是商湯科技基於神經輻射場技術（NeRF）的3D內容生成平台，分別是指瓊宇大空間3D內容生成應用、格物小物體3D內容生成應用，可基於 3D 內容生成技術實現對空間和物體的復刻與交互。

傳統人工建模10000人/天的建模任務，通過“瓊宇”只需要2天即可完成（算力爲1200 TFLOPS）。

商湯表示，上述兩套平台生成的各類3D內容都夠進行再編輯再創作，通過海量高精度數字資產的生產，滿足影視創作、建築設計、商品營銷、數字孿生管理等各類對可交互3D實景內容有強烈需求的應用場景。

最後一個亮點就是獨特的行業賦能。

商湯讓大模型對外提供API接口，以及多元化、多種大模型即服務（MaaS）。

具體來說，在“一平台四支柱”的战略體系下，商湯“日日新SenseNova”大模型體系已全面支持了智能汽車、智慧生活、智慧商業、智慧城市等業務板塊，打通了多個領域、行業的應用閉環。

而且，基於“日日新SenseNova”大模型體系，商湯將向客戶提供涵蓋圖片生成、自然語言對話、視覺推理和標注服務等API接口。

客戶可根據實際應用需求，靈活調用商湯大模型的各項AI技術能力，低門檻、低成本、高效率地實現AI技術在實際業務環節中的部署，或進行二次开發，創造更多價值。

此外，基於商湯AI大裝置和大模型體系，商湯將面向客戶提供涵蓋自動化數據標注、大模型推理部署、大模型並行訓練、大模型增量訓練、开發者效率提升等多種大模型即服務（Model-as-a-Service），包括自動化數據標注、大模型推理部署、大模型並行訓練和大模型增量訓練服務、开發者效率提升等。

“這絕對不只是說訓練一個參數量非常大的模型，它是一個體系化的大工程。”王曉剛表示。

王曉剛提及，“湧現”這個現象的出現意味着大模型會不斷給你驚喜，大模型能有新能力。

而商湯在大模型訓練本身，以及know-how任務理解都有這樣的技術實力。

結合自身的特點，具有通用性的商湯大模型，能夠真正去幫助客戶解決需求和問題。

“未來，我們也是希望能夠依靠社區的力量把我們的這些模型進行調教，不只有原始模型，還有各種各樣的這樣的一些模型存在，能夠更好的往前推進。”王曉剛坦言稱。

大模型只是起點 奔向 AGI 之路才是重點

對於整個 AI 技術進程來說，大模型絕對不是 AI 發展的終點，而只是起點。

1950年，才華橫溢的計算機科學家艾倫圖靈提出了一個他稱之爲“模仿遊戲”的思想實驗。

面試官通過打字機與兩個對象交談，知道一個是人，另一個是機器。

圖靈建議，如果一台機器能夠始終讓面試官相信它是人類，我們就可以說它有能力思考。這就是著名的“圖靈測試”。

後來的70年間，整個 AI 行業都爲之努力，希望打造通過“圖靈測試評估”能力的 AI 技術。

如今，AI 算法、算力、數據“三駕馬車”同步突破，AI 技術已經蓄能完畢，所有人終於可以大展身手了。

作爲中國 AI 領域競爭與發展的核心玩家，商湯擁有 AI 行業全棧性研發能力。

商湯科技聯合創始人、大裝置事業群副總裁陳宇恆表示，所謂的通用人工智能新的創新範式，可以極高的體現商湯現有的一些 AI 產品的模式和能力。

從大的方向上，商湯作爲人工智能的頭部的企業，未來肯定還是要去挑战更大的模型。

因爲現在很明顯的趨勢就是，每一代的大模型 AI 和算力有很大的相關性。

下一代人工智能比上一代，比如說 GPT-4 比 GPT-3可能是百倍級的算力的需求，甚至它的參數量是十倍以上的需求，對應也需要更多的數據去完成訓練。

所以要不斷地去接近所謂的通用人工智能或者 AGI 的路线上，肯定是要把基礎的超大模型越做越大。

這是未來 2 到 3 年，整個無論從學術界還是從工業界，還是從我們自己的對 AI 的理解上，都是比較明確的方向。陳宇恆表示。

此前，商湯科技發布了2022財年報告。

財報顯示，2022年，商湯研發支出達38億元人民幣（扣除以股份爲基礎的薪酬开支），同比增長24%，2018年至今累計研發投入達128.47億元；

人均每年研發模型數相較於2021年進一步提高了90%，累計生產的商用模型數提高了93%，至6.7萬個。

當中國大力發展 AI 技術的重要時機下，商湯大量投入技術研發，不斷推進數字化、智能化、產業化升級，符合科技創新下的時代特徵。

如今，商湯高強度的研發投入正在开花結果，在國內大模型軍備賽中實現了第一梯隊的飛躍，成爲行業極稀缺的“頭雁”。

英偉達CEO黃仁勳曾表示，當下“我們正處於 Al 的iPhone時刻”，而商湯，也正在迎來屬於自己的“iPhone 時刻”。

“AI是生產‘生產力工具’的工具，它將开啓軟件开發新範式，把我們帶入‘新二八定律’的時代，80%的工作由機器完成，20%的工作由人來做。”

徐立認爲，持續的大規模技術投入帶來創新，再有商業模式發展，這是一條罕有人走的路。

商湯始終堅信 AI 技術變革帶來增量價值，必將推動普惠和公平的智能時代到來。

END

追加內容

本文作者可以追加內容哦 !

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。

標題：商湯版ChatGPT來襲，中國激战千億“大模型”

地址：https://www.breakthing.com/post/53220.html

易點雲通過港交所聆訊，IaaS+SaaS辦公雲破局企服行業

【BT金融分析師】愛彼迎面臨同業激烈的競爭，分析師稱對其持悲觀看法

國際

俄羅斯學者：中國以實際行動參與全球治理體系改革

2024-11-24

國際

推動中巴兩國友誼日益深厚（僑界關注）

2024-11-24

國際

這場“雙向奔赴”，續寫中巴友誼新篇

2024-11-24

國際

黨內對手放棄競爭，朔爾茨瞄准明年連任

2024-11-23

國際

南蘇丹首都朱巴市中心爆發激烈槍战我使館提醒在南中國公民注意安全

2024-11-23

台灣

森林保育注新血！林保署攀樹技能訓練　12位林業人員順利取得證照

2024-11-23

台灣

發明運用在生活！第20屆世界青少年發明展　台灣代表隊隊勇奪13金

2024-11-23

台灣

「微型電動二輪車」車主注意！11/30起未掛牌上路　最重罰3600元

2024-11-23

國際

普京：俄軍在對烏行動中試驗新型中程高超音速導彈

2024-11-23

Columns

robot

森林保育注新血！林保署攀樹技能訓練　12位林業人員順利取得證照

robot

發明運用在生活！第20屆世界青少年發明展　台灣代表隊隊勇奪13金

robot

「微型電動二輪車」車主注意！11/30起未掛牌上路　最重罰3600元

robot

台語詩人林宗源辭世　文化部將呈請總統明令褒揚

robot

盧秀燕邀她當購物節行銷大使　淡定百萬得主慌回7字笑爆全場

robot

夜衝賞日出竟「攀爬武嶺亭」！太管處怒報警：破壞公物查明後開罰

See All