騰訊的大模型故事爲什么要從產業开始？

1年前

騰訊的大模型故事爲什么要從產業开始？

面對大模型這樣一個被馬化騰視爲幾百年不遇、類似發明電的工業革命一樣的機遇，騰訊終於公布了其在這一領域的全面布局。

一方面，通過騰訊雲MaaS，將大模型能力應用於內部產品及To B業務之中。另一方面，騰訊在企業服務、人工智能領域的投資已累計超過280起，其中包括估值達到12.5億美元的大模型初創企業MiniMax。

來源：新財富雜志（ID：xcfplus）

作者：張天倫

種種跡象表明，騰訊的大模型故事將着重從B端市場展开。

從6月18日在國內率先推出行業大模型解決方案騰訊雲MaaS（Model-as-a-Service，模型即服務），到9月7日將騰訊混元大模型放到其在產業互聯網領域最具影響力的“全球數字生態大會”上發布，騰訊對產業互聯網的重視，可見一斑。某種意義上說，已在C端擁有數個覆蓋10億級用戶的騰訊，未來能否再造一個騰訊，系於B端。

事實上，在人們的新鮮勁過後，年初爆火的ChatGPT自今年6月起便陷入了流量瓶頸。根據SimilarWeb的監測數據，其用戶數量從5月最高的19億人下滑至7月的15億人。這也讓大模型在C端直接以產品形式落地的商業前景蒙上陰影。

相比較下，數字化轉型需求更爲明確的產業客戶，對大模型出色的語言理解、內容生成等能力，有着更強的付費意愿。因此，在To C或To B的路线選擇上，騰訊從商業模式的角度出發，選擇率先從後者發力。

在騰訊雲副總裁、騰訊雲智能負責人吳運聲眼中，產業場景是大模型的最佳練兵場，而大模型也可以爲騰訊To B業務的商業模式拓展提供新的思考。“當前，企業客戶在應用大模型時，會面臨計算資源少、數據質量差、投入成本高、專業經驗少等現實問題的挑战。拆解客戶所遇到的問題，也會爲我們帶來很多業務契機。”

自2018年進軍產業互聯網以來，騰訊面向B端客戶的金融科技與企業服務業務收入在不斷增長，2019-2022年從1013.55億元增至1770.64億元，佔營收的比例從26.9%提升至31.9%（圖1），但一份券商研究報告顯示，2020至2022年，騰訊雲的毛利率有待提升。

以至於在主打“降本增效”的2022年，騰訊雲與智慧產業事業群（CSIG）明確各業務要全面提升利潤率更高的自研產品比例，並將業績考核重點轉爲業務的利潤水平。

“我們始終認爲，大模型需要基於產業場景，與企業數據融合，才能釋放出最大的價值。”騰訊集團高級執行副總裁、雲與智慧產業事業群CEO湯道生稱。

那么，當騰訊混元大模型正式亮相，騰訊雲MaaS能力完成升級迭代，騰訊To B業務的發展又將產生什么樣的變化？

商業鏈路：

從技術底座到智能應用

大模型本身並非一個新的事物。在吳運聲看來，大模型的本質是深度學習，而騰訊早在十幾年前便已开始對深度學習進行布局。只是當2017年谷歌提出神經網絡模型Transformer，驅動深度學習模型參數從過去的以千爲單位，發展至如今超過千億級別的大模型，並在2022年底爆發時，才闖入了人們的視野。

拆解騰訊在大模型領域的布局，可分爲三大模塊。

第一塊是騰訊雲過去通過研發等方式積累的算力、算法、數據等基礎設施及AI工具，這是大模型訓練的前提條件。

第二塊，基於各類基礎設施及工具，騰訊全鏈路自研出了基礎大模型“混元”。所謂基礎模型，是在大量無標籤數據集上訓練的AI神經網絡，可處理從翻譯文本到分析醫學影像等各種工作。

第三塊，是以騰訊混元大模型爲基礎模型所衍生的各類應用及服務。典型如面向企業客戶的“騰訊雲MaaS服務”，即是將騰訊混元大模型與騰訊雲過去積累的行業解決方案、企業級應用結合後的一類業務模式。

或因已有明確的架構，“在ChatGPT爆火後，CSIG內部甚至沒有專門針對行業大模型的立項。各個團隊最大的變化是在日常溝通時增加了很多與大模型相關的深入探討，包括與現有產品的結合，以及未來商業路徑的選擇。”吳運聲稱。

騰訊圍繞大模型所構建的新的商業模式，也大抵延着以上三大模塊而展开。

例如，在第一塊的基礎設施方面，用於訓練大模型能力的HCC高性能計算集群、星脈高性能計算網絡、向量數據庫等基礎設施，同樣可以提供給有大模型訓練需求，但在軟、硬件上有短板的客戶。

據騰訊集團副總裁、政企業務總裁李強透露，MiniMax、百川智能旗下的大模型，都使用了騰訊的算力。MiniMax是由前商湯科技副總裁、通用智能技術負責人閆俊傑成立的大模型初創公司，其大模型MiniMax-ABAB(“阿巴阿巴”)瞄准AIGC領域。百川智能則由搜狗公司創始人王小川與前COO茹立雲於2023年4月共同創建，6月便宣布推出大模型Baichuan-7B。2023年8月31日，首批大模型產品獲批名單公布，百川大模型在列。

在基礎設施中的算力層面，騰訊雲2023年4月發布的新一代HCC高性能計算集群，即是專爲大模型訓練所設計，能夠提供高性能、高帶寬、低延遲的智算能力支撐。而後在7月，其基於每日處理千億次檢索的向量引擎（OLAMA），推出向量數據庫（Tencent Cloud VectorDB），使數據接入AI的效率較傳統方案提升10倍。“當你想在大模型中找到一張帶‘貓’的圖片，騰訊雲向量數據庫能在100毫秒內，從10億張向量化的圖片中，返回查詢結果。”湯道生表示。

此外，在工具層面，騰訊混元大模型在訓練數據時採用的，同樣是自研的訓練框架AngelPTM。這一框架使騰訊混元大模型的訓練速度相比業界主流框架提升1 倍，推理速度比業界主流框架提升1.3倍。

一方面，AngelPTM源源不斷提供引擎動力；另一方面，騰訊雲TI平台的工具鏈也包括TI-ONE訓練平台、TI-Matrix應用平台等，可爲客戶提供大模型訓練、精調工具鏈，以快速生成更有針對性的專屬大模型，滿足企業個性化需求。

在第二塊基礎模型方面，據湯道生介紹，作爲基礎大模型的“混元”，如今擁有超千億參數規模，預訓練語料超2萬億tokens（可被認爲是詞語的片段），具有強大的中文理解與創作能力、邏輯推理能力，以及可靠的任務執行能力。

而從第三塊行業模型看，基於基礎大模型所構建的行業大模型精選商店“騰訊雲MaaS服務”，即是將騰訊雲在基礎設施、行業解決方案、企業級應用等領域的積累升級打包所形成的一站式服務。

“在騰訊雲行業大模型精選商店中，我們不僅提供騰訊混元大模型，還上架了20多種行業最新、最流行的开源通用大模型，以及覆蓋金融、文旅、零售、政務、醫療、教育等20多個領域的行業大模型。企業可以根據需要，選擇合適的模型，然後借助騰訊雲TI平台，導入企業專有數據，做進一步的訓練與精調，快速生成更有針對性的專屬大模型，滿足企業個性化需求。同時，我們也將大模型與騰訊的行業解決方案、企業級應用結合，在生產、營銷、售後服務、辦公等多個環節，實現能力提升，達至降本增效。”湯道生稱。

可以看到，騰訊基於過去在人工智能領域的積累，已經針對B端客戶對大模型的各類需求，設計出了一條極長的商業鏈路。

在拆解騰訊大模型商業路徑的同時，吳運聲反復強調，推出“騰訊雲MaaS服務”的初衷，是從多個角度解決B端客戶需求。除降本增效外，其需求還包括賦能傳統產業跨界融合、實現創新升級等。

吳運聲在騰訊集團內部身兼多職，除了擔任騰訊雲副總裁外，他還是騰訊雲智能負責人以及優圖實驗室負責人，其工作重心之一便是強化AI技術與騰訊雲的底層融合。

例如由其負責的優圖實驗室成立於2012年，如今已通過計算機視覺算法的迭代，實現對人臉識別、圖像識別、視頻特效等功能的持續優化，其應用落地場景從最初的QQ空間的“面孔牆”、微衆銀行的“人臉遠程开戶”，到如今，已深入教育、金融、工業等領域，構建了超過50個行業應用。而在2021年成立的騰訊雲智能品牌，則將騰訊分散於優圖等實驗室的AI能力進一步深度融合，目的是形成一條完整的AI產業落地鏈條。

據吳運聲透露，如今，騰訊雲團隊從對接企業的通用大模型研發需求，至行業大模型方案的最終落地，業務均有覆蓋。在實施中，其通常有四個步驟。

第一步是了解客戶需求。例如，有客戶想做基於語音識別的大模型，那么，騰訊雲便需要了解客戶擁有的語音文件的數量、規模，以及語音中的專業化術語等，這一環節考驗的是團隊對行業及企業的理解。

第二步是結合客戶需求、預算，以及所掌握的訓練數據量等，推薦基底模型。“通常，我們會推薦3-5個基底模型做實驗，最終選擇一個最爲合適的。”吳運聲稱。

第三步是基於基底模型進行數據訓練，其中涉及TI平台、HCC高性能計算集群等基礎設施的應用。

第四步，當模型正式上线，騰訊雲還會負責數據存儲、算力資源部署等運維工作，以及後期大模型的優化及迭代。

如今，CSIG內部涉及人工智能研究的產品團隊，不少重心放在了大模型方向。湯道生稱，目前CSIG已和1.1萬家生態夥伴展开合作，推出覆蓋100多個產業場景的行業解決方案，服務了60多萬家制造企業。未來，在大模型加持下，騰訊雲所創造的商業價值能否成爲騰訊繼移動社交、網絡遊戲之外的第三大增長極，值得關注。

應用場景：無聲勝有聲

對於大模型這樣一個被馬化騰視爲幾百年不遇的、類似發明電的工業革命一樣的機遇，騰訊在投資層面也在加緊布局。

“騰訊會議基於騰訊混元大模型打造的AI小助手，已經能夠通過簡單的自然語言指令，完成會議信息提取、內容分析等復雜任務，會後還能生成智能總結紀要。”在2023騰訊全球數字生態大會上，騰訊集團副總裁蔣傑分享的案例顯示，擁有超3億用戶數的騰訊會議，已开始應用大模型的能力。

目前，騰訊已將大模型能力應用於騰訊雲、騰訊廣告、騰訊遊戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ瀏覽器等超50個產品及To B業務之中。

典型如已接入包括廣汽在內的15家車企、超300萬台汽車的騰訊雲車載助手，過去曾存在上下文理解准確率低、復雜場景下語義理解問題不理想等問題，如今，行業大模型的應用，正提升其理解車主復雜意圖的能力及應答能力，最終用戶感受到的，是更自然的人機對話、更合理的行程規劃，甚至是通用知識問答能力。

除了車載助手，在騰訊企點客服、騰訊企點分析、數智人等產品中，騰訊雲的MaaS能力也已進行了模型可用性、易用性等方面驗證。

有騰訊內部員工對新財富表示，未來大模型的能力將會無處不在，但人們若非十分用心，甚至可能都感受不到。

與此同時，行業大模型助力客戶“降本增效”的作用也在逐步顯現。

騰訊雲分享了一個服務稅務部門的案例——過去，當傳統智能客服遇到不在知識庫的問題時，常常無法答復或答非所問，最終依舊需要稅務部門鋪設人力去完成服務。此外，政策法規、辦事指南持續迭代，需不斷投入人力梳理。問題攔截率、覆蓋率低，亟需擴展客服的問答邊界等問題，導致智能客服讓人感覺不智能。

而2023年後，基於MaaS能力，騰訊雲打造的專屬政務大模型，從知識採集到知識運營均實現了智能化升級，業務咨詢的解答率大幅提升。盡管這極大提升了稅務部門的服務效率，節約了人力成本，但不常跑稅務部門的人，並不容易察覺這一變化。

發力大模型投資

在自身看重的領域，騰訊向來是“自研+投資”兩條腿走路，對於大模型這樣一個被馬化騰視爲幾百年不遇的、類似發明電的工業革命一樣的機遇，亦不例外。

執中數據顯示，2023年以來，騰訊分別在4月、6月投資了深言科技、MiniMax兩家大模型創業企業。

深言科技創始人兼CEO豈凡超，是清華大學計算機科學與技術系2017級博士畢業生，主要研究方向爲自然語言處理（NLP），曾在EMNLP等頂會發表論文30多篇。據公开資料，深言科技團隊孵化自清華大學自然語言處理實驗室和北京智源人工智能研究院，由歐洲科學院院士、清華大學計算機系教授孫茂松領銜，並出任首席科學家。

在2023年舉行的第三屆“清華大學國強研究院杯”雙創大賽的路演環節中，豈凡超稱，深言科技的大規模預訓練模型在續寫、改寫、擴寫、摘要4類文本生成任務和6個數據集上，均超過現有其他中文模型，達到了當前最好的中文文本生成效果。這次大賽，深言科技的“基於超大模型的新一代語言理解與生成平台”項目斬獲技術創新賽初創組一等獎。

在獲得騰訊投資後，深言科技估值爲1億美元。據執中數據，與騰訊共同投資的機構還包括紅杉中國、好未來、英諾天使基金等，其他輪次的知名投資方包括水木清華校友基金、奇績創壇等。

相較深言科技，MiniMax的來頭更大。在騰訊投資之前，MiniMax已完成兩輪融資，投資方包括米哈遊、IDG資本、高瓴創投、雲啓資本、明勢資本等。而在騰訊投資之後，MiniMax的估值已高達12億美元。

根據公开資料，MiniMax直接從底層的基礎模型做起，自研了三個基礎模型，其法定代表人、技術合夥人楊斌曾在今年初表示，MiniMax可能是國內第一家同時擁有三個模態大模型能力的創業公司。值得一提的是，在大模型對战平台SuperCLUE發布的中文大語言模型排行榜上，MiniMax的模型在國內企業中排在第7名。

除投資大模型初創企業之外，近年間騰訊對B端生態的加速布局，或爲其在大模型領域的突破積累了更多的籌碼。

根據執中數據，自2018年騰訊入局產業互聯網以來，其在企業服務領域的投資事件已達到178起，僅次於文化娛樂領域的221起，且對人工智能的投資也達到38起（圖2）。