WAIC上演大模型競技賽,“國家隊”百度進化到哪兒了?
1年前

文/王慧瑩  

編輯/陳鋒  

今年5月,中國科學技術信息研究院發布了《中國人工智能大模型地圖研究報告》,這份報告顯示,截至5月28日,國內10億級參數規模以上基礎大模型,至少已經發布了79個。

這一“百模大战”的盛況,在這兩天舉辦的2023世界人工智能大會(WAIC)上,得到了集中體現。

一方面,這屆WAIC,堪稱是大模型的主場。據連线Insight觀察,大會現場展出的大模型新品,超過了30余款。

另一方面,除了展出大模型之外,圍繞大模型相關的前沿算法、智能芯片等基礎設施,也成了另一個重頭戲。

比如百度展示了文心大模型3.5版本、文心一言、業內首個一站式企業級大模型平台文心千帆,還重點展出了其全棧自研的AI大底座。

百度在展會現場展示AI大底座 

從這屆WAIC來看,業內“做不做”大模型的討論已經告一段落了,新的焦點是,各家的大模型到底有哪些差異化?底層技術上到底怎么樣?以及接下來他們將怎么布局?

值得注意的一點是,大會上發布的《2022 全球人工智能創新指數報告》指出,當前全球人工智能處於加速發展期,其中有兩個趨勢較爲關鍵:

數據和算力基礎設施建設持續推進;人工智能產業化進程明顯加快。

不難發現,這兩點趨勢所指向的,正是當前大模型產業最爲關鍵的兩個問題:

第一是技術側,支撐大模型能力的底層基礎設施是否完善,決定着一家企業能否做出大模型、做好大模型的能力迭代;

第二是應用側,大模型如何落地,如何賦能到千行百業、如何真正釋放出產業化價值,決定着一家企業在大模型賽道的上限。

而真正值得討論的是,在接下來的這場馬拉松中,擁有怎樣特質的企業,將持續成爲領跑者?

1、WAIC成大模型“秀場”:“國家隊”來了,秀產品也秀技術

大模型賽道到底有多熱?這屆WAIC是一個最佳的觀察窗口。

連线Insight觀察到,包括但不限於互聯網/雲計算大廠陣營的百度、華爲等;運營商陣營的中國移動、中國電信等;知名AI企業陣營的商湯科技等;大模型初創企業陣營的瀾舟科技、銜遠科技等,都帶來了大模型的最新產品及最新進度。

與此同時,在百花齊放的態勢下,大模型“國家隊”也確定了陣容。

7月7日的大會論壇上,國家標准委指導的國家人工智能標准化總體組,宣布我國首個大模型標准化專題組組長,由上海人工智能實驗室與百度、華爲、阿裏等企業聯合擔任,現場進行了證書頒發並正式啓動大模型測試國家標准制訂。

這意味着,過去混沌的大模型格局,正在逐漸變得越來越清晰。

再綜合來看,這屆以大模型爲絕對重心的大會上,呈現出了以下幾個特徵:

市場上幾乎所有的大模型廠商都來了;

圍繞大模型,廠商展出的重點,還包括了大模型底座、MaaS解決方案等;

通用大模型之外,面向垂直場景的行業大模型也不在少數,以及能夠爲客戶提供私有化部署的大模型也不在少數。

基於這幾點,這屆WAIC實則爲我們提供了一個觀察大模型行業現狀,及接下來發展趨勢的最佳機會。

其中,作爲大模型產業最具代表性的玩家之一,百度又是一個很好的觀察切口——它是最先探索將產品落地的AI企業之一,也是率先推出通用大模型產品的廠商之一。

除了展示了文心大模型的最新進展、大語言模型文心一言的最新進展外,百度還重點展示了業內首個一站式企業級大模型平台文心千帆、全棧自研的AI大底座。

文心千帆大模型平台,圖源百度智能雲微信公衆號 

自下而上層層拆解就不難發現,百度在這次大會上的動作,不僅僅是對外展示過去一段時間在大模型領域的最新成果,同樣也在進一步向外界傳達其大模型的布局思路。

一方面,通過AI大底座的展示,百度透露出一個信號,布局大模型,最關鍵的還是要看技術。

另一方面,重點展出文心大模型、大語言模型文心一言和一站式企業級大模型平台文心千帆的最新進展,這意味着,百度做大模型,最終的思路是通過底層的技術迭代以及开放的平台生態,推動大模型的場景落地。

其中邏輯在於,文心大模型是百度的基礎大模型,文心一言是知識增強大語言模型,是文心大模型中的一種,而文心千帆平台要做的事情,就是將百度的這些模型以及第三方模型整合到一起,提供給客戶使用,在這一基礎上,文心千帆還提供覆蓋全生命周期的大模型工具鏈,同時支持大模型定制开發。

對此,王海峰指出,在文心一言這類大模型產業落地的進程中,可以採用“集約化生產,平台化應用”的模式,即具有算法、算力和數據綜合優勢的企業將模型生產的復雜過程封裝起來,通過低門檻、高效率的生產平台,爲千行百業提供大模型服務。

據百度透露,目前文心大模型已經在能源、汽車、政務、交通、金融等十余個行業率先落地。

透過百度,不難發現,在當下的大模型賽道,真正的角逐重心,首先是技術,緊接着是場景落地,可以肯定的是,這將是一場馬拉松。

2、技術要夠硬核,也要有長期主義

大模型時代到來後,IT技術棧也發生了根本性變化,即從芯片層(CPU爲主)、操作系統層、應用層的三層架構,發展成爲了四層架構:芯片層(GPU爲主)+框架層+模型層+應用層。

賽道中的任何一家入局企業,都需要適應這一新的變化,在底層能力上持續進化、迭代。

百度是其中最有代表性的一家,從昆侖芯到飛槳深度學習框架,到文心大模型,再到上層的應用,在每一層技術棧都有布局和自研技術。百度也是全球爲數不多的進行全棧布局的AI公司。

在大會現場,王海峰也指出,尤其是在框架層和模型層,百度的自研優勢更加突出。

框架層,飛槳是我國第一個自助研發的產業級深度學習开放开源平台,在中國深度學習平台綜合市場份額上連續兩年位居第一。截至目前飛槳已凝聚 750萬名开發者,這也是百度2023年以來首次對外披露飛槳生態最新數據。

模型層,王海峰在現場指出,文心大模型現在已經迭代至3.5,實現了基礎模型升級、精調技術創新、知識點增強、邏輯推理增強等,模型效果提升了50%,訓練速度提升了2倍,推理速度提升了30倍。

而文心大模型的迭代,正是一個通過技術創新推動大模型能力迭代的範本。

在基礎模型訓練上,文心大模型3.5採用了飛槳最先進的自適應混合並行訓練技術及混合精度計算策略,並採用多種策略優化數據源及數據分布,這加快了模型迭代速度,同時提升了模型效果和安全性。

同時,文心大模型3.5採取了多類型多階段有監督精調、多層次多粒度獎勵模型、多損失函數混合優化策略、雙飛輪結合的模型優化等技術,使模型效果及場景適配能力進一步提升。

此外,在知識增強和檢索增強基礎上,文心大模型3.5提出了“知識點增強技術”,提升了大模型掌握和運用知識的能力。

在推理方面,則是通過大規模邏輯數據構建、邏輯知識建模、多粒度語義知識組合以及符號神經網絡技術,提升了文心大模型3.5在邏輯推理、數學計算及代碼生成等任務上的表現。

值得注意的是,文心大模型3.5 還新增了插件機制,默認的內置插件“百度搜索”,使得文心一言具備生成實時准確信息的能力;長文本摘要和問答插件“ChatFile”支持超長文本輸入等等。

王海峰表示,文心一言將發布更多優質的百度官方和第三方插件,讓用戶能夠更好地應用文心大模型,同時也將逐步开放插件生態,幫助开發者基於文心大模型打造自己的應用。

這一系列能力迭代背後,百度靠的是其在AI領域長期的投入和積累。

2013年开始,百度就开始布局AI相關技術,累計十年下來已經投入超過1000億元,其中核心研發投入多個季度佔比超過20%。截至2022年4月,百度全球AI專利申請已經超過2.2萬件。

當然,所有的技術優勢,最終都要轉化爲可落地的成果,在大模型賽道,這意味着,大模型能否落地,將價值最大化。

3、從技術中來,到產業中去

大模型熱潮持續到現在,行業的競賽將進入到更深一層,既拼技術,也拼場景落地。

不斷探索大模型的能力邊界,推動大模型在具體行業場景下的落地,也成了當前市場參與者的重中之重。

據連线Insight了解,4月17日,文心一言在百度內部全面應用在智能工作平台“如流”。百度此次在內部發布的智能工作工具,涵蓋了文本和圖片生成、代碼推薦兩大場景。

簡單來說,文心一言在實際的辦公、會議、編碼等場景的表現,就像一個“超級助手”,幫助員工在日常工作中的思路構建、協作溝通、方案策劃、代碼編寫等方面大幅提升效率。

王海峰也表示,凡是要跟語言文字或程序代碼打交道的應用場景,都可能有文心一言的用武之地。他透露,目前在能源、金融、教育、辦公、媒體等諸多領域,已經有很多在積極應用文心一言的場景。

在這之前,百度還曾展示了文心一言+電商的場景:你只需要把商品的信息告訴AI,AI就會自動生成多種風格的商品帶貨腳本和風格,再搭配數字人主播,就可以進行直播帶貨。

7月6日,百度智能雲事業群總裁沈抖在2023中國國際數字和軟件服務交易會上透露,目前已經有15萬家企業申請接入文心一言測試——這說明,文心一言的潛在落地場景,還在不斷拓寬。

同樣值得一提的還有文心一格,同樣是百度依托於飛槳、文心大模型的一款,在“AI作圖”方面的產品。

據悉,文心一格既能爲畫師、設計師等視覺內容創作者啓發靈感,輔助藝術創作,又能爲媒體、作者等文字內容創作者提供高質量、高效率的配圖。用戶就算完全沒有繪畫經驗,也能在文心一格畫出無限創意。

聚焦到企業客戶,同樣可以在文心一格體驗到業界領先的文生圖水平。

不過,相比起文心一言、文心一格正在不斷釋放的應用場景,百度探索大模型落地產業場景的思路,更值得被關注。

連线Insight 觀察到,百度的大模型產業布局中,有兩個信息尤爲關鍵。

第一是一站式企業級大模型平台文心千帆的推出。

如我們上文所提及,文心千帆實質上是一個大模型的集約平台,百度將這一平台开放,結合自身完善的大模型工具鏈,通過公有雲服務、私有化部署等方式提供給企業客戶。

這一布局思路下,平台具備了易用性、全面性、安全性、高效、开放、易拓展等特點,進而幫助企業高效、低成本地獲取大模型能力。

百度透露,截至目前,已有超過300家百度智能雲生態夥伴參與到了“文心千帆大模型平台”內測,包括工業、金融、政務、互聯網、運營商、教育等行業頭部企業。

第二是百度飛槳深度學習平台,對大模型適配產業場景能力的提升。

一方面,爲了讓大模型產業落地更高效便捷,飛槳提供了全流程產業化工具與平台,包括大模型开發套件、場景模型生產线等,極大降低了應用門檻。“通過高效構建與快速迭代基於大模型的多樣化場景模型,讓大模型的落地像流水线一樣高效”。百度如此表示。

另一方面,飛槳的开放屬性也決定了,隨着越來越多的开發者快速在這裏實現AI想法、創新AI應用,飛槳作爲基礎平台支撐,更利於支撐越來越多行業實現產業智能化升級。

而將這些聯系起來重新審視百度在大模型賽道的布局思路、落地方向,就不難發現,百度大模型的起點、轉折點、未來的錨點,都集中在“技術”這兩個字上。

回顧百度過去十年堅定的技術投入歷程,我們很清楚地能看到百度對於技術的長期主義,以及這種堅守帶來的成效。

但對百度而言,大模型的战事才剛剛展开,接下來在“大模型落地”這場馬拉松中,如何繼續保持領先,對百度而言極爲重要。

追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:WAIC上演大模型競技賽,“國家隊”百度進化到哪兒了?

地址:https://www.breakthing.com/post/76101.html