七月的國產大模型賽道和而不同,誰更值得青睞?
1年前

經過最近半年多的發展後,大模型並未像外界預期的那樣降溫,還是有多款新品上线。ChatGPT安卓版上线這種意料之中的消息都已見怪不怪了,今天來回顧下七月的國產大模型,特別是之前因爲各種原因沒有講到的那些,看看誰更值得關注。

月初時WAIC 2023大會如期舉行,大模型毫不意外,也當之無愧的成爲各家AI科技企業集中展示的關鍵項目,阿裏通義、百度文心、華爲盤古、網易伏羲、達觀曹植等數十個產品悉數亮相,各家集中展示在大模型層面的布局和成果。一定程度上說來,這次大會可以視爲國產大模型產業在七月整體表現的縮影,和而不同。


1.7月2日,天眼查與華爲雲聯合發布了首個商查大模型“天眼妹”可信商業助理。據官方介紹,該產品是業界首個基於“可信數據+可信算法”的面向個人端的可控大模型數字產品。當時官方表示該產品已經完成內部測試,七月底對用戶开放邀請試用,但截至目前尚未發現官網入口或其他鏈接。

2.7月4日,北大發布了首個中文法律大模型ChatLaw,爲大衆提供普惠法律服務。該模型支持讀取文件與錄音,一鍵自動抽取並梳理關鍵信息,生成導圖或圖表,可視化分析,以及專業法律文書寫作、建議與援助推薦等。ChatLaw由北大深圳研究生院與兔展智能AIGC聯合實驗室合作打造,在通用大模型基礎上,使用大量法律領域結構化文本數據進行訓練,並由國內資深律師輔助人工標注,進行高質量事實型多輪對話,最終成型,與此同時還开源了三個模型:ChatLaw-13B、ChatLaw-33B和ChatLaw-TextVec。由於涉及的法律領域相對冷門,再加上近年來網絡媒體的發達,ChatLaw上线後就被很多人稱爲“可以隨身攜帶的羅翔老師”,倒也可以看出它與提供的服務還是很受歡迎的。

3.7月6日,中國電信發布TeleChat大模型,支持輸出代碼、寫演講稿等。TeleChat是由中國電信集團數字智能科技分公司开發的一款聊天機器人,可以模擬人類對話,同時支持輸出代碼、寫演講稿等功能,使用了大量的訓練數據和深度學習技術,可以爲用戶提供自然語言處理和生成服務。對於新產品,電信官方並不避諱,直接在官網首頁上表明“搭載ChatGPT”,讓用戶能夠創建自己的聊天機器人。

4.7月6日,上海AI實驗室與商湯科技合作的成果,开源大模型InternLM-7B正式公布,中文名“書生·浦語”大模型,包含有70億參數。官方稱“書生·浦語是在過萬億數據上訓練的多語種千億參數基座模型。通過多階段的漸進式訓練,書生·浦語具有較高的知識水平,在中英文閱讀理解、推理任務等需要較強思維能力的場景下性能優秀,在多種面向人類設計的綜合性考試中表現突出。”書生·浦語的源代碼在Apache-2.0協議下开源,對學術研究完全开放,商業使用則需要獲得官方的書面許可。

5.7月8日,中國移動發布九天1+N大模型。據官方介紹,九天由中國移動研究院首席科學家、AI與智慧運營中心總經理馮俊蘭牽頭負責。此前,馮俊蘭帶領的九天團隊主要從事AI技術及相關產品研發,此次大模型產品技術研發也是水到渠成的。官方對九天的定位是“人工智能大平台”,分類上屬於通用型,可以視爲新型人工智能基礎設施,承載面向國民經濟主體的通用和行業大模型等,基於廣泛分布的算網基礎設施,實現數據的高質量利用。

6.7月12日,阿裏巴巴達摩院發布PolyLM多語種开源大模型。與其他多語種模型不同的是,PolyLM在理解、推理和生成自然語言指令方面表現出顯著的能力,目前該模型擁有1.7B和13B兩種參數版本可選。根據官方介紹,PolyLM通曉十幾種語言,可用於對話問答、文本生成、機器翻譯和情感分析等領域,能夠自動生成高質量的多語言文本,從而爲跨語言、文化的交流提供便利。在訓練PolyLM時,官方使用了包含640B的龐大數據集,來源於全球各大主流網站等公开可訪問的資源。研究團隊提出了一種課程學習技術,逐漸增加高質量、資源較少的語言在訓練中的比例,重點是從英語向其他語言轉移通用知識。官方團隊還开發了一個多語言指令數據集MULTIALPACA,用於微調階段的監督;以及一個基准測試,用於評估PolyLM的多語種能力,包含十個任務和十五種語言。研究結果表明,PolyLM在非英語語言上的表現優於其他同等規模的开源大模型。總體上看來,PolyLM本身的多語種與开源等特性,都有助於解決現有大模型在非英語語言上的局限性。


7.7月20日,國際數據公司IDC發布《2023年AI大模型技術能力評估報告》的最新更新版,從算法、生態、服務能力等多個維度評估國產大模型的整體實力,BAT等企業都參與了此次評估。在報告,IDC中提出了大模型技術評估框架,評估維度涵蓋算法模型、基礎能力、創新及定制化能力、平台能力、安全可解釋、行業應用,以及配套服務和大模型生態等指標,意在衡量國產大模型市場的整體進程。

可以看出各家的大模型表現與其企業的經營業務關聯度極高,正所謂“有其父必有其子”。阿裏巴巴在電商領域經營多年,自家的通義大模型也就在“服務能力”上拿滿分;百度多年以來涉及國內諸多行業,自家的文心大模型也就自然在“行業覆蓋”上拿滿分。類似的這種表現都是自然之理。


以上都是七月大模型中值得紀錄和敘述的,限於篇幅還有很多佼佼者沒有講到,至於達觀“曹植”,華爲雲“盤古”,百川智能Baichuan-13B,京東“言犀”,攜程“問道”等大模型產品,元碳院在過去都曾做過專門介紹,有詳細信息,此處不再重復提及。

站在八月的第一天回顧七月時,很容易發現一些有趣的現象:雖然總有聲音在說大模型賽道已經日趨飽和,現在各家產品都是在重復造輪子等等,但縱使如此依然阻止不了各家企業的熱情。而且現在國產大模型正進入全新階段,從最初的主要注重規模和參數等級,到如今更注重實用的階段。這個階段不僅要求大模型在技術上擁有強大的能力,更重要的是要能夠真正解決現實世界中的問題,爲用戶提供更智能、更便捷的服務體驗,以更全面、更多元的方式服務用戶和企業。

八月的精彩,還請拭目以待。

追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:七月的國產大模型賽道和而不同,誰更值得青睞?

地址:https://www.breakthing.com/post/84141.html