七月的國產大模型賽道和而不同，誰更值得青睞？

1年前

七月的國產大模型賽道和而不同，誰更值得青睞？

經過最近半年多的發展後，大模型並未像外界預期的那樣降溫，還是有多款新品上线。ChatGPT安卓版上线這種意料之中的消息都已見怪不怪了，今天來回顧下七月的國產大模型，特別是之前因爲各種原因沒有講到的那些，看看誰更值得關注。

月初時WAIC 2023大會如期舉行，大模型毫不意外，也當之無愧的成爲各家AI科技企業集中展示的關鍵項目，阿裏通義、百度文心、華爲盤古、網易伏羲、達觀曹植等數十個產品悉數亮相，各家集中展示在大模型層面的布局和成果。一定程度上說來，這次大會可以視爲國產大模型產業在七月整體表現的縮影，和而不同。

1.7月2日，天眼查與華爲雲聯合發布了首個商查大模型“天眼妹”可信商業助理。據官方介紹，該產品是業界首個基於“可信數據+可信算法”的面向個人端的可控大模型數字產品。當時官方表示該產品已經完成內部測試，七月底對用戶开放邀請試用，但截至目前尚未發現官網入口或其他鏈接。

2.7月4日，北大發布了首個中文法律大模型ChatLaw，爲大衆提供普惠法律服務。該模型支持讀取文件與錄音，一鍵自動抽取並梳理關鍵信息，生成導圖或圖表，可視化分析，以及專業法律文書寫作、建議與援助推薦等。ChatLaw由北大深圳研究生院與兔展智能AIGC聯合實驗室合作打造，在通用大模型基礎上，使用大量法律領域結構化文本數據進行訓練，並由國內資深律師輔助人工標注，進行高質量事實型多輪對話，最終成型，與此同時還开源了三個模型：ChatLaw-13B、ChatLaw-33B和ChatLaw-TextVec。由於涉及的法律領域相對冷門，再加上近年來網絡媒體的發達，ChatLaw上线後就被很多人稱爲“可以隨身攜帶的羅翔老師”，倒也可以看出它與提供的服務還是很受歡迎的。

3.7月6日，中國電信發布TeleChat大模型，支持輸出代碼、寫演講稿等。TeleChat是由中國電信集團數字智能科技分公司开發的一款聊天機器人，可以模擬人類對話，同時支持輸出代碼、寫演講稿等功能，使用了大量的訓練數據和深度學習技術，可以爲用戶提供自然語言處理和生成服務。對於新產品，電信官方並不避諱，直接在官網首頁上表明“搭載ChatGPT”，讓用戶能夠創建自己的聊天機器人。

4.7月6日，上海AI實驗室與商湯科技合作的成果，开源大模型InternLM-7B正式公布，中文名“書生·浦語”大模型，包含有70億參數。官方稱“書生·浦語是在過萬億數據上訓練的多語種千億參數基座模型。通過多階段的漸進式訓練，書生·浦語具有較高的知識水平，在中英文閱讀理解、推理任務等需要較強思維能力的場景下性能優秀，在多種面向人類設計的綜合性考試中表現突出。”書生·浦語的源代碼在Apache-2.0協議下开源，對學術研究完全开放，商業使用則需要獲得官方的書面許可。

5.7月8日，中國移動發布九天1+N大模型。據官方介紹，九天由中國移動研究院首席科學家、AI與智慧運營中心總經理馮俊蘭牽頭負責。此前，馮俊蘭帶領的九天團隊主要從事AI技術及相關產品研發，此次大模型產品技術研發也是水到渠成的。官方對九天的定位是“人工智能大平台”，分類上屬於通用型，可以視爲新型人工智能基礎設施，承載面向國民經濟主體的通用和行業大模型等，基於廣泛分布的算網基礎設施，實現數據的高質量利用。

6.7月12日，阿裏巴巴達摩院發布PolyLM多語種开源大模型。與其他多語種模型不同的是，PolyLM在理解、推理和生成自然語言指令方面表現出顯著的能力，目前該模型擁有1.7B和13B兩種參數版本可選。根據官方介紹，PolyLM通曉十幾種語言，可用於對話問答、文本生成、機器翻譯和情感分析等領域，能夠自動生成高質量的多語言文本，從而爲跨語言、文化的交流提供便利。在訓練PolyLM時，官方使用了包含640B的龐大數據集，來源於全球各大主流網站等公开可訪問的資源。研究團隊提出了一種課程學習技術，逐漸增加高質量、資源較少的語言在訓練中的比例，重點是從英語向其他語言轉移通用知識。官方團隊還开發了一個多語言指令數據集MULTIALPACA，用於微調階段的監督；以及一個基准測試，用於評估PolyLM的多語種能力，包含十個任務和十五種語言。研究結果表明，PolyLM在非英語語言上的表現優於其他同等規模的开源大模型。總體上看來，PolyLM本身的多語種與开源等特性，都有助於解決現有大模型在非英語語言上的局限性。

7.7月20日，國際數據公司IDC發布《2023年AI大模型技術能力評估報告》的最新更新版，從算法、生態、服務能力等多個維度評估國產大模型的整體實力，BAT等企業都參與了此次評估。在報告，IDC中提出了大模型技術評估框架，評估維度涵蓋算法模型、基礎能力、創新及定制化能力、平台能力、安全可解釋、行業應用，以及配套服務和大模型生態等指標，意在衡量國產大模型市場的整體進程。

可以看出各家的大模型表現與其企業的經營業務關聯度極高，正所謂“有其父必有其子”。阿裏巴巴在電商領域經營多年，自家的通義大模型也就在“服務能力”上拿滿分；百度多年以來涉及國內諸多行業，自家的文心大模型也就自然在“行業覆蓋”上拿滿分。類似的這種表現都是自然之理。

以上都是七月大模型中值得紀錄和敘述的，限於篇幅還有很多佼佼者沒有講到，至於達觀“曹植”，華爲雲“盤古”，百川智能Baichuan-13B，京東“言犀”，攜程“問道”等大模型產品，元碳院在過去都曾做過專門介紹，有詳細信息，此處不再重復提及。

站在八月的第一天回顧七月時，很容易發現一些有趣的現象：雖然總有聲音在說大模型賽道已經日趨飽和，現在各家產品都是在重復造輪子等等，但縱使如此依然阻止不了各家企業的熱情。而且現在國產大模型正進入全新階段，從最初的主要注重規模和參數等級，到如今更注重實用的階段。這個階段不僅要求大模型在技術上擁有強大的能力，更重要的是要能夠真正解決現實世界中的問題，爲用戶提供更智能、更便捷的服務體驗，以更全面、更多元的方式服務用戶和企業。

八月的精彩，還請拭目以待。

追加內容

本文作者可以追加內容哦 !

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。

標題：七月的國產大模型賽道和而不同，誰更值得青睞？

地址：https://www.breakthing.com/post/84141.html