國內AI大模型盤點，誰更有潛力？（附股）

相關報導

九方金融研究所

1年前

國內AI大模型盤點，誰更有潛力？（附股）

當下，百度文心大模型、華爲盤古大模型、騰訊混元大模型、阿裏通義大模型正在加快向GPT模型追趕的步伐。

那么什么是大模型，其底層邏輯是什么，有哪些玩家，市場空間有多大，我們來一探究竟。

一、什么是AI大模型

近半年AI大模型持續推出，從ChatGPT、文心一言在多場景廣泛深入地應用，標志着AI大模型時代已來臨。

那么什么是AI大模型？大到什么程度才能稱之爲大模型？AI大模型是指一個龐大復雜的神經網絡，需要通過存儲更多的參數來增加模型的深度和寬度，從而提高模型的表現能力，參數從百億起步，對大量數據進行訓練並產生高質量的預測結果。最著名的AI大模型是OpenAI的GPT-3模型參數規模達1750億，PaLM-E的參數規模更是達到了5620億。

相比傳統AI模型，大模型的優勢體現在於：

（1）解決AI過於碎片化和多樣化的問題。大模型採用“預訓練+下遊任務微調”的方式，首先從大量標記或者未標記的數據中捕獲信息，將信息存儲到大量的參數中，再進行微調，極大提高模型的泛用性。

（2）具備自監督學習功能，降低訓練研發成本。可以將自監督學習功能表觀理解爲降低對數據標注的依賴，大量無標記數據能夠被直接應用。這樣一來，一方面降低人工成本，另一方面，使得小樣本訓練成爲可能。

（3）擺脫結構變革桎梏，提高模型精度上限。隨着神經網絡結構設計技術逐漸成熟並开始趨同，想要通過優化神經網絡結構從而打破精度局限變得困難。而研究證明，更大的數據規模確實提高了模型的精度上限。

二、我國主要大模型盤點

目前中美之間圍繞大模型的研發和落地展开競爭。國內大模型廠商主要包括百度、騰訊、阿裏、商湯、華爲等企業，也有智源研究院、中科院自動化所等研究機構，同時英偉達等芯片廠商也紛紛入局。

數據、算法、算力是AI發展的驅動力，其中數據是AI發展的基石，中國數據規模增速或排名全球第一。據IDC統計，中國數據規模將從2021年的18.51ZB增長至2026年的56.16ZB，年均增長速度CAGR爲24.9%，增速位居全球第一。

1、百度：文心一言大模型，AI應用場景全覆蓋

2023年3月16日，百度官方發布“文心一言”。“文心一言”是百度研發的知識增強大語言模型，擁有文學創作、商業文案創作、數理邏輯推理、中文理解和多模態生成五大能力。文心一言在百度ERNIE及PLATO系列模型基礎上研發而成，關鍵技術包括監督精調、人類反饋的強化學習、提示、知識增強、檢索增強以及對話增強。其中，百度在知識增強、檢索增強和對話增強方面實現技術創新，使得文心一言在性能上實現重大進步。

百度經過11年積累了全棧人工智能技術，從芯片層、框架層、模型層到應用層。這四層之間形成層到層反饋、端到端優化，尤其是模型層的文心大模型和框架層的飛槳（產業級开源开放平台），在开發文心一言的過程中，它們的協同優化起到了至關重要的作用。模型層的文心大模型包括NLP大模型、CV大模型和跨模態大模型，在此基礎上开發了大模型的开發工具、輕量化工具和大規模部署工具，而且支持零門檻的 AI 开發平台以及全功能AI开發平台。

百度大模型相關標的：漢得信息、東軟集團、宇信科技、致遠互聯、軟通動力、銀之傑、風語築、掌閱科技、藍色光標等。

2、騰訊：混元AI大模型，加速大模型應用落地

騰訊2022年底發布國內首個低成本、可落地的NLP萬億大模型：混元AI大模型。HunYuan協同騰訊預訓練研發力量，旨在打造業界領先的AI預訓練大模型和解決方案，以統一的平台，實現技術復用和業務降本，支持更多的場景和應用。

當前HunYuan完整覆蓋NLP大模型、CV大模型、多模態大模型、文生圖大模型及衆多行業、領域任務模型，自2022年4月，先後在MSR-VTT、MSVD等五大權威數據集榜單中登頂，實現跨模態領域的大滿貫；2022年5月，於CLUE（中文語言理解評測集合）三個榜單同時登頂，一舉打破三項紀錄。基於騰訊強大的底層算力和低成本高速網絡基礎設施，HunYuan 依托騰訊領先的太極機器學習平台，推出了HunYuan-NLP1T大模型並登頂國內權威的自然語言理解任務榜單CLUE。

騰訊大模型相關標的：博思軟件、世紀華通、掌趣科技、常山北明、四維圖新、泛微網絡、長亮科技等。

3、阿裏：通義大模型，开源釋放大模型應用潛力

阿裏達摩院一直以來深耕多模態預訓練，並率先探索通用統一大模型。阿裏達摩院於2021年發布使用512卡V100GPU實現全球最大規模10萬億參數多模態大模型M6，並於2022年發布最新通義大模型系列。通義大模型注重开源开放，首次通過“統一範式”實現多模態、多任務、多結構的運行，並通過模塊化設計實現高效率高性能。