今天聊聊大模型 - 爆炸新聞

今天聊聊大模型

1年前

今天聊聊大模型

今天我來聊聊大模型，最近大模型概念有點火熱，前幾天幾十家廠商同時推出了自己的大模型Demo，那叫一個熱鬧。但真實情況是怎樣的，我想行業內的人應該都能看的很清楚，我今天就主要想跟小白們嘮叨嘮叨。

其實計算機系畢業的家人們應該很熟悉計算機操作系統這個概念吧，我愿意將現在的大模型類比成新時代的操作系統，這種類比其實是我對大模型未來應用領域的深度與廣度的一種肯定。但是，重點來了，大模型真的是這么容易研發出來的嗎？否也，國內廠商現在所謂的大模型，都是基於openai的gpt3.0以及google的bert這類开源大模型進行改造的，也就是說，其實當下大模型的核心框架與理論基礎，都是被國外科研團隊創造的，雖然大模型的代碼是开源的，但是對於大模型的理解，我們是遠遠不如國外這些創造出大模型的科研團隊的。然而，這還不是重點，重點是後面我要說的，就是大模型如何創造價值。

我想說的是，大模型本身僅僅是一種技術，並不能創造任何價值。就好比操作系統本身，並不能創造任何價值，能創造價值的是基於操作系統的生態應用，比如word，excel，各類遊戲軟件這些。那對於大模型來說，什么是這些生態應用呢。那就是通過調用大模型api key來進行人工智能賦能的應用程序（比如聊天機器人chat gpt、文字生成圖片應用midjourney、文字生成視頻等）。那么現在各大廠商所研發大模型就只有一個目的，那就是希望更多的應用能夠通過調用自己的api key來進行賦能，然後根據調用token數收取一定費用。然而一個很殘酷的問題來了，現實中真的需要這么多種類的大模型嗎？要知道，大模型之所以叫做大模型，主打的就是一個通用，之所以大模型擁有巨大潛能，也是因爲它的通用。既然是通用，那么其實大部分需要人工智能賦能的事情，只需要調用一款大模型的api key就能完成了，那么用戶在選擇大模型的時候，肯定是選擇最好用的一款。

雖然市面上目前這么多公司都研發出來了自己的大模型，但我更愿意將國內公司所研發的大模型比喻成移動互聯網時代基於安卓系統的國產操作系統（比如說小米的Mi UI，錘子的錘子系統，華爲的EMUI），而gpt更像是apple操作系統，bert更像是google的android系統，transformer則像是linux。如果是計算機系畢業的同學，肯定一眼就道出了這其中的區別與聯系了吧。但更爲要命的不是這個，而是我們針對大模型的優化，是遠遠比不上國外廠商的。這還是因爲一個關鍵因素，算力。要知道，每一次大模型的調優，都是需要大量的算力的，而算力是需要大量堆gpu芯片的，gpu芯片，又是我們被卡脖子的地方。也就是說，我們不僅在對於大模型的理解上面趕不上國外廠商，在後天的訓練方面我們也遠遠趕不上人家。人家花1天耗費100萬美金的成本就能完成的調優，我們很可能需要花1個月耗費1000萬美金才能完成。

所以，我能看到未來5年內的一個情況，那就是，雖然我們研發出了很多“自己的大模型”，但是從易用性以及通用程度上，遠遠比不上gpt或者bert，而但我們還在研發大模型的階段，人家國外大模型廠商已經在大規模搭建生態了（bing、copilot都是基於gpt 4.0的應用）。即便是後面通過政策來限制國人調用國外大模型的api，但國內的大模型目前來說也是遠遠過剩了。要說手機端的操作系統還能通過綁定品牌手機強制使用，大模型可沒有任何被綁定的地方呀。如果哪家應用廠商研發出一款應用僅僅只能綁定某個大模型的api，那這個廠商所研發的應用純粹是找死了。因此即便是政策強制使用國內大模型api，最後的結果也僅僅是只有一兩家大模型廠商能夠存或下來。而這一兩家，我覺得騰訊會有一席之地，畢竟騰訊在人工智能領域的前期研發在全世界也是有一定認可度的，而且騰訊擁有天然的用戶基礎，這是騰訊的優勢。至於其他的，我暫時很難想到有哪家·能夠脫穎而出，昆侖、360、訊飛這些大模型，我更是不看好，至於爲什么不看好，這又是很長的一篇理論了，有興趣的可以嘗試去申請他們的api試用一下。

總結一下，就是大模型在未來一定會被應用到各個領域，就像當下的操作系統一樣普及。但這注定不是百花齊放，而是被兩三家巨頭所壟斷，而其他的大模型廠商注定會成爲這個時代的炮灰，被炒作的股價也會隨着炮灰的覆滅而崩塌。

我的分析就到這裏，歡迎大家來進行交流。

轉發評論贊收藏設置修改刪除