【專家紀要】Llama2开源衝擊大模型格局2023年7月專家訪談
1年前

核心觀點 

1、Llama2相比其他开源模型的技術升級。

Llama2是一項裏程碑式的开源技術,與 GPT3.5相比在編程性能上稍弱,但其他能力基本相同。運用高質量數據庫,分組注意力機制能更好提取數據特徵並識別整個編碼器的框架。在安全性方面Llama2對預訓練數據進行篩查和處理,准確性和安全性達到了閉源模型的效果,且允許免費商用,應用層面是較好輔助。 

2、Llama2开源對國內企業應用層與模型層影響。

大模型的成本主要是預訓練模型的建立,約佔總算力消耗成本的90%-95%。开源的高性能大模型如Llama2可以大幅減少企業訓練端的算力消耗,解決了壁壘級難題。對於應用型公司可以採用多元化模型策 略。 

3、Llama2开源未來對算力側需求的影響。

开源加速大模型迭代和性能的提升,進而推動應用段更多應用的加速落地,從而使得推理端算力得到迅速爆發。开源體系可以提供各種機會和應用,帶來可觀的付費用戶和收入增長。訓練端Llama2可以節省企業 90%的算力需求,推理端誕生的算力需求增長至少2-5倍,對算力起到指數級提升作 用。 

4、Llama的商業變現模式。

微軟、亞馬遜等國內外企業已經將大模型能力部署到雲端,包括企業後端軟件和財務等領域。中小企業無法承擔建設算力和數據中心的成本,未來提供服務過程中至少一半以上需求通過雲服務提供,而不是通過企業軟件形式。除了ToB付費外還有雲廠商遷移解決方案以及模型部署的付費。 

5、未來競爭中大模型廠商的勝出概率評估。

最好階段是开源整個預訓練數據集和高質量數據集,數據才是至關重要的。無論是开源還是閉源,未來擁有數據場景的企業和應用迭代速度較快的企業會勝出,在辦公和教育等領域,有明確ToB和ToC需求的企業將會取得成功。

*本文件所用信息均來自互聯網發布的調研紀要主題。本公司並未另行驗證,不保證信息的准確性。本文件所包含的信息僅供參考,不具有任何形式的商業建議,對讀者的投資決策不具有影響力。

追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:【專家紀要】Llama2开源衝擊大模型格局2023年7月專家訪談

地址:https://www.breakthing.com/post/83062.html