國泰君安:零一萬物推出开源大模型Yi系列 有望引領國內大模型消費級應用
1年前

國泰君安發布研究報告稱,自從國外LLaMA开源模型發布後,經過微調的諸多垂域模型快速湧現,所以考慮Yi在預訓練階段盡力保留了模型的通用能力,且上下文容量及中文理解力提升明顯,基於國內开源大模型的場景訓練和推理將迎來質和量的突破,而且Yi系列量化版本、對話模型、數學模型、代碼模型、多模態模型也將以快節奏推出。因此,在阿裏等股東的深度合作下,零一萬物有望引領國內大模型消費級應用,相關生態拓展潛力巨大。

事件:零一萬物推出开源大模型Yi系列(參數34B和6B兩版本),性能達國際一流水平。

國泰君安觀點如下:

Yi-34B成爲全球首個开源超長上下文窗口的大模型,極大提升AI應用體驗。

开源大模型Yi-34B擁有340億參數量,且具有全球最長的200K上下文窗口,可以處理約40萬漢字的超長文本輸入。相比之下,GPT-4的上下文窗口只有32K,文字處理量爲2.5萬字。Yi-34B作爲全球首個开源超長上下文窗口大模型,爲开發者提供了更豐富的語義信息與微調的可能性,所以基於Yi系列模型的應用場景將進一步拓展,相關功能潛力也將進一步釋放。

Yi-34B兼顧精度與效率,斬獲中英雙語“雙料冠軍”。

Yi-34B在大模型評測中最能反映綜合能力的兩項指標(MMLU、BBH)上評分極高。在中文理解力方面,Yi-34B位居C-Eval中文模型榜單之首,因而在未來的應用上將能夠更好契合國內用戶需求。英文理解力方面,Yi-34B在Hugging Face英文測試預訓練开源模型排行榜中位列全球第一,以更小的參數量打敗Falcon-180B、LLaMA2-70B等知名大模型。

定位爲通用底座,Yi劍指To C/消費級的超級應用。

自從國外LLaMA开源模型發布後,經過微調的諸多垂域模型快速湧現,所以考慮Yi在預訓練階段盡力保留了模型的通用能力,且上下文容量及中文理解力提升明顯,基於國內开源大模型的場景訓練和推理將迎來質和量的突破,而且Yi系列量化版本、對話模型、數學模型、代碼模型、多模態模型也將以快節奏推出。因此,在阿裏等股東的深度合作下,零一萬物有望引領國內大模型消費級應用,相關生態拓展潛力巨大。

風險提示:技術迭代不及預期,AI應用市場拓展節奏不及預期。

追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:國泰君安:零一萬物推出开源大模型Yi系列 有望引領國內大模型消費級應用

地址:https://www.breakthing.com/post/110810.html