關於國內大模型發展一些情況
1年前

首先,國內的大語言模型發展的研發和應用進入了產業化階段,大型科技公司、互聯網企業、研究機構等都在大力投入相關技術的研究與开發,並且建立了相應的研究團隊和實驗室。作爲互聯網企業龍頭的阿裏和百度分別於今年4月和今年3月分別推出“通義千問”和“文心一言”,加入國內大語言模型賽道。

從應用場景來看,百度“文心一言”對標ChatGPT,爲用戶提供文學創作、知識檢索、商業文案創作、數理邏輯推算、多模態生成等功能。百度CTO對其進行了技術解讀,文心一言是基於深度學習和大模型積累的文心大模型成長而來,它具有高效的分布式訓練能力和產業級的數據處理能力。

在早期文心一言內測的時候,它的表現其實是不盡如人意的,出現了文字理解錯誤、回答含糊等問題。而一位網友時隔兩月再次參加文心內測後分享說,“四月初的時候,文心一言遠遠比不上GPT3.5,回答的又慢還經常答非所問,但最近使用起來雖然還有不足,但居然有點GPT3.0的樣子了。”

和文心相比,通義千問就顯得低調了許多。它主要針對聊天內容進行了優化,可以理解和回答各種領域的問題,包括復雜甚至是少見的問題。在網上可搜集到的資料來看,通義千問的中文文本能力甚至部分比ChatGPT要更出色,更符合中文語境。但是在多模態能力上,通義千問和ChatGPT還存在着差距,這是事實,也是國內大語言模型下一步應該進步的方向。

追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:關於國內大模型發展一些情況

地址:https://www.breakthing.com/post/88445.html