百度文心一言對標ChatGPT,在中文理解及多模態生成上表現更優
1年前

百度的大語言模型終於千呼萬喚始出來。3月16日,百度如約召开新聞發布會,介紹了其對標 ChatGPT的大語言模型、生成式AI產品文心一言。百度創始人、董事長兼首席執行官李彥宏出席,並展示了文心一言在五個場景中的綜合能力。從demo效果上看,文心一言某種程度上具有了對人類意圖的理解能力,回答的准確性、邏輯性、流暢性都逐漸接近人類水平。


百度創始人、董事長兼首席執行官 李彥宏

百度同時公布了文心一言的邀請測試方案。3月16日起,首批用戶即可通過邀請測試碼,在文心一言官網體驗產品,後續將陸續开放給更多用戶。此外,百度智能雲即將面向企業客戶开放文心一言API接口調用服務。3月16日起正式开放預約,搜索“百度智能雲”進入官網,可申請加入文心一言雲服務測試。

而就在百度文心一言新聞發布會召开前一天,OpenAI突然宣布發布多模態預訓練大模型GPT-4。大洋兩岸,兩家極具代表性的科技企業幾乎同時地向通用人工智能邁進了堅實的一步,這又一次說明了大語言模型和生成式AI已成爲新的技術範式,這場AI浪潮將席卷全球每一個行業、每一家企業。

人無我有、人有我優,文心一言展現五大能力

新聞發布會現場,百度展示了文心一言在五個場景下的綜合能力。根據其演示的demo,文心一言不僅具備了文學創作、商業文案創作、數理推算等大語言模型較常見的優勢和能力,還表現出了更優秀的中文理解、多模態生成能力。

具體來看,在文學創作場景中,文心一言根據對話問題將知名科幻小說《三體》的核心內容進行了總結,並提出了五個續寫《三體》的建議角度,體現出對話問答、總結分析、內容創作生成的綜合能力。面對《三體》電視劇演員於和偉和張魯一“有哪些共同點”、“誰更高”這類問題,文心一言也基於推理能力得出了准確答案。

與ChatGPT相比的不同之處在於,百度的搜索增強,補齊了生成式AI在回答事實性問題時常常“胡編亂造”的短板。demo演示中,文心一言准確回答了《三體》作者、電視劇角色扮演者等事實性問題,這得益於百度知識增強的大模型理念,大幅度提升了事實性問題的准確率。



在商業文案創作場景中,文心一言順利完成了給公司起名、寫Slogan、寫新聞稿的創作任務。

連續三次內容創作生成,文心一言既能准確理解人類意圖,又能清晰地表達,這是基於龐大數據規模而發生的“智能湧現”。我們常說“讀萬卷書”,而文心一言可以說“讀書破千億卷”。據介紹,文心一言大模型的訓練數據包括萬億級網頁數據、數十億的搜索數據和圖片數據、百億級的語音日均調用數據,以及5500億事實的知識圖譜等。



文心一言還具備了一定的思維能力,能夠學會數學推演及邏輯推理等相對復雜任務。面對“雞兔同籠”這類鍛煉人類邏輯思維的經典題,文心一言能理解題意,並有正確的解題思路,進而像學生做題一樣,按正確的步驟,一步步算出正確答案。



作爲扎根於中國市場的大語言模型,文心一言具備中文領域最先進的自然語言處理能力,在中文語言和中國文化上有更好的表現。在現場展示中,文心一言正確解釋了成語“洛陽紙貴”的含義、“洛陽紙貴”對應的經濟學理論,還用“洛陽紙貴”四個字創作了一首藏頭詩。



多模態生成方面,百度現場展示了文心一言生成文本、圖片、音頻和視頻的能力。有趣的是,文心一言甚至能夠生成四川話等方言語音;文心一言的視頻生成能力,因成本較高,現階段還未對所有用戶开放,未來會逐步接入。

多模態能力也是OpenAI最新發布的GPT-4最關鍵的一項升級,正如李彥宏在新聞發布會上所說:“多模態是生成式AI一個明確的發展趨勢。”未來,隨着百度多模態統一大模型的能力增強,文心一言的多模態生成能力也會不斷提升。



厚積薄發、搶佔先機,百度在全球大廠中第一個做出來

大語言模型訓練成本和門檻很高,在ChatGPT發布後,在全球範圍內的大廠中,目前只有百度做出了對標產品。雖然文心一言還有很大迭代空間,但它已經是百度基於十余年積累交出的一份足以令人滿意的答卷。

爲什么是百度在今天推出了文心一言?從外因來看,這是市場強烈需求下的產物;從內因來看,這是百度過去多年努力的延續。

從百度承認文心一言的存在至今,短短一個月時間內,已經有650家企業宣布加入文心一言生態。此外,百度自己也早已宣布計劃將文心一言接入搜索、智能雲、自動駕駛等多項主流業務。中國市場在期待盡早用上最新最先進的大語言模型。

從內因來看,百度從某種意義上說已經爲今天的文心一言准備了多年。

百度深耕AI領域十余年,各業務中都有AI應用。搜索方面,自2019年3月以來,文心大模型在改進搜索結果方面發揮了重要作用,帶來排名改進和多模態搜索能力。智能雲方面,百度爲傳統行業(如制造、能源和公用事業)提供特定AI解決方案和應用。智能駕駛業務是百度AI能力護城河又一證明,根據guidehouse自動駕駛產業排名,百度位居全球領導者之列,是中國唯一上榜企業。

並且,百度是全球範圍內少有的在IT四層技術棧架構中,每一層都有領先產品的公司。人類進入人工智能時代,IT技術的技術棧發生了根本性的變化,可分爲“芯片-框架-模型-應用”四層,從高端芯片昆侖芯,到飛槳深度學習框架,再到文心預訓練大模型,到搜索、智能雲、自動駕駛、小度等應用,各個層面都有領先業界的自研技術。



全棧布局的優勢在於,百度在技術棧四層架構中可以實現端到端優化,大幅提升效率。尤其是框架層和模型層之間,有很強的協同作用,可以幫助構建更高效的模型,並顯著降低成本。在框架層,超大規模模型的訓練和推理給深度學習框架帶來很大考驗,爲了支持千億參數模型的高效分布式訓練,百度飛槳在2021年4月專門研發了4D混合並行技術。在芯片層,百度自研AI芯片“昆侖芯”已在多場景實際部署幾萬片,性能十分領先,這讓文心一言底層算力有所保證。昆侖芯片已經爲百度的搜索服務優化了十年。百度的搜索服務,每天響應幾十億次真實的用戶使用需求,每天進行1萬億次深度語義推理與匹配,能夠提供最真實、最及時的反饋,從而倒逼大模型、深度學習框架和芯片的優化。



還需要指出的是,雖然文心一言現在細究起來還存在許多bug,但只要开放測試,真實的人類反饋能夠促進大語言模型飛速迭代。文心一言與ChatGPT背後,實際都是SFT(模型微調, Supervised fine-tuning)、RLHF(強化學習,reinforcement learning from human feedback)、Prompt(真實的用戶指令)等技術邏輯,這些方法跟大模型通過海量無標注數據訓練是不同的,需要人的參與,作用是更好地理解人的意圖,生成符合人的價值觀、表達習慣的回復。

1947年的第一個晶體管和現在的晶體管全然不同;22年11月的ChatGPT和現在的ChatGPT相比,也出現了明顯進步。數據飛輪一旦开啓,文心一言未來可能會帶來“士別三日,當刮目相看”的驚喜。

三大產業機會來襲,創業者不可錯過

有機構預測,到2030年,人工智能可以將每一個知識工作者的生產力提高4倍以上。可以預見的是,隨着文心一言這類大語言模型的迭代,帶來所有人都能使用的最先進生產力工具,很多人的工作性質會發生不可逆轉的改變。

百度對文心一言的定位是人工智能基座型的賦能平台,通過新技術幫助企業創建最好的客戶體驗,讓任何公司有機會離客戶更近,從而深刻地影響千行百業中每一家公司,實現智能化變革、效率提升,獲得更強的競爭優勢,創造更大的商業價值。

這也意味着,文心一言將不僅影響到搜索或者互聯網公司,而是影響到每一家公司。根據李彥宏的預測,文心一言將會打开三大產業機會。

第一類是新型雲計算公司,其主流商業模式從IaaS變爲MaaS。文心一言將根本性地改變雲計算行業的遊戲規則。之前企業選擇雲廠商更多看算力、存儲等基礎雲服務。未來,更多會看框架好不好、模型好不好,以及模型、框架、芯片、應用這四層之間的協同。

這是一場toB領域決定性战役。文心一言將通過百度智能雲對外提供服務,幫助企業構建自己的模型和應用,農業、工業、金融、教育、醫療、交通、能源等重點領域,都會因此效率大幅提升,並在每一個行業快速形成新的產業空間,助力數字中國的實現。百度預告稱,百度智能雲將於近期舉辦發布會,發布基於文心一言的雲服務和應用產品,既有公有雲服務和也可以做私有化部署,值得期待。

第二類是進行行業模型精調的公司,這是通用大模型和企業之間的中間層,他們具有行業Knowhow,調用通用大模型能力,爲行業客戶提供解決方案。簡單來說,預訓練的大模型是基礎設施,在此基礎上可以快速抽取生成場景化、定制化、個性化的小模型,實現不同行業、垂直場景的布局。比如百度文心大模型,已經在電力、金融、媒體等領域發布了10多個行業大模型。

第三類是基於大模型底座進行應用开發的公司,即應用服務提供商。就像移動互聯網時代,最成功的商業產品不見得是安卓和iOS,而是基於安卓和iOS开發的微信、淘寶、抖音等各種超級應用。

對於大部分創業者和企業來說,真正的機會並不是去從頭开始做ChatGPT和文心一言這樣的基礎大模型,這很不現實,也不經濟。資料顯示,跑通一次100億以上參數量的模型,算力至少需要1000張GPU卡。GPU芯片中領先者如A100售價達1萬美元,微軟Azure雲服務爲ChatGPT部署了超過1萬枚英偉達A100芯片。即使不使用頂級芯片,按照一張GPU五萬元的市場均價計算,1000張GPU意味着單月至少5000萬的成本。業界測算,GPT-3單次訓練成本至少460萬元。

而且,大語言模型是個馬太效應非常明顯的行業,可以說如果落後18個月,就基本沒機會了,因爲先一步發布的產品已經迭代得非常先進了。

因此,真正的機會可能是基於通用大語言模型,搶先开發重要的應用服務。基於文本生成、圖像生成、音頻生成、視頻生成、數字人、3D等場景,湧現出很多創業明星公司,可能就是未來的新巨頭。比如說海外的法律服務聊天機器人DoNotPay和AI文案生成平台Jasper.ai,已經引起了硅谷投資者的廣泛關注。

正如李彥宏所說:“AI的長期價值,對各行各業的顛覆性改變,才剛剛开始。”未來,將會有更多的殺手級應用、現象級產品出現,將會有更多的裏程碑事件發生。生成式AI時代,好戲已經开場。

追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:百度文心一言對標ChatGPT,在中文理解及多模態生成上表現更優

地址:https://www.breakthing.com/post/48955.html