別再盯着外賣了!百度已經造出了最先進生產力工具
1年前


【潮汐商業評論/原創】

辦公室編輯Fia,在收到文心一言內測邀請的第一時間,就开始了試用,Fia選擇了一個國人特有的含蓄表達對話發出了詢問,【李雷對韓梅梅說:“我對你有意思”韓梅梅回復道:“你這樣就沒意思了”請問李雷和韓梅梅各是什么意思?】

文心一言不僅正確解釋了這組對話中雙方話語表達的意思,還從不同的角度對“有意思”“沒意思”做出了解釋。


過去一段時間,美國創業公司OpenAI發布的生成式AI產品ChatGPT席卷全球,引發一場“AI狂歡”,並迅速掀起一輪AI“軍備”競賽。

一時之間,資本圈、產業界、創業者趨之若鶩,試圖抓住技術紅利,引領下一個時代。

在趕超ChatGPT的巨大產業機遇下,國內大小企業打響了追平基礎大模型差距的“攻堅战”。

早在2月初,百度對外證實正在打造生成式AI產品文心一言(英文名ERNIE Bot),位於模型層,在做上线前的衝刺准備工作。

而除百度外,還有快手、京東、360、商湯、美圖等均趁勢宣布正積極發展AI聊天機器人,或在AIGC有所布局。

不過,最終百度快人一步。

3月16日下午,百度於北京總部召开新聞發布會,主題圍繞新一代大語言模型、生成式AI產品文心一言。百度創始人、董事長兼首席執行官李彥宏、百度首席技術官王海峰出席,圍繞文心一言進行介紹。從現場演示來看,文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成等方面有突出能力。

消息一出就引起了業界人士的廣泛關注,這也意味着百度成爲全球第一個做出大語言模型和生成式AI的科技大廠。

有媒體評價稱,中國的百度已將自己投入到全球商業化競賽中,這場關於生成式AI這樣的下一代人工智能技術將會給互聯網帶來重大變革。

值得注意的是,百度本次“快人一步”的動作耐人尋味,而看似簡單的一步其實是快人很多步,背後是他們不斷的努力和准備,始終保持謙卑的心態以及從容不迫應對冷眼的勇氣。

01 “人有我有”的底氣

文心一言由最新大語言模型(LLM)提供支持,是百度的生成式AI產品。雖然今年百度才對外宣布开發文心一言,但這對於百度來說並不是從零开始,更不是突擊了一兩個月做出來的。

百度投入AI已經10余年,在人工智能剛开始被大家討論的時候,百度就已經在該領域开始默默耕耘。

2014年百度涉足智能駕駛領域,2015年上线世界首個大規模神經網絡機器翻譯系統,比Google早了一年多。2016年百度正式發布“百度大腦”並开源中國第一個深度學習框架飛槳。飛槳的出現打破了Google和Facebook的壟斷,現已躋身全球前二。

講究“軟硬兼具”,百度“軟”有飛槳,“硬”有昆侖。2018年百度自主設計、2019年流片成功、2020年實現量產、2021年升級的百度昆侖AI芯片已經得到大規模應用。此外,百度還研發出鴻鵠語音芯片,打破了卡脖子問題,使中國公司不再完全依靠外來輸入。

從算力、算法到數據,從高端芯片昆侖芯,到飛槳深度學習框架,再到文心大模型,百度在各個層面都早有關鍵自研技術,給文心一言提供了強大的技術支持。


而百度的文心大模型和OpenAI的GPT模型類似,早在2019年就已推出,且經過了多次的迭代,從剛开始單一的自然語言理解延伸到目前的多模態,包括視覺、文檔、文圖、語音等多模態多功能,因此“文心一言”所基於的ERNIE系列模型也已經具備較強泛化能力和性能。

誠如人生沒有捷徑,該走的路,一步都不能少。在這方面,百度從來沒有松懈,其“人有我有”的底氣來自於日常大量的業務累積。文心一言的官宣,恰恰是百度長期在AI技術與大模型領域投入的體現。

IDC發布《中國深度學習框架和平台市場份額,2022H2》報告顯示,百度居中國深度學習平台市場綜合份額第一。

數據顯示,過去10年,百度研發投入超1000億元。2022 年百度核心研發費用 214.16 億元,佔百度核心收入比例達到 22.4%。如此高的研發投入,在大廠中鳳毛麟角。

壓強式、馬拉松式的研發投入讓百度儲備了先發優勢,面對大模型驚人的算力需求也能做到遊刃有余。

這些儲備也讓正式亮相的文心一言驚豔滿滿。


例如,在文學創作能力上,基於搜索業務積累,百度有世界上最大的知識圖譜,一直致力於給用戶提供唯一答案。這一切讓文心一言回答准確性及生成結果的可信度得到提升。

在商業文案寫作能力上,文心一言能夠做到起名字、寫新聞稿、寫標語等等。人們俗稱“讀萬卷書”,AI則是“讀書破千億卷”。文心一言大模型的訓練數據包括萬億級網頁數據,數十億搜索數據和圖片數據,百億級語音日均調用數據,及5500億事實的知識圖譜。因此百度在中文語言的處理上,處於獨一無二的位置。而有研究表明,數據規模大,參數達到千億級,大模型就可能發生“智能湧現”,湧現出知識和邏輯推理能力。

在數理邏輯推算能力上,文心一言展現了良好的思維鏈和復雜推理能力,在掌握了一些標准的解題思路後,能夠把問題拆分爲子問題,一步步推理,這樣就更可能給出正確的答案。

可以說,在短期利益和長期價值取舍上,百度明顯傾向於後者。而這需要數十年如一日的定力,也要有真金白銀的投入,顯然百度做到了。

這種保持定力後的技術實力,才是李彥宏面對ChatGPT熱潮時的自信來源。

那么李彥宏爲何愿意再拼一把?有人評價:“2017年,美國公司在做阿爾法狗,中國公司在送外賣。2023年,美國公司在做ChatGPT,中國公司還在送外賣。”中國公司應該賺更高精尖的錢,君子有所爲,有所不爲。

02 “人有我優”的骨氣

有骨氣的人,心中才有大方向、大原則和大是非,肩上才有使命、有責任、有擔當。

ChatGPT的火熱對於國內人工智能公司而言,恐懼者有之,焦慮者有之。但百度明顯准備得更充足,看得更遠,顯得也更從容。

“文心一言”的亮相讓我們看到了中國AI的實力。作爲扎根於中國市場的大語言模型,文心一言具備中文領域最先進的自然語言處理能力,也將比國外开發的模型更適合中文和中國市場,這一點是ChatGPT所不具備的,因爲ChatGPT的很多答案並不適合國內用戶,因爲它的訓練數據多是以歐美國家的意識形態爲准則的。

另外,“文心一言”以及其背後的基礎大模型,不僅能給出更准確的結果,還有更強的通用性和泛化能力,被認爲是一項面向未來的先進生產力。同時,多模態是生成式AI一個明確的發展趨勢。未來隨着百度多模態統一大模型的能力增強,文心一言的多模態生成能力,也會不斷提升。

李彥宏曾表示,人類進入人工智能時代,IT技術的技術棧發生了根本性的變化。過去基本分爲三層:芯片層,操作系統層和應用層。現在可以分爲四層:芯片層、框架層、模型層和應用層。百度是全球爲數不多、進行全棧布局的人工智能公司,從高端芯片昆侖芯,到飛槳深度學習框架,再到文心預訓練大模型,各個層面都有領先業界的關鍵自研技術,可以實現端到端優化,大幅提升效率。


可以說,“人有我優”解決的是品質的問題,而百度這種“人有我有,人有我優”的能力是當下略顯極致化的市場中所難能可貴的。

相信隨着“文心一言”开始使用,將建立真實用戶反饋、开發者調用和模型迭代的飛輪,進步會非常快。

未來,“文心一言”們不僅會影響搜索或者互聯網公司,而是會影響到每一家公司,有機會通過新的技術去創建最好的客戶體驗,從而比其他人更能抓住客戶,獲得更強的競爭優勢。

這一點也能從文心一言的定位上一探究竟。

根據公开描述,文心一言是人工智能基座型的賦能平台,通過新技術幫助企業創建最好的客戶體驗,讓任何公司有機會離客戶更近,從而深刻地影響千行百業中每一家公司,實現智能化變革、效率提升,獲得更強的競爭優勢,創造更大的商業價值,而這也是真正的機會。

截至目前,百度文心系列大模型在行業已普遍應用,共包括36個大模型,涵蓋基礎大模型、任務大模型、行業大模型的三級體系,全面滿足產業應用需求,構建了業界規模最大的產業大模型體系;在工具與平台層,通過大模型开發套件、文心API和提供全流程开箱即用大模型能力的EasyDL和BML开發平台,全方位降低應用門檻;產品與社區層,包括AI藝術與輔助創作平台“文心一格”、產業級搜索系統“文心百中”和暘谷社區,讓更多人零距離感受到最先進的AI大模型技術帶來的新體驗。

而從2月份至今短短一個月時間,已超過600家合作夥伴宣布加入文心一言生態,期待盡早用上最新最先進的大語言模型。隨着“文心一言”生態拓展,其將獲得更大話語權,並贏下更多的市場空間。

在李彥宏看來,AI技術已經發展到一個臨界點,各行各業都不可避免地被改變,其商業價值的釋放將是前所未有的、指數級的。

他在內部信中曾提到:文心一言與搜索整合,將引領搜索體驗的代際變革;文心一言將通過百度智能雲對外提供服務,根本性地改變雲計算市場的遊戲規則;此外,文心一言大模型還將搭載到Apollo智艙系列產品,並與小度進行集成。可以想象,隨着“文心一言”的推出,百度將進入業績提速的快車道。

在馬太效應愈發凸顯的當下,硬科技的爭奪無疑是一場卡位战。從某種程度上來說,中國一定要有自己的ChatGPT,文心一言當之無愧。未來,隨着文心一言數據、Query閉環形成,系統生態就會快速提升進步。小步快跑,快速迭代,時間就是最好的護城河。

隨着技術的持續進步,我們有理由相信,在不久的將來,百度將在第四次的人工智能浪潮中爲全球人類帶來更多令人矚目的科技成果,共同开創一個充滿智慧與希望的未來。

追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:別再盯着外賣了!百度已經造出了最先進生產力工具

地址:https://www.breakthing.com/post/48067.html