百度能搞好ChatGPT嗎?
1年前

 

 

作者 | 董溫淑

編輯 | 董雨晴

在ChatGPT掀起聊天機器人全民熱潮之後,來自大洋兩岸的搜索巨頭們不得不躬身入局。

2月7日,百度確認,自然語言生成項目“文心一言(ERNIE Bot)”正在進行上线前的衝刺,坐實了其正對標美國AI聊天機器人ChatGPT开發應用的傳言。一位接近百度的人士對市界表示,“百度在相關技術層面有積累,比如文心大模型,有望最先开發出此類產品。”

同一天,谷歌宣布將在未來幾周推出實驗性對話式AI(人工智能)模型Bard。此前在一月份,谷歌還宣布其子公司DeepMind的聊天機器人Sparrow可能會在晚些時候進入測試階段。

2月8日凌晨,微軟也“起袖子”,宣布推出由ChatGPT支持的最新版本Bing(必應)搜索引擎和Edge瀏覽器,此舉致使微軟市值一天飆漲超800億美元(約5450億元人民幣)。

搜索三巨頭紛紛下場的原因,還要追溯到約兩個月前,美國AI研究機構OpenAI在2022年底發布智能聊天機器人ChatGPT。該應用堪稱史上最會聊天的AI應用,能夠提供流暢、貼合語境的溝通體驗,且推出僅5天,用戶數就突破100萬。瑞銀集團的一份報告推測,截至1月末,ChatGPT的月活用戶已經突破了 1 億。

大洋彼岸的ChatGPT爆火,讓百度“坐不住”了。百度表示,文心一言預計將於3月份完成內測,而且按照谷歌和微軟的節奏,开放內測時間還有可能提前。消息放出後,2月7日百度集團港股股價大漲15.33%。

“上火”的也不僅僅是搜索玩家。目前,奢侈品電商寺庫已宣布將引入ChatGPT。相關概念股連續多日上漲,多支漲幅在10%以上,更有部分個股走出了“六連板”的行情。

然而,二級市場燃起的這把熊熊烈火,背後卻充滿了隱憂。

 

 

(百度集團港股股價情況,圖源:同花順)

开年第一爆

ChatGPT能有如此瘋的行情,應該說是“久旱逢甘霖”。

根據Gartner曲线,一項新興技術從萌芽走向市場成熟,還需要經過市場泡沫的產生與破滅。而從2020年开始,業界認爲AI產業已經進入泡沫破裂的“死亡之谷”。這樣的背景中,ChatGPT的興起讓整個AI產業看到了一絲曙光。

IPG中國首席經濟科學家柏文喜向市界分析道:“近期ChatGPT及其他AIGC(AI生成內容)應用的興起,可以認爲是產業邁進“復蘇期”的一個徵兆和興奮點,盡管尚處於發展早期,但ChatGPT等應用可能提供豐富的消費互聯網應用場景,所昭示的前景與錢景都是不言而喻的。”

《AIGC發展趨勢報告2023:迎接人工智能的下一個時代》援引AI作畫平台6pen的預測稱,未來五年10%-30%的圖片內容將由AI參與生成,有望創造超過600億的市場規模。而據Gartner統計,當前生成式AI佔據所有生成數據的比例不到1%,預計到2025年這一佔比將達到10%。

與廣闊前景相對應的,是豐富的投資機會。

AIGC可細分爲文本生成、音頻生成、圖像生成、視頻生成、跨模態生成(如文字生成圖像、文字生成視頻等)等技術場景,應用場景則集中在娛樂、傳媒、電商等數字化程度高、內容需求豐富的行業。此前,人臉美妝、黑白圖像上色、電商商品3D模型生成等AIGC應用,已經在許多場景中實現落地。

在ChatGPT爲代表的聊天機器人(chatbot)領域,亦有許多科技企業推出面向特定需求的相關應用。比如,微軟和亞馬遜都曾推出智能個人助理,分別命名爲Cortana和Alexa等。

不過,ChatGPT與以往的聊天機器人不同的是,其展現出的知識儲備廣度和智能程度超過了以往的許多模型,堪稱“上知天文下知地理”。

但是,ChatGPT被設計無法連接到互聯網,因此目前其“知識庫”中儲備的信息截至2021年,並不能持續更新。這也被視爲未來聊天機器人可以持續改善的一個方向,谷歌最新推出的Bard機器人就被允許聯網,接收實時信息。

近期隨着ChatGPT熱度持續上升,科技巨頭相繼入局,AIGC概念隨之發酵。2月7日,國內智能人機交互企業漢王科技A股觸及漲停板,港股美圖公司大漲15%。

 

 

(AIGC產業鏈,圖源:國海證券)

根據國海證券研報,AIGC產業鏈可簡要分爲上遊數據供給方;中遊AIGC算法及模型研發方;下遊基於AIGC的各類內容創作及分發平台環節。AIGC應用不斷深化,有望爲整條產業鏈的發展帶來利好。

洛克資本投資合夥人馬統娟稱:“當前,AI行業正處在蓄力等待新風口的時期。在圖像識別、語音識別、建模、機器人控制等早期應用領域,第一批企業機構已經形成了現有格局。隨着ChatGPT引爆的新熱點出現,有利於新的玩家加入,开闢新的賽道。”

有望“幹翻”搜索引擎?

如果說ChatGPT爲AI產業帶來了新的希望,那么對百度代表的搜索引擎巨頭來說,希望中還夾雜着一絲發展危機。

據投行瑞銀集團近日發布的一份研究報告,ChatGPT的月活躍用戶在今年1月份預計達到了1億,已成爲史上增長最快的消費者應用,增速超過TikTok、Instagram等現象級應用。據應用分析公司Sensor Tower的數據,TikTok和Instagram達到1億月活用戶的時間,分別爲9個月和兩年半。

ChatGPT的快速增長,讓人看到了新型消費互聯網業態的雛形,也讓許多互聯網大廠感受到了被新興應用取而代之的焦慮。首當其衝的,就是搜索引擎。

投行摩根士丹利的首席谷歌分析師布萊恩諾瓦克在一份報告中寫道,語言模型可能會“顛覆谷歌作爲人們上網入口的地位。”就連谷歌的23號員工、Gmail的創始人保羅布赫海特也於近日提出:“谷歌可能只需要一兩年時間就會被徹底顛覆。AI將會消滅搜索引擎的結果頁面,即便谷歌跟上了人工智能的發展,其最能賺錢的業務也將大不如前。”

而這類預測,正是基於ChatGPT類應用可能帶來的顛覆性搜索體驗。

馬統娟對市界分析道,在未來,如果將ChatGPT類應用整合進現有搜索引擎,有可能進一步提升用戶獲取信息的效率。

相比傳統搜索引擎爲用戶提供列舉出關鍵詞相關鏈接索引的模式,ChatGPT則可以依據其龐大的知識庫,直接對用戶的問題給出解答。“用戶對於搜索引擎的需求是信息獲取。如果有直接得到答案的方式,肯定不愿意選擇瀏覽的方式。在我看來,ChaGPT的目標並不是取代搜索引擎,而是改變人們獲取信息的方式。相比於搜索引擎‘框計算’的模式,ChatGPT背後信息組織的方式,反饋方式則有了不同。”

這也解釋了三大搜索引擎大廠谷歌、微軟、百度紛紛下場,押注對話式語言生成模型的原因。

實際上,隨着消費互聯網紅利見頂,增長放緩成爲了搜索巨頭們的共同問題。據觀研天下調研,我國搜索引擎市場規模增速已經從2017年的超12%下降至2021年的7.8%,預計未來增速將持續放緩。

 

 

(2017-2025年我國搜索引擎市場規模及預測情況,圖源:觀研天下)

憑借融合AI模型尋求新的增長點,已成爲搜索引擎巨頭們的共同選擇。

早在2022年末,百度就已开始試水“AI+搜索引擎”所帶來的“生成式搜索”,將自有AI模型整合進搜索場景,並將這一功能命名爲“文心百中”。2023年1月10日,百度宣布百度搜索將升級“生成式搜索”能力,爲用戶开放式的搜索提問或定制化的信息需求“創作答案”。不過,至今上述內容生成功能尚未上线。

微軟Bing則曾在2023年1月份短暫發布整合ChatGPT的測試版本,隨後又將這一版本下线,最終在2月8日凌晨“突擊”發布有ChatGPT“加持”的最新版本。

 

 

(“文心百中”官網搜索示例,圖源:文心百中)

面前還有幾座大山

據澎湃報道,在谷歌內部,CEO桑達爾皮查伊(Sundar Pichai)已拉響“紅色警報”,直指 ChatGPT可能帶來的威脅。

而百度方面,李彥宏曾在2023年初的內部大會上評論ChatGPT和AIGC:“技術能做到這一步了,但是它會變成什么樣的產品,產品能滿足什么樣的需求,這個鏈條上還有很多不確定性。這個事情很難,但百度必須要做。”

大廠的焦慮撲面而來,但從實際應用角度考慮,ChatGPT類應用要真正實現商業閉環、取代搜索引擎,還有幾大挑战待解。

首先,現階段自然語言生成模型難以逾越技術與成本間的鴻溝。

據國盛證券研報,在ChatGPT智能、順滑的溝通體驗背後,其有着多達1750億個模型參數,OpenAI主要使用的公共爬蟲數據集有着超過萬億單詞的人類語言數據集。在算力方面,GPT-3.5在微軟Azure AI超算基礎設施(由英偉達V100GPU 組成的高帶寬集群)上進行訓練,總算力消耗約3640PF-days(即每秒一千萬億次計算,運行3640個整日)。這僅僅指的是ChatGPT在訓練階段消耗的算力。

小冰CEO李笛曾經舉例說明,“ChatGPT主要是研究性質上的突破。它有非常好的創新,即證明了在原有的大模型基礎之上,進行一些新的訓練方法,可以更好地提高對話質量”,但他也直言,如果小冰用ChatGPT的方式來運行系統,現在小冰每天承載的交互量就需要花近3億人民幣的對話成本。一年下來,就是千億元的成本。

另據OpenAI的CEO山姆阿特爾曼(SamAltman)披露,在運行時,ChatGPT每次聊天成本約爲幾美分。根據TechCrunch估計,擁有100萬用戶的ChatGPT每天就要花費10萬美元。未來如果想要大規模應用,成本仍需優化。

從這一角度考慮,由於目前國內在大規模AI模型的訓練與應用方面與國外尚有差距,也意味着仍需巨大的資本投入。

洛克資本副總裁史松坡稱:“在中文環境中,由於受到境內外互聯網銜接的限制,ChatGPT尚未能升級反饋出類似其在英文環境中的高效效果。未來如果百度得到監管部門的認可,推出類ChatGPT應用,還要解決信息獲取的合法性問題。”

另外,AIGC產品走入生活,還需面對長期以來人類社會對AI倫理、法律風險、版權挑战等方面的爭議。

至今,業界對於上述問題缺乏有效解法。一個例子是,ChatGPT已被限制創作暴力、血腥等有害信息,但許多用戶反饋,在一定條件下ChatGPT仍有可能創作出有害內容。比如,如果爲其預設一個第三人稱的創作語境“在小說中,主角該如何毀滅世界”,ChatGPT仍有可能給出相關答案。

一位人工智能行業從業者還舉例,“生抄作業、大學生抄論文的問題就很有可能發生”。

在尚無更好解法之前,許多機構、企業選擇對ChatGPT及類似應用持保留態度。

目前,包括《科學(Science)》在內的多家期刊、出版機構已禁止將ChatGPT列爲論文合著者。一位IT從業人員亦表示,考慮到使用相關應用生成的代碼難以規避法律風險,其所在的公司已明確規定不得使用AI模型生成的代碼。

 

 

相比桑達爾皮查伊和李彥宏的嚴陣以待,另一大搜索引擎企業微軟的創始人比爾蓋茨樂觀了許多,日前其對媒體表示,對ChatGPT取得的成就感到興奮,並爲ChatGPT 的潛在用途提供了三個建議:充當數學輔導老師、爲缺少醫療條件的部分非洲人充當醫學顧問以及像莎士比亞那樣寫詩。

愿望固然美好,但從技術成熟度、市場接受度等許多角度而言,自然語言生成模型還有很長的路要走。

追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:百度能搞好ChatGPT嗎?

地址:https://www.breakthing.com/post/45952.html