百度能搞好ChatGPT嗎？

相關報導

市界觀察

百度能搞好ChatGPT嗎？

1年前

百度能搞好ChatGPT嗎？

作者 | 董溫淑

編輯 | 董雨晴

在ChatGPT掀起聊天機器人全民熱潮之後，來自大洋兩岸的搜索巨頭們不得不躬身入局。

2月7日，百度確認，自然語言生成項目“文心一言（ERNIE Bot）”正在進行上线前的衝刺，坐實了其正對標美國AI聊天機器人ChatGPT开發應用的傳言。一位接近百度的人士對市界表示，“百度在相關技術層面有積累，比如文心大模型，有望最先开發出此類產品。”

同一天，谷歌宣布將在未來幾周推出實驗性對話式AI（人工智能）模型Bard。此前在一月份，谷歌還宣布其子公司DeepMind的聊天機器人Sparrow可能會在晚些時候進入測試階段。

2月8日凌晨，微軟也“起袖子”，宣布推出由ChatGPT支持的最新版本Bing（必應）搜索引擎和Edge瀏覽器，此舉致使微軟市值一天飆漲超800億美元（約5450億元人民幣）。

搜索三巨頭紛紛下場的原因，還要追溯到約兩個月前，美國AI研究機構OpenAI在2022年底發布智能聊天機器人ChatGPT。該應用堪稱史上最會聊天的AI應用，能夠提供流暢、貼合語境的溝通體驗，且推出僅5天，用戶數就突破100萬。瑞銀集團的一份報告推測，截至1月末，ChatGPT的月活用戶已經突破了 1 億。

大洋彼岸的ChatGPT爆火，讓百度“坐不住”了。百度表示，文心一言預計將於3月份完成內測，而且按照谷歌和微軟的節奏，开放內測時間還有可能提前。消息放出後，2月7日百度集團港股股價大漲15.33%。

“上火”的也不僅僅是搜索玩家。目前，奢侈品電商寺庫已宣布將引入ChatGPT。相關概念股連續多日上漲，多支漲幅在10%以上，更有部分個股走出了“六連板”的行情。

然而，二級市場燃起的這把熊熊烈火，背後卻充滿了隱憂。

（百度集團港股股價情況，圖源：同花順）

开年第一爆

ChatGPT能有如此瘋的行情，應該說是“久旱逢甘霖”。

根據Gartner曲线，一項新興技術從萌芽走向市場成熟，還需要經過市場泡沫的產生與破滅。而從2020年开始，業界認爲AI產業已經進入泡沫破裂的“死亡之谷”。這樣的背景中，ChatGPT的興起讓整個AI產業看到了一絲曙光。

IPG中國首席經濟科學家柏文喜向市界分析道：“近期ChatGPT及其他AIGC（AI生成內容）應用的興起，可以認爲是產業邁進“復蘇期”的一個徵兆和興奮點，盡管尚處於發展早期，但ChatGPT等應用可能提供豐富的消費互聯網應用場景，所昭示的前景與錢景都是不言而喻的。”

《AIGC發展趨勢報告2023：迎接人工智能的下一個時代》援引AI作畫平台6pen的預測稱，未來五年10％-30％的圖片內容將由AI參與生成，有望創造超過600億的市場規模。而據Gartner統計，當前生成式AI佔據所有生成數據的比例不到1%，預計到2025年這一佔比將達到10%。

與廣闊前景相對應的，是豐富的投資機會。

AIGC可細分爲文本生成、音頻生成、圖像生成、視頻生成、跨模態生成（如文字生成圖像、文字生成視頻等）等技術場景，應用場景則集中在娛樂、傳媒、電商等數字化程度高、內容需求豐富的行業。此前，人臉美妝、黑白圖像上色、電商商品3D模型生成等AIGC應用，已經在許多場景中實現落地。

在ChatGPT爲代表的聊天機器人（chatbot）領域，亦有許多科技企業推出面向特定需求的相關應用。比如，微軟和亞馬遜都曾推出智能個人助理，分別命名爲Cortana和Alexa等。

不過，ChatGPT與以往的聊天機器人不同的是，其展現出的知識儲備廣度和智能程度超過了以往的許多模型，堪稱“上知天文下知地理”。

但是，ChatGPT被設計無法連接到互聯網，因此目前其“知識庫”中儲備的信息截至2021年，並不能持續更新。這也被視爲未來聊天機器人可以持續改善的一個方向，谷歌最新推出的Bard機器人就被允許聯網，接收實時信息。

近期隨着ChatGPT熱度持續上升，科技巨頭相繼入局，AIGC概念隨之發酵。2月7日，國內智能人機交互企業漢王科技A股觸及漲停板，港股美圖公司大漲15%。

（AIGC產業鏈，圖源：國海證券）

根據國海證券研報，AIGC產業鏈可簡要分爲上遊數據供給方；中遊AIGC算法及模型研發方；下遊基於AIGC的各類內容創作及分發平台環節。AIGC應用不斷深化，有望爲整條產業鏈的發展帶來利好。

洛克資本投資合夥人馬統娟稱：“當前，AI行業正處在蓄力等待新風口的時期。在圖像識別、語音識別、建模、機器人控制等早期應用領域，第一批企業機構已經形成了現有格局。隨着ChatGPT引爆的新熱點出現，有利於新的玩家加入，开闢新的賽道。”

有望“幹翻”搜索引擎？

如果說ChatGPT爲AI產業帶來了新的希望，那么對百度代表的搜索引擎巨頭來說，希望中還夾雜着一絲發展危機。

據投行瑞銀集團近日發布的一份研究報告，ChatGPT的月活躍用戶在今年1月份預計達到了1億，已成爲史上增長最快的消費者應用，增速超過TikTok、Instagram等現象級應用。據應用分析公司Sensor Tower的數據，TikTok和Instagram達到1億月活用戶的時間，分別爲9個月和兩年半。

ChatGPT的快速增長，讓人看到了新型消費互聯網業態的雛形，也讓許多互聯網大廠感受到了被新興應用取而代之的焦慮。首當其衝的，就是搜索引擎。

投行摩根士丹利的首席谷歌分析師布萊恩諾瓦克在一份報告中寫道，語言模型可能會“顛覆谷歌作爲人們上網入口的地位。”就連谷歌的23號員工、Gmail的創始人保羅布赫海特也於近日提出：“谷歌可能只需要一兩年時間就會被徹底顛覆。AI將會消滅搜索引擎的結果頁面，即便谷歌跟上了人工智能的發展，其最能賺錢的業務也將大不如前。”

而這類預測，正是基於ChatGPT類應用可能帶來的顛覆性搜索體驗。

馬統娟對市界分析道，在未來，如果將ChatGPT類應用整合進現有搜索引擎，有可能進一步提升用戶獲取信息的效率。

相比傳統搜索引擎爲用戶提供列舉出關鍵詞相關鏈接索引的模式，ChatGPT則可以依據其龐大的知識庫，直接對用戶的問題給出解答。“用戶對於搜索引擎的需求是信息獲取。如果有直接得到答案的方式，肯定不愿意選擇瀏覽的方式。在我看來，ChaGPT的目標並不是取代搜索引擎，而是改變人們獲取信息的方式。相比於搜索引擎‘框計算’的模式，ChatGPT背後信息組織的方式，反饋方式則有了不同。”

這也解釋了三大搜索引擎大廠谷歌、微軟、百度紛紛下場，押注對話式語言生成模型的原因。

實際上，隨着消費互聯網紅利見頂，增長放緩成爲了搜索巨頭們的共同問題。據觀研天下調研，我國搜索引擎市場規模增速已經從2017年的超12%下降至2021年的7.8%，預計未來增速將持續放緩。

（2017-2025年我國搜索引擎市場規模及預測情況，圖源：觀研天下）

憑借融合AI模型尋求新的增長點，已成爲搜索引擎巨頭們的共同選擇。

早在2022年末，百度就已开始試水“AI+搜索引擎”所帶來的“生成式搜索”，將自有AI模型整合進搜索場景，並將這一功能命名爲“文心百中”。2023年1月10日，百度宣布百度搜索將升級“生成式搜索”能力，爲用戶开放式的搜索提問或定制化的信息需求“創作答案”。不過，至今上述內容生成功能尚未上线。

微軟Bing則曾在2023年1月份短暫發布整合ChatGPT的測試版本，隨後又將這一版本下线，最終在2月8日凌晨“突擊”發布有ChatGPT“加持”的最新版本。

（“文心百中”官網搜索示例，圖源：文心百中）

面前還有幾座大山

據澎湃報道，在谷歌內部，CEO桑達爾皮查伊（Sundar Pichai）已拉響“紅色警報”，直指 ChatGPT可能帶來的威脅。

而百度方面，李彥宏曾在2023年初的內部大會上評論ChatGPT和AIGC：“技術能做到這一步了，但是它會變成什么樣的產品，產品能滿足什么樣的需求，這個鏈條上還有很多不確定性。這個事情很難，但百度必須要做。”

大廠的焦慮撲面而來，但從實際應用角度考慮，ChatGPT類應用要真正實現商業閉環、取代搜索引擎，還有幾大挑战待解。

首先，現階段自然語言生成模型難以逾越技術與成本間的鴻溝。

據國盛證券研報，在ChatGPT智能、順滑的溝通體驗背後，其有着多達1750億個模型參數，OpenAI主要使用的公共爬蟲數據集有着超過萬億單詞的人類語言數據集。在算力方面，GPT-3.5在微軟Azure AI超算基礎設施（由英偉達V100GPU 組成的高帶寬集群）上進行訓練，總算力消耗約3640PF-days（即每秒一千萬億次計算，運行3640個整日）。這僅僅指的是ChatGPT在訓練階段消耗的算力。

小冰CEO李笛曾經舉例說明，“ChatGPT主要是研究性質上的突破。它有非常好的創新，即證明了在原有的大模型基礎之上，進行一些新的訓練方法，可以更好地提高對話質量”，但他也直言，如果小冰用ChatGPT的方式來運行系統，現在小冰每天承載的交互量就需要花近3億人民幣的對話成本。一年下來，就是千億元的成本。

另據OpenAI的CEO山姆阿特爾曼（SamAltman）披露，在運行時，ChatGPT每次聊天成本約爲幾美分。根據TechCrunch估計，擁有100萬用戶的ChatGPT每天就要花費10萬美元。未來如果想要大規模應用，成本仍需優化。

從這一角度考慮，由於目前國內在大規模AI模型的訓練與應用方面與國外尚有差距，也意味着仍需巨大的資本投入。

洛克資本副總裁史松坡稱：“在中文環境中，由於受到境內外互聯網銜接的限制，ChatGPT尚未能升級反饋出類似其在英文環境中的高效效果。未來如果百度得到監管部門的認可，推出類ChatGPT應用，還要解決信息獲取的合法性問題。”

另外，AIGC產品走入生活，還需面對長期以來人類社會對AI倫理、法律風險、版權挑战等方面的爭議。

至今，業界對於上述問題缺乏有效解法。一個例子是，ChatGPT已被限制創作暴力、血腥等有害信息，但許多用戶反饋，在一定條件下ChatGPT仍有可能創作出有害內容。比如，如果爲其預設一個第三人稱的創作語境“在小說中，主角該如何毀滅世界”，ChatGPT仍有可能給出相關答案。

一位人工智能行業從業者還舉例，“生抄作業、大學生抄論文的問題就很有可能發生”。

在尚無更好解法之前，許多機構、企業選擇對ChatGPT及類似應用持保留態度。

目前，包括《科學（Science）》在內的多家期刊、出版機構已禁止將ChatGPT列爲論文合著者。一位IT從業人員亦表示，考慮到使用相關應用生成的代碼難以規避法律風險，其所在的公司已明確規定不得使用AI模型生成的代碼。