百度十年:AI時代的登月計劃
1年前

2015年3月29日清晨,博鰲的一個早餐會上坐着三個嚴肅的男人:蓋茨、馬斯克和李彥宏。

所謂早餐會,就是三個大佬每人一瓶礦泉水,然後餓着肚子看台下的媒體記者們享用早餐。不過能把三個頂級人物湊在一起,放眼全球每年也沒幾次,在李彥宏流利的英文主持下,蓋茨和馬斯克這兩位日後經常隔空互懟的冤家,此刻也乖巧地相敬如賓。

在早餐會之前,李彥宏特地在百度貼吧上向網友徵集問題,這些問題的“成功學”濃度很高,比如問蓋茨“要怎么超過你成爲首富?”,問馬斯克“你怎么能做這么多偉大的事情?”在沐浴了一鍋雞湯之後,李彥宏終於問出了那個他最想問的問題:

“你們怎么看人工智能[1]?”

這並非一個會讓媒體老師豎起耳朵來的問題。回到2015年,此時距離Alpha Go大战李世石還有一年,主流輿論更關心硝煙未盡的移動互聯網大战,或許人工智能在某些主流人群聽不懂的領域裏取得了突破,但還遠遠算不上是熱門的商業話題。

這個問題的正確答案,對於知乎網友,可能是幾千點贊;對於求職的程序員,可能是一個豐厚的offer;而對於商業巨頭掌舵者來說,則可能價值百億甚至千億美金。“怎么看”三個字,背後指向的是微軟、特斯拉和百度三家企業的战略思考。

作爲計算機浪潮的受益者,蓋茨抓住了個人計算機普及的浪潮,李彥宏和馬斯克則抓住了web1.0的浪潮,後者又締造了電動車的風口。但所有企業家都害怕在酣睡時被列車拋下,所以這個問題的第二層含義是:人工智能會是下一波超級浪潮嗎?

對於李彥宏的問題,蓋茨和馬斯克給出的答案並沒有過份展現野心,但在之後的行動更能說明他們的態度:馬斯克在會談結束不久後便跟Sam Altman勾勒了OpenAI的雛形,而微軟更是連續多年重金投資AI,最後成功擠進了人工智能的舞台中央。

百度面臨的選擇可能更加復雜。倒回到2015年甚至更早,那是一個中國移動互聯網雄心未泯的時代,巨頭們仍然圍繞着DAU和GMV來激烈廝殺,打車、外賣、短視頻、在线教育甚至共享單車看起來都是百億美金的賽道,略顯冷門的人工智能值得“托付”嗎?

8年之後的2023年3月,三個人的答案水落石出:馬斯克參與創辦的OpenAI已經成爲超級明星,自家的無人駕駛技術也遙遙領先同行;微軟成爲了OpenAI的新主人,剛推出的Copilot給全球熱議添了一把火;百度則在3月20日正式發布了文心一言。

爲什么現在發布?李彥宏回答道:

“其實百度在過去十幾年中持續在AI研發上堅持投入,文心大模型第一個版本2019年就發布了,此後的每一年都發布一個新版本,從這個意義上說,文心一言的發布只是我們過去多年努力的一個自然延續。”

不過,李彥宏也在發布會上大方承認文心一言並不完美,很多內測截圖也顯示了文心一言還有很大的改進空間。盡管不完美,但百度的確是中國在這波浪潮裏爲數不多的追趕者,而且無論對文心一言論充滿希冀還是飽以嘲諷,都不應該忘記一個事實:

當年百度踏上人工智能這條路時,其實是一種孤注一擲。

李彥宏的選擇題

其實在博鰲早餐會三年前,百度已經決定入局人工智能——這一年也是人工智能發展史上極爲重要的一年。

2012年9月,深度學習領域的大神Hinton帶領團隊在李飛飛創建的ImageNet大賽上一鳴驚人,他們通過全新的深度卷積經網絡的方式,一舉將圖像識別的錯誤率從30%左右降低至16.42%,人工智能似乎已經展示出了接近甚至超越人類的潛力。

Hinton團隊奪冠使用的卷積神經網絡叫做AlexNet,團隊裏核心成員之一是Ilya Sutskever,他日後成爲OpenAI的聯合創始人之一。但倒回2012年,無論是AlexNet、Hinton、Sutskever甚至是李飛飛,在AlphaGo掀起人工智能的第一波出圈浪潮之前,有幾個人會去主動了解這些人的工作?

BAT這個級別的互聯網巨頭,自然對這些技術突破有着極強的敏感性,但驅動百度投入AI的“內因”可能更加重要。

2012年百度淨利潤首次突破100億人民幣,但李彥宏本人卻有一種強烈的危機感。一方面百度的核心業務依然在貢獻着穩定增長的利潤;但另一方面,移動互聯網正在快速滲透,商業世界的巨大變革呼之欲出,這讓百度陷入了某種迷茫。

2012年11月,臨近年底,李彥宏寫了一封在名爲《改變,從你我开始》的內部信中,在信中說[2]:

“當業務還在快速成長時,不應該快速追求淨利潤,而是要把更多的錢投入到更多的新業務和創新上。”他甚至寫道,“我們要淘汰小資、呼喚狼性。”

西村吉雄在《日本電子產業興衰錄》中解釋過日本電子產業的坍塌:日本公司很擅長研究“怎么做”,卻疏於判斷“做什么”。這其實是大型科技公司都面臨的問題,它們往往有很高的毛利和大把的現金,但選擇一個方向進行堅定的“豪賭”,卻有極大的風險。

不過到了2013年的年初,李彥宏不想再等了。在1月份的百度年會上,他宣布百度將成立專注於Deep Learning深度學習的研究院——即Institute of Deep Learning,簡稱IDL。這是百度歷史上第一個研究院,李彥宏親自擔任院長。

日後業界回顧這段往事,總帶着思維慣性認爲百度做人工智能是因爲轉型移動互聯網步調放緩。但再過10年人們就會發現,與其把大量真金白銀變成外賣紅包和打車券,的確不如把錢砸進人工智能——只有下遊創新被卡住的時候,人們才會重視上遊創新的重要性。

李彥宏爲IDL提出的的目標是:要做中國人工智能領域的貝爾實驗室,吸引全球最頂級的人才。

貝爾實驗室是高科技行業一個極具象徵意義的符號,而作爲大公司的研究部門本身,其成果同樣矚目。成立後的數十年裏,貝爾實驗室一共獲得了三萬多項專利,這些專利在字面意義上改變了人類的命運,比如晶體管,太陽能電池和UNIX操作系統。

貝爾實驗室的幕後英雄既有高智商高學歷的科研團隊,但更關鍵的是壟斷當時坐擁美國通信市場90%份額的AT&T,可以義無反顧的將利潤投向技術科研。從這個角度看,2012年的百度也符合這樣的特徵:有雄厚的業務基本盤,但對未來充滿危機感。

百度也拿出了足夠多的誠意,IDL先後吸引了吳恩達、張亞勤、樓天城等一大批國內外知名AI學者。同一時期,AlphaGo連挑李世石和柯潔,讓普通人第一次見識到了AI的神奇。AI浪潮再次洶湧而來:創業圈裏,一度狂熱到以科學家數量給創業公司估值。

但這條路线並非完美無瑕。過去半個多世紀裏,AI浪潮已經出現兩次,最終都潦草收尾。第一次興起於1956年,AI只會依據規則證明中學數學定理;1976年,第二次人工智能浪潮興起,專家系統登台,能力的上限也只是下贏國際象棋。

另一方面,AI是一個需要巨大投入的“豪賭”。在加盟百度之前,吳恩達一度想开發一個讓AI識別貓臉的算法,但即使是斯坦福大學,在當時也供養不起這樣一個簡單算法所需要的算力消耗,每一次數據訓練迭代背後都要花上幾十甚至上百萬元。

事實證明,那時無論是李彥宏、IDL還是百度,都大大低估了AI研究所需要的成本,以及它能夠帶來的回報。

造一艘更大的船

2018年,百度CTO王海峰帶着一位名叫吳甜的總監殺到了李彥宏面前,开了一場兩個半小時的會議,議題只有一個:要不要把百度的AI框架“飛槳”做的更大[6]。

王海峰的身上有諸多名號,最標志性的是ACL迄今50多年歷史上首位華人主席,這是自然語言處理領域世界上最具影響力的國際學術組織。吳甜則是在2005年就爲百度知道引入AI技術的老員工,作爲百度AI技術平台體系執行總監,她還兼任深度學習技術及應用國家工程實驗室副主任。

“飛槳”則是IDL自2013年开始研發的AI框架。所謂框架,可以理解爲一個集成了主流算法模型和模型訓練工具的超級工廠。它向上承接各種模型和行業應用,向下連接芯片,在AI產業中起到了類似操作系統一樣承上啓下的關鍵作用。

但直到2018年,飛槳也還是一個只存在於百度內部和實驗室的小衆產品。此時,這兩位爲百度AI开疆拓土的老將站在了同一條战线上:他們想讓百度飛槳從一個少數科學家、大企業才用得起的產品,變成整個社會的基礎設施。

不誇張地說,要普及人工智能,做出一個好用的框架是第一步。另一方面,則是基於框架之上的AI模型,兩者的關系可以簡單理解爲硬件與操作系統。對於百度來說,AI框架的开發者越多,框架的开發迭代速度就越快;开發迭代內容越豐富,使用的用戶也就越多。

所以在那次會議上,李彥宏當場拍板:我們決定要做,要什么資源都給。

2019年,僅僅爲推廣一站式开發平台 AI Studio ,百度就拿出總價值1億元的免費算力开放;2020年,爲培養高校AI人才,飛槳啓航計劃投入總價值5億元的資金與資源;2021年,飛槳再發布“大航海”計劃,3年投入15億元資金和資源,李彥宏稱,要爲中國培養500萬AI人才。

目前,飛槳的开發者數量達到535萬,生態內創建模型量達到67萬個,服務20萬家企事業單位,位列中國深度學習平台市場綜合份額第一,並一舉超越谷歌 TensorFlow 成爲全球第二大AI框架[3]。

五年過去,百度對飛槳的支持力度,顯然超出了王海峰與吳甜的預想。而飛槳也的確如李彥宏所愿,成功實現了從專業到普惠的破圈。

同一時期,恰好是外界對百度的爭議和質疑最猛烈的一段時間。一方面,隨着新經濟公司輪番上市,“百度錯過移動互聯網”似乎板上釘釘;另一方面,高附加值產業、尤其是芯片產業核心技術的缺失,成爲彌漫在中國科技領域最大的焦慮,對中國公司的苛責也與日俱增。

這其實是百度的AI探索相對尷尬的地方:AI這類前沿科技的成長曲线往往不是线性的,而是大量的研發投入和資本开支的積累,才能形成一個突破的裏程碑,其發展路徑與制造業中技術突破後的產能規模膨脹,遠不可同日而語。

同時,AI在近幾年的應用大多集中於數據中心、智慧城市等企業和公共服務領域,即便是在消費市場的應用,也往往集中在某些功能和特性層面,普通消費者對其感知並不算強。

比如2020年,百度發布了自己的第一塊量產AI芯片昆侖芯1代。和消費者日常接觸的CPU、GPU與手機SoC不同,昆侖芯主要用於數據中心和雲計算業務。到了2021年量產的昆侖2代,百度在無人駕駛場景,實現了端到端的性能適配。

很少有人知道,百度搜索其實是當前最大的AI應用場景之一。截至目前,百度的搜索服務每天響應幾十億次用戶需求,需要進行1萬億次深度語義推理與匹配[7]。

圍繞AI,百度用十年時間,搭建起了一個由芯片層、框架層、模型層以及應用層組合起來的技術架構,每一層之間,都可以通過不斷互相反饋,實現端到端優化。在這背後是百度近十年累計投入超過1000億元的研發开支,核心研發投入佔核心收入比例連續8個季度超過20%。

正如ChatGPT今年引起的熱潮一樣,前沿科技的探索總是隱藏在一個又一個不爲人知的角落,以至於它的所有成功看起來都像是橫空出世。

與偉大的距離

2022年9月,紅杉發表了一篇題爲《Generative AI: A Creative New World》的文章,盛贊大模型背後的商業應用潛力,並預言很快會出現“殺手級應用”。而該文的署名作者GPT-3,一個來自OpenAI團隊的大模型。

緊接着,基於大模型的AI繪畫問世,在全世界範圍內卷起一陣AI作畫浪潮;時隔幾個月,OpenAI團隊的新一代大模型ChatGPT推出,能寫代碼、寫小說、做數學題,還能與人類連續對話,越來越接近科幻小說中AI該有的樣子。

事實上,Chat-GPT的本質,其實是以GPT-3模型爲框架,通過“對話”這一場景,搭建了一個普通用戶也能使用的AI應用。換句話說,Chat-GPT在技術上已經非常成熟,但由於GPT-3模型長期以來離主流消費者太遠,在一定程度上塑造了Chat-GPT本身的驚豔。

不過伴隨Chat-GPT熱潮持續,對國內公司的質疑又一次甚囂塵上,但翻一翻前兩年的新聞能發現,早在GPT-3時代,中國公司已經與世界先進水平幾乎齊頭並進。

2019年,百度在內部推出了“文心”大模型,從轟動一時的AI繪畫產品文心一格,到產業級搜索系統文心百中,以及即將推出的AI對話產品文心一言,基礎都是類似GPT-3的“文心大模型”。

文心一格根據要求進行的不同風格AI繪畫

無論是GPT-3還是文心大模型,其難度都遠遠不止於技術。

有機構算過一筆账,訓練一個GPT-3,至少需要1024張A100顯卡持續運轉足足一個月,簡單估算下來,僅硬件成本支出就高達兩千五百萬美元。

同時,大模型在訓練過程中需要的參數量大、消耗的計算資源大,整個算力集群調度、模型調優同樣讓人頭大。考驗的是企業在算法、數據、框架、資源調度等全棧和全流程的綜合能力。

更關鍵的其實是資源,更通俗來說是優質數據。ChatGPT發布之後,不甘人後的谷歌也迅速推出了大模型Bard,可惜首秀即翻車,甚至編造了“太陽系外行星的第一張照片,是用 JWST 拍攝這樣的謠言,問題正是出現在訓練所用的數據質量上。

與此同時,做出中文大模型的難度甚至更高

英文大模型的訓練背後,是一座由數不清的英文文獻資料庫,Quora 、Reddit、github等高質量社區組成的富礦;而中文環境下,不同APP之間是一座座信息的孤島。另一方面,以中文的博大精深,對上下文語境理解要求更高。

百度的優勢在於,旗下不僅有面向專業的百度文庫,還有日常向的百度知道、百度貼吧、百家號,同時還向外投資了知乎這樣的高質量社區。而在技術層面,百度是市場上少有的全棧布局自研的人工智能公司。所謂全棧,即人工智能從芯片、框架、模型,再到應用的四大環節。

在技術和資源的雙重加持之下,百度基於文心大模型研發的數字人度曉曉去年“參加高考”,針對“本手、妙手、俗手”這樣的拗口題目,40秒寫下40篇高考作文。

文心行業大模型已經在很多個高精尖領域落地,比如在航空領域,文心大模型能夠應用在故障部位信息抽取、工程文獻情報分類、文獻檢索與摘要生成等多個應用場景。在傳統制造領域,TCL-百度文心大模型能夠在訓練樣本減少到只有30%~40%的情況下,即可達到原有產线效果,從而縮短產线上线的开發周期。

除此之外,百度的行業大模型還覆蓋了能源電力、金融、文娛等多個領域,與國家電網、吉利汽車、泰康保險、浦發銀行等多家機構展开了合作。

能夠爲各行各業帶來實際的好處,這是AI從科學變成產業的第一步,也是最關鍵的一步。

最後一公裏

2021年3月,百度赴港二次上市之際,李彥宏在致股東信裏再次回顧了創業21年來的風風雨雨:

過去的21年中,每當百度徘徊在十字路口,我都會問自己,什么能夠讓你真正制勝未來?我認爲就是兩方面:一是你信仰什么,二是你有多大的決心。從過去到現在,我們的信仰沒有變,我們相信技術可以改變世界。

對李彥宏來說,在技術改變世界之前,它得先改變百度。

在過去十幾年間,AI帶來的變革,實實在在地在百度內部發生着:2005年,百度知道上线,在AI的作用下匹配問題和回答者;2012年,在語音識別領域,百度僅用了三個月就上线了語音搜索,55天就开發完成了語音助手。在圖像處理上,百度上线了全球首個人臉搜索產品,以圖搜圖准確率從20%提升到80%。

作爲百度支柱業務的搜索,也在被AI悄無聲息地改變着。以框計算、智能計算爲代表的AI技術,已經替代了李彥宏二十年前發明的超鏈,成爲如今搜索引擎的核心技術支撐。

拿百度去年發布的新索引技術“知一”來說,借助跨模態大模型,它可以從文字、圖片、視頻、結構化信息等資源中不斷學習,從而更精准地呈現搜索結果。與之同時發布的還有一個叫做“千流”的索引技術,它通過AI技術解決了內容質量參差不齊的問題。

最核心的搜索之外,AI也改變了公衆對於百度是誰的認知。

在2017年之前,公衆對於百度的印象仍然停留在“搜索”上面,直到這一年的百度AI开發者大會才恍然大悟:百度竟然還是一家科技公司。

大會當天,李彥宏坐在一輛自動駕駛汽車趕來會場。在全程直播畫面中,百度的自動駕駛汽車在車水馬龍的北京道路上穿梭,完美避障、行駛平穩。

這次的亮相讓李彥宏和百度自動駕駛引起了轟動,但卻不是以技術實力,而是上了社會新聞:有網友發現,當時北京尚不允許無人駕駛汽車上路,李彥宏“違章駕駛”了;於是,百度先喫到了一張來自交警的罰單。

但就連百度也沒有想到,這個計劃外的烏龍开頭卻間接改變了中國自動駕駛法律法規的進程:

四個月後,北京自動駕駛路測新規落地;此後幾年內,百度的無人車又相繼落地上海、廣州、深圳;去年,百度在重慶、成都等地實現了全無人自動駕駛出租車的商業化運營,曾經遙不可及的Robotaxi也似乎照進了現實。

此時,距離李彥宏決定做自動駕駛已經過去了四年。一直以來,李彥宏都將自動駕駛視作是人工智能最頂級的工程,他堅信智能汽車會像是智能機器人一樣,徹底改變人類的工作和生活。

百度的許多業務都是如此,它們在改變百度的同時,也改變了我們對未來世界的想象。

百度最新自動駕駛汽車RT6

在百度AI改變世界的故事裏,不只是有科學家、工程師們的身影,還有形形的普通人:

12歲的初中生,通過使用飛槳中零門檻的easy DL,开發出了一款口罩佩戴檢測程序,實現了三千多次調用。零基礎的小白,也能在工具的幫助下,快速步入AI的世界。

有年輕人借助百度的AI算法簡單訓練,就开發出了盲人頭戴式露面實時信息採集設備,以語音或震動形式爲盲人導航。有了低成本的AI加持,善意加速流向那些不曾被關注的角落。

還有西藏的邊區醫生,利用百度的電子圖像識別技術,訓練AI識別寄生蟲,准確率高達97%。即便是在缺醫少藥的西藏邊區,也能享有國內頂尖專家的醫療服務[8]。

無論是文心大模型、飛槳平台,還是自動駕駛,百度AI正在以不同的方式越來越多地介入到我們的工作和生活中,李彥宏距離那個AI改變世界的夢想,也越來越近了。

尾聲

1962年,肯尼迪總統在賴斯大學做了個演講,號召美國人支持登月計劃。說起這個,他激情澎湃:“我們決定登上月球,並非因爲它輕而易舉,正是因爲它困難重重。”

在當時,登月計劃並不被美國民衆所理解,一些人認爲這只是無意義的太空競賽,並不能對社會帶來什么實質性的好處。

登月很貴,這讓它招致了大量的批評。登月計劃發布之後,美國宇航局NASA的开支水漲船高:第一年就花掉了100萬美元,四年後變成了每三個小時就要花100萬美元,NASA一躍而成爲預算第三大的聯邦機構,與農業並列。

一項數據表明[4],這是人類迄今爲止做過的最難的事情。巔峰時期,超過41萬美國人爲了這項計劃而努力。從宇航員到一线工廠工人,數十萬人在地球上工作了28億小時——換來了11次載人任務中,宇航員在太空中停留了2502個小時。

這個野心勃勃的計劃不像原子彈那樣實現了一項基礎科學的重大突破,卻在科學、工程、計算機等多個領域催生了數以千計的創新。

拿芯片來說,1960年,德州儀器做出了全球第一款商用集成電路產品。但它的真正落地,卻是在兩年後的阿波羅計劃中。

公文包大小的阿波羅計算機

當時,MIT要爲NASA設計阿波羅計算機,便從德州儀器那裏买了64塊集成電路。結果,MIT發現這款集成電路的速度相比晶體管提升了2.5倍,同時所需空間少了40%——即便是“小型”計算機也有冰箱那么大,而阿波羅計算機只有公文包大小,每秒可以處理85000條指令。

因爲阿波羅對大規模計算的需求,自此美國計算機芯片產業駛上了快速路:1962年,NASA买下了所有的芯片,每個售價1000美元;1963年,NASA採購了3000個芯片,每個芯片降到了15美元;到了1969年,每個芯片只需要1.58美元[5]。

結果就是,芯片的價格急速下降,政府採購佔比越來越低,越來越多的企業开始用上了便宜的芯片——現在,iPhone14每秒可以運算17萬億次,當年的阿波羅計算機需要工作2315天。

阿波羅計劃暫時還沒能把我們帶向一個太空時代,但數字時代卻是因它而起。眼下,無論是百度的文心大模型,還是海外OpenAI的GPT大模型,正是全人類在AI時代的登月計劃。

在這背後,是算力、算法、數據各種核心要素的集中試煉;以此爲牽引,人才供給、科研支持、商業應用,一個龐大的創新生態系統構建形成,爲創新提供了源源不斷的養分。

而大模型背後的框架引擎,則是一個時代的核心“根技術”,以开源的理念,平等的共享來自最頂級大腦的思維火花與研究成果,在此基礎上終將會長出萬物智能的參天大樹。

正如李彥宏在“文心一言”發布會的結尾所說的:

“我們相信,人工智能會徹底改變我們今天的每一個行業。AI的長期價值,對各行各業的顛覆性改變,才剛剛开始。未來,將會有更多的殺手級應用、現象級產品出現,將會有更多的裏程碑事件發生。”

最引人注目的科技進步,往往來自孤注一擲的決定和漫長時間裏的等待。無數人都在暢想星辰大海,但只有極少數人愿意去嘗試摘下那顆星星。

參考資料

[1] 博鰲李彥宏對話蓋茨和馬斯克,新浪

[2] 李彥宏內部郵件:從PC到移動互聯網需要狼性

[3] 百度CTO王海峰公布飛槳最新進展:535萬开發者、20萬企事業單位,百度

[4] The one statistic that shows that going to the Moon is the hardest thing we’ve ever done

[5] How NASA gave birth to modern computing—and gets no credit for it

[6] 與百度有關的日子,淺黑科技

[7] 百度的十年,中國科技創新的技術路徑,遠川研究所

[8] 人工智能助力提升基層醫療能力,中國網

作者:劉芮/胡曉琪

編輯:戴老板

視覺設計:疏睿

責任編輯:李墨天


追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:百度十年:AI時代的登月計劃

地址:https://www.breakthing.com/post/48969.html