近日,美團宣布以20.65億元人民幣的價格,收購AI公司光年之外,引發了業界的廣泛關注。
王慧文與美團創始人王興是清華大學的同學兼室友,曾經在創業道路上數度並肩作战,被譽爲互聯網圈的一段佳話。
此前,王慧文因健康原因,不得不中止了對光年之外AI事業的領導。
這次的收購,被很多人看成是王興對這位上鋪兄弟的“出手相救”。
來源:罐頭圖庫
不過,除了個人情誼之外,光年之外本身在AI領域的價值,自然也是美團此次收購的重要原因。
光年之外成立於2023年2月,由王慧文個人出資5000萬美元,估值2億美元,王慧文曾表示,“個人肉身不佔股份,75% 的股份用於邀請頂級研發人才”。並發布了“英雄帖”,聲稱要打造“中國的OpenAI”。
那么,如此高調進軍AI領域的光年之外,其真正技術實力究竟如何?被收購之後,其與美團又將在AIGC領域,打开怎樣的局面呢?。
01 收購下的收購
按照常理推斷,今年2月才成立的光年之外,注定在AI技術上不會有太深厚的積累。
既然如此,決意向AGI進軍的王慧文,就只能通過最“速成”的方式——收購,來增強自身團隊的技術實力。
王慧文在兩個月內完成技術人才團隊搭建,吸引了包括多名人工智能領域頂級專家和創業者的加入。其中最引人注目的是收購了有着40多人規模的AI框架公司“一流科技”。
一流科技是一家專注於人工智能基礎設施軟件的研發工作的創新企業,由清華袁進輝博士於2017年創立。
師從清華人工智能研究院院長張鈸的袁進輝,不僅曾任微軟亞洲研究院主管研究員,獲得過多項國際專利,還提出了當時世界上最快的主題模型訓練算法系統LightLDA。
今年4月,光年之外完成收購一流科技,持有約46.52%股權,袁進輝及輝煌合夥持有約34.63%及18.84%權益,到被美團收購時,光年之外整個團隊規模已經達到了70多人。
可以說,目前光年之外最主要的AI技術,就是來自一流科技。
而要衡量一流科技在AI領域的技術水平,我們不妨看看其親自研發的核心產品——OneFlow,這是一個對標TensorFlow、PyTorch及百度飛槳的深度學習框架。
如果要用一句話,概括OneFlow對大模型的意義,那就是它可以使用更多的計算資源,加快訓練速度,提高模型性能,同時不受內存容量的限制。
這樣的特點,主要歸功於OneFlow,靜態編譯和流式並行的核心理念和架構。
這樣的架構,簡單來說,就是在運行前就會構建好一個完整的計算圖和數據流的表示,包括計算節點、數據節點、通信節點等,而非在運行時才根據輸入這些信息。
如此一來,就可以有效地減少運行時的开銷,提高計算效率,降低大模型訓練所需的設備數量和通信量。
雖然,在當下的大模型競爭中,降低模型的訓練難度和成本,早已不是什么新穎的技術,但OneFlow的獨特之處就在於:其不僅讓大模型訓練得更快,而且還讓大模型具備了更高的“易用性”。
而這樣的“易用性”,說白了就是能讓應用更容易地落地,並支持更多的場景,例如大規模人臉識別、廣告推薦大規模訓練等。
爲實現這點,OneFlow採用了數據並行與模型並行相結合的技術。
簡單地說,就是可以將一個大的數據集切分到多個設備上,每個設備使用相同的模型參數進行訓練,然後通過通信同步梯度,提高訓練速度和效率。
這樣的技術,不僅解決了解決模型過大,無法放入單個設備的問題,還能根據不同的用戶和場景,靈活地選擇最合適的並行方式,實現更高效的分布式訓練。
了解了這一切之後,我們再從整體上分析這次美團的收購事件,就可以從中窺見,這樣的技術,在美團目前的AI布局中,爲何顯得至關重要。
02 並行訓練
要理解光年之外對美團的意義,我們就得先看看美團想用AI來做什么。
早在2020年的世界人工智能大會上,美團首席科學家、AI平台部總經理夏華夏首次公布了美團在AI科技領域的布局和愿景。
夏華夏表示:“美團AI將以‘幫大家喫得更好,生活更好’爲核心目標,致力於在實際業務場景需求上探索前沿的人工智能技術,並將之迅速落地在實際生活服務場景中,完成线下經濟的數字化。”
說白了,就是以AI技術+海量真實數據,形成以美團AI爲核心的智能化生活服務閉環。
來源:罐頭圖庫
但問題是,“實際生活服務場景”,是一個涵蓋面很廣的概念,它包括了餐飲、外賣、酒店、旅遊、電影、打車等。
這么多的場景,怎么用AI一攬子拿下?
美團給出的策略是“以場景驅動技術”。
換句話說,美團有很多種不同的服務,包括线下生活裏的各種方面,有這些場景就有大量的數據,這些大量的數據可以反過來幫助美團人工智能算法不斷迭代、優化,這些算法再幫助用戶在場景中得到更好的服務。
這實際上是一種以專有數據形成正循環的思路。
在這樣的整體布局中,一個能夠根據不同的用戶和場景,實現高效的分布式訓練的算法框架,就顯得尤爲重要。
而這正是之前提到的OneFlow的並行訓練所具備的優勢。
舉例來說,在美團外賣場景下,需求是與情境依存的,在不同的時間、空間以及其他更廣義的環境下,用戶需求、商家供給等都有顯著區別。
這樣的情況,造成了外賣場景具有很強的地理位置和就餐文化約束,
比如工作日多爲單人餐,以飯類套餐、輕食、米线爲主;而在周末,用戶會適當犒勞自己、兼顧家人,傾向於選擇更適合多人就餐的燒烤、韓國料理、火鍋。
某地區高消費用戶在工作日和周末的差異性就餐習慣
面對這種情況,以往的模型設計,比如用戶興趣建模,或者樸素的多層神經網絡,都無法應對這些復雜的用戶、時間和地理環境糾纏在一起的情況。
雖然美團對此提出了“情境細分+統一模型”的思路,將用戶的行爲序列按照不同的情境進行劃分,然後用一個統一的模型,來對每個情境下的用戶行爲進行預測。
但這種大參數的統一模型,往往會導致訓練和預測的开銷較大,影響推薦的效率和穩定性。
而OneFlow的框架,正好解決了這一痛點。
得益於數據並行與模型並行的技術,OneFlow可以把一個大的模型切分成多個小的模型,分配到多個設備上,每個設備負責一部分模型的計算,然後通過通信傳遞中間結果,完成整個模型的計算。
如此一來,OneFlow就不需要一個統一的模型,而是可以使用多個子模型來對不同細分群體的用戶行爲進行預測,並通過多任務學習和遷移學習,來實現不同情境間的知識共享和遷移,提高推薦的精准度和個性化程度。
從這個角度上說,OneFlow的技術對美團而言,無疑是一塊用在刀刃上的“好鋼”。
03 留住人才才是關鍵
盡管光年之外的加入,在技術層面上,爲美團的AI生態注入了新的活力,然而,每一個技術的背後,其實都是人才的競爭。
可以說,正是這些人才的存在,才讓此次的收購真正具有了“價值”,而非僅僅是买來了一個徒有口號和情懷的空殼公司。
在此次的收購中,光年之外對美團最大的意義,就是帶來了原先一流科技頂尖的AI人才。
除了在深度學習有着頗深造詣的袁進輝博士外,一流科技的首席科學家張鈸,不僅是清華大學人工智能智能研究院院長、而且還是中國計算機學會CCF終身成就獎獲得者,堪稱中國人工智能領域的學界泰鬥。
從這點來看,美團的科研隊伍正不斷壯大。
然而,在繁盛的表象之下,如何留住這些頂尖的人才,將是王興接下來的一個重大難題。
在這方面,百度與辛頓之間的往事,也許是一個很有啓發意義的例子。
弗裏·辛頓(Geoffrey Hinton),在業內有“人工智能教父”之稱
2012年,百度曾斥資4400萬美元,試圖收購辛頓(人工智能三大泰鬥之一)的初創公司——DNNresearch,想將這位學界泰鬥納入自己麾下。
結果辛頓最終還是選擇了谷歌。
雖然錢是少了點,但辛頓選擇了遵從內心——谷歌才是他想要的環境。
這樣的例子說明了,對於AI人才,尤其是頂尖的AI人才來說,錢永遠不是唯一考慮的因素。
本文作者可以追加內容哦 !
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。
標題:美團收購光年之外,能否留住AI人才是關鍵
地址:https://www.breakthing.com/post/74387.html