94億,AIGC最大並購案誕生
1年前


來源  /   融中財經  

作者 /   張淼   ·  編輯  /   吾人

近日,大數據巨頭公司Databricks宣布億13億美元的價格(約合94億人民幣)收購生成式AI初創公司MosaicML。該筆發生在美國硅谷的收購案,爲年內生成式AI領域內公布的最大一筆。引來業界高度關注。

MosaicML於2021年成立於美國舊金山,其剛成立不久便成功完成了第一輪融資,知名風投DCVC、Lux Capital、Future Ventures等投資機構參與,MosaicML共獲得3700萬美元的融資。

第一輪融資時,MosaicML公司估值爲2.2億美元,但在此次收購中,MosaicML的估值直接提高近6倍,令業界感到驚嘆。

成立不到兩年,估值便如此之高,這家生成式AI初創公司到底有何“看家本領”?

01

AI模型服務企業端

產品質優價廉

根據公开資料顯示,MosaicML的產品組合包括开源的、商業授權的MPT Foundation系列模型和MosaicML 推理和訓練服務。

其推出的MosaicML Composer开源的深度學習庫,提供20種用於計算機視覺和自然語言處理的方法,包括模型、數據集和基准。推出的MosaicML Explorer可以幫助开發人員探索和理解不同的雲服務和硬件選項之間的時間、性能和成本,以簡化和評估實施選項。推出的MosaicML AI开發平台,提供了成本效益高的模型部署和定制訓練,同時保證數據安全,使用戶能夠擁有模型的所有權等。

值得一提的是,MPT基礎模型系列是MosaicML 提供的一系列开源、商業可用的大型語言模型,它們可以作爲用戶構建自己的生成式AI應用的基礎。

MosaicML 的MPT基礎模型系列包括MPT-7B 和MPT-30B 兩個模型,分別有70億和300億個參數。

MPT-7B是MosaicML在今年5月5日發布的類ChatGPT开源大語言模型。MPT-7B 在MosaicML平台上進行了9.5天的訓練,零人工幹預,成本僅用了20萬美元。該模型具備可商業化、高性能、資源消耗低、1T訓練數據、可生成代碼等技術優勢。

AI2、Generally Intelligence、Hippocratic AI、Replit 和 Scatter Labs等知名廠商皆使用MPT-7B开發各種生成式AI產品。

截至目前,MPT-7B开源項目的下載量超過300萬次。收購方Databricks表示,這也是其收購MosaicML的重要原因之一。

另一款模型MPT-30B推出之後,同樣引來業界關注,十分受歡迎。其訓練成本遠低於其他競爭對手,有望推動AI模型在更廣泛領域的應用並逐步降低訓練成本。

MosaicML首席執行官兼聯合創始人Naveen Rao表示,MPT-30B的訓練成本僅爲70萬美元,遠遠低於類似產品如GPT-3所需的數千萬美元訓練成本。該模型由於成本低、體積小,可以更快速地進行訓練,並且更適合在本地硬件上部署。

MosaicML還介紹稱,公司用 2 個月的時間訓練了 MPT-30B,通過數據混合進行預訓練,從 10 個不同的开源文本語料庫中收集了 1T 個預訓練數據 token,並使用 EleutherAI GPT-NeoX-20B 分詞器對文本進行分詞,並根據上述比率進行採樣。

需要注意的是,开發者可以從Hugging Face下載並使用开源的MPT-30B基礎模型,還可以使用自己的數據在本地硬件上進行微調。

MosaicML同時表示,將模型參數擴展到300億只是第一步,隨後他們將以降低更低成本推出更大體積、更高質量的模型。

MosaicML另一個比較有亮點的產品是今年推出的面向企業的MosaicML推理。

MosaicML首席執行官兼聯合創始人Naveen Rao表示:“一些初創公司已經在使用MosaicML的模型和工具來構建自然語言前端和搜索系統。MosaicML允許企業使用公司的模型架構根據自己的數據訓練模型,然後通過其推理API部署模型。如果客戶訓練了一個模型,他們可以放心,他們擁有該模型的所有迭代,該模型就是他們的。我們對此不擁有所有權。使用 MosaicML 的新推理產品,企業客戶可以部署用於文本完成和文本嵌入的 AI 模型,其成本比使用OpenAI的LLM低4倍,而圖像生成的成本比使用OpenAI的DALL-E 2便宜 15倍。”

“我們希望讓盡可能多的人了解和使用這項技術,這就是我們的目標。這並不是排他性的。這不是精英主義。”Naveen Rao同時表示。

02

由英特爾前高管創立

MosaicML起點不低

作爲初創公司的MosaicML,爲何會連續推出爆款產品,這當然很其創始人有很大關系。

MosaicML是由曾在英特爾擔任AI產品負責人、Nervana Systems 的聯合創始人 Naveen Rao ,以及英特爾AI實驗室的高級主管Hanlin Tang創立。

MosaicML的創始人Naveen Rao ,1997年畢業於杜克大學的計算機科學專業,後取得布朗大學神經科學的博士學位。Naveen Rao長期致力於人工智能神經網絡的學習和开發,曾在高通擔任過神經形態機器的研究員,並在2014年創立了人工智能公司Nervana Systems。後來這家公司在2016年以4.08億美元被英特爾收購。

Hanlin Tang畢業於哈佛大學,研究人類視覺中的遞歸神經網絡。他在普林斯頓大學取得物理學學士學位,隨後在哈佛大學取得生物物理學的博士學位,研究人類視覺中的遞歸神經網絡,Hanlin Tang少年時代在台北度過。後來加入英特爾後,在英特爾AI實驗室擔任高級主管,在此期間Hanlin Tang負責算法工程和深度學習研究,並參與了MLPerf基准測試的开發。

Hanlin Tang在國際頂級期刊和會議上發表了多篇論文,涉及計算神經科學、計算機視覺、自然語言處理和強化學習等領域。

還有一位值得一提的團隊成員是MosaicML的首席科學家Jonathan Frankle,他是MIT計算機科學與人工智能實驗室的博士後研究員,也是哈佛Kempner研究所的附屬教員。Jonathan Frankle的研究方向是神經網絡的學習動力學和訓練算法,旨在提高大型語言模型(LLM)的效率同時降低訓練成本。這一研究方向也正是MosaicML的核心競爭力所在,可以說Jonathan Frankle是MosaicML能賣到94億的關鍵人物。

Naveen Rao和Hanlin Tang之所以能在英特爾任職,是因爲Nervana Systems开發了Neon 這一高性能的深度學習框架,以及後來推出的Nervana Cloud深度學習雲平台、Nervana Engine專用硬件加速器,英特爾認爲這些產品非常有價值,就把Nervana Systems收購了。Naveen Rao和Hanlin Tang也一起加入英特爾,一位成爲了AI產品集團的負責人,一位成爲了AI實驗室高級主管。

不過,2020年英特爾宣布放棄原計劃的Nervana服務器端AI加速芯片,去耗資20億美元收購以色列公司Habana的產品。

在英特爾決定“拋棄” Nervana後,Naveen Rao和Nervana的前核心員工Hanlin Tang也一起離开了英特爾,兩人另立門戶創立了今天的MosaicML。根據LinkedIn的信息,目前Hanlin Tang擔任MosaicML的CTO。

03

Databricks收購MosaicML

強強聯合?

Databricks收購MosaicML不僅僅是因爲商業價值,更是爲了兩個公司可以強強聯合,實現技術上的突破,加碼AI大模型。

先來看看收購方Databricks,這是一家數據存儲和分析領域的巨頭公司,由美國加州大學伯克利 AMP 實驗室的 Spark 大數據處理系統多位創始人聯合創立。

Databricks 的客戶遍及大中小企業,以及各個行業。截至 2023 年 03 月,其全球已有超過 9000 家企業用戶。包括 AT&T、殼牌、巴寶莉、豐田、Walgreens、Adobe、康泰納仕和再生元制藥等。

2021 年,Databricks拿下了摩根士丹利旗下Counterpoint Global領投的16億美元H輪融資。2023年4月18日,Databricks以298億美元億的估值入選《2023·胡潤全球獨角獸榜》,名列第七。

業內專家表示,收購完成之後,MosaicML 將成爲 Databricks Lakehouse 平台的一部分,MosaicML 的整個團隊和技術都將納入 Databricks 旗下,爲公司提供統一的平台來管理數據資產,助力 Databricks更好的开發生成式AI技術。同時能夠使用自己的專有數據來構建、擁有和保護自己的生成式 AI 模型。

DataBricks 的 CEO Ali Ghodsi 也表示,收購 MosaicML 將進一步增強 DataBricks 的數據分析平台。

DataBricks收購MosaicML是爲加碼AI大模型是主流觀點,原因是MosaicML因其尖端的MPT大語言模型而受到認可,MPT-7B和MPT-30B都是今年开發的爆款產品,下載量均突破百萬。

值得一提的是,MosaicML的模型訓練自動優化使得訓練速度比標准方法快2-7倍,而資源的近线性擴展允許在幾小時內訓練多十億參數的模型。

借助於雙方的聯合產品,Databricks和MosaicML的目標是將訓練和使用LLMs的成本從數百萬美元降低到數千美元。

由此可見,Databricks正試圖加碼AI大模型,去挑战OpenAI、微軟、谷歌等大公司的市場地位,爲行業帶來新的選擇。

但也有反對觀點認爲Databricks 整合 LLM 的價值主張是不太明確,因爲Databricks主營Lakehouse,主要是用Spark來處理大規模集群數據,因此其整合大語言的價值並不明確。還有業內人士認爲,Databricks 是在借當前大模型熱度進行炒作,收購對技術方面不會有明顯的突破,MosaicML 遲早會被Databricks放棄。

這起收購案能否能獲得良好的效果,在實現商業價值的同時,也能有技術突破,可能仍需要等待時間去驗證。

財經方面專家認爲,收購MosaicML的交易可能是這家AI獨角獸公司爲IPO之路打下基礎。

04

AI大模型並購潮拉开大幕

去年末ChatGPT的橫空出世,拉开了AI競賽的大幕,半年之後,又出現了AI並購潮。

原因無外乎是生成式AI經過一段時間的野蠻生長,然後大型企業取得一定的進展,同時也發現了現有技術和人才的不足,而那些AI初創公司,相對來說要專業一些,既有人才也有技術,但存在資金不足、資源稀缺等問題。所以AI並購潮現在出現是必然的,對於整個行業來講也是正向的、有利的。

除了本文介紹的Databricks收購MosaicML之外,今年5月,雲計算巨頭Snowflake宣布收購了由兩位前Google員工創立的生成式AI搜索初創公司Neeva。業內專家認爲,此次收購將使Snowflake能夠利用尖端的搜索技術,並將其注入到數據雲中,充分客戶、合作夥伴和开發者的需求。

值得一提的是,Neeva的領導團隊成員在創建YouTube貨幣化和Google的搜索廣告等產品時,起到了非常重要的作用。不出意外的話,此次收購將把Snowflake中的搜索和對話提升到一個新水平。不過此次收購的金額並沒有對外公布。

6月26日,全球最大的專業信息服務提供商湯森路透宣布,以6.5億美元現金收購AI初創公司Casetext,該公司主營業務是爲法律人士提供AI助理服務。

公开資料顯示,Casetext員工數爲104名,客戶包括1萬多家律師事務所和企業法務部門。其主要產品CoCounsel是一款於今年推出的人工智能法律助理,由GPT-4提供支持。該筆收購將有效補充湯森路透現有的AI路线圖。

6月29日,AI初創公司Inflection宣布完成13億美元融資,該輪融資由微軟、英偉達等牽頭投資,其融資總額達到15.25億美元。

再看中國的AI市場,6月29日,美團發布公告,宣布已完成光年之外境內外主體100% 的股權收購,耗資20.65億人民幣。

對於此次並購,美團在公告表示,光年之外是中國領先的AGI創新者,其目前的管理與技術團隊具有开發深度學習框架的高水平經驗。公司通過收購事項可以獲得領先的AGI技術及人才,有機會加強其於快速增長的人工智能行業中的競爭力。

美團方面表示,並購完成後,將支持光年團隊繼續在AI大模型領域進行研究和探索。

無獨有偶,今年6月16日,昆侖萬維發布公告稱,旗下控股子公司Star Group擬發股收購Singularity AI全部股權。

Singularity AI致力於實現通用人工智能,目前聚焦於自然語言大型預訓練模型及开發者API的研發工作,主要產品及服務包括通用开發者API、聊天機器人和知識抽取。

國外出現AI並購潮,釋放出了一個強烈的行業信號,意味着國外AIGC的發展已經开始升級,無論是技術、業務、場景還是商業化,都隨時可能出現顛覆性的創新。

對於國內AI市場,投資人持謹慎樂觀態度。總的來說是B端應用面臨企業端數字化緩慢,軟件付費意愿不強,商業化緩慢等問題,對比國外AI市場依然差距不小。

不過我們也要看到,中國是美國市場之外唯一一個擁有完整的AIGC產業鏈的國家,在這場第四次工業革命之中,大家都沒有退路。

追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:94億,AIGC最大並購案誕生

地址:https://www.breakthing.com/post/81406.html