周鴻禕談“百模大战”:彎道超車的關鍵在發展多模態
1年前

“作爲搜索引擎廠商,我們發展大模型不該是等到ChatGPT火了才跟進。”6月13日,在三六零(601360.SH,以下稱“360”)智腦大模型發布會現場,創始人周鴻禕在談到大模型行業時說道。

周鴻禕繼續稱,包括360在內的搜索引擎公司,都應該抽自己耳光,因爲早在多年前就开始發展大模型,但只顧解決眼前問題,忙着做場景結合,“如果那個時候有員工提出要做通用型人工智能,我想無論是周總、李總還是馬總,給出的答案都是:滾一邊去。”在他看來,應該感謝OpenAI的執着,給整個AI行業指明了正確的方向。

對於國內大模型和國際上的差距,周鴻禕也表達了信心。“原先我曾說國內大模型和國際差距有一兩年,現在我收回這句話,中國大模型的發展速度已經基本趕上國際先進水平,整體的基本水平已經趕上GPT-3.5,追趕GPT-4的速度也超過自己的想象。”

周鴻禕提到,今年年初,在ChatGPT發布後,中國已經進入百模大战,各家企業都發布了自己的大模型產品,這三個月相當於人工智能行業過去的三十年。

在這場發布會上,周鴻禕把下半場的重點放在了360智腦大模型的多模態能力和應用場景上。360AI數字人背後是“360智腦4.0”,提供多模態能力支撐。周鴻禕表示,GPT時代中國自研大模型彎道超車的關鍵在於發展多模態。

國內首發“文生視頻”多模態能力

當天,360發布了旗下“360智腦大模型”的4.0版本。周鴻禕表示,4.0版本有三個關鍵詞:多模態、全端應用、數字人。

周鴻禕介紹,認知型通用大模型“360智腦4.0”具備生成與創作、多輪對話、代碼能力、邏輯與推理、知識問答、閱讀理解、文本分類、翻譯、文本改寫、多模態(文本生成圖像)十大核心能力。這十大核心能力已通過中國信通院“可信AIGC大語言模型基礎能力”評估。360智腦是國內首個通過中國信通院該項權威評估的大模型產品。

“OpenAI的ChatGPT最先體現出強大的文字生成能力,中國企業追趕GPT大模型的速度很快,目前各家企業在文字生成方面的能力已經實現國際領先。預計GPT-5全面支持多模態能力,中國自研大模型彎道超車的關鍵在於發展多模態能力。”周鴻禕稱,在多模態方面,360已具備跨模態生成能力,包括文生文、文生圖、文生表、圖生圖、圖生文、視頻理解等功能。

他進一步解釋,多模態能力是給大模型增加上眼睛、耳朵、鼻子、嘴巴,而不僅僅只有大腦。下一步,360計劃將360智腦升級到5.0版本,並發布插件平台,安裝上插件是要讓它有手和腳的能力,這樣大模型的能力才能發揮出來。“當大語言模型有了多模態能力之後,它獲得的知識就不僅僅來自於文字的知識,可以來自於圖片,來自於視頻。”周鴻禕說。

值得注意的是,360此次還發布了“文生視頻”的功能,可以使用任何文字腳本生成視頻,這也是國內大模型廠商首次發布此類功能。周鴻禕在現場實時演示了360智腦是如何做出一段“無中生有”的視頻,他用文字指令要求360智腦生成熊貓劃船、企鵝在沙漠中洗澡的視頻,就在幾秒之後,就生成了一段頗爲真實的視頻。

AI數字人也是360本次重點發布的新產品。在發布會現場,周鴻禕與諸葛亮、孫悟空、馬斯克等數字人开展實時對話問答。

其中,周鴻禕詢問了“馬斯克”關於“中國電動車產業是否對你構成威脅”、“如何評價推特公司”“火箭發射失敗,對你是否是重大打擊”等問題。

目前,360的AI數字人擁有200多個角色,分爲數字名人和數字員工兩類。數字名人包括歷史人物、偶像明星、文學形象等,讓用戶在與數字人的开放對話中實現與偶像的近距離接觸,與先賢的思想交流。數字員工則可成爲企業員的知識助和辦公助手,提升企業運營效能。

此外,AI數字人還支持定制,生成自己的專屬數字人。周鴻禕在現場創建了自己的數字人,作爲360的發言人,“說對了算我的,說錯了算他的。”

在周鴻禕看來,在未來的人工智能大模型的應用環節,數字人將成爲人機對話的全新入口,“區別於傳統數字人只能按既定腳本輸出內容,360AI數字人的特點在於有記憶、有人設和性格,能夠復刻思維方式和人生經歷,是有靈魂的數字人。”

“我希望有一天當我要討論一個新產品的時候,我能跟馬斯克、喬布斯、諸葛亮的數字人坐在一起,讓大家對我的產品提一些建議。設想一下,如果有多個數字人,有不同的人設,不同的經歷,背後都是人工智能在驅動,讓他們一起來幫你做腦力激蕩,一起來跟你完成共同的目標。”周鴻禕覺得,這是智腦一個更大的提升,也是360提出的“one more thing”。

“百模大战”

當下,人工智能領域鮮花着錦,諸多大模型爭相問世,如京東chatJD大模型、百度文心大模型、阿裏通義大模型等。科技部新一代人工智能發展研究中心日前發布的《中國人工智能大模型地圖研究報告》顯示,中國10億參數規模以上的大模型已發布79個。

但各家都有自己擅長的領域,成熟的業務矩陣,且都是先拿自家的業務當做“試金石”,呈現的結果自然不同。比如阿裏雲將通義千問接入辦公軟件“釘釘”,可自動生成群聊摘要、輔助內容創作、總結會議紀要;百度的文心一言,將B端“生態圈”作爲宣傳和業務重點;華爲雲盤古大模型提出了“AI for Industries”理念。

360智腦則是融合多模態能力,試圖做出一個真正的AI數字人。周鴻禕認爲,多模態是360智腦在“百模大战”中突圍的重要路徑。

在他看來,百度、騰訊、頭條、阿裏、360都會在自己的固有場景裏把自己的AI能力賦能。接下來真正比拼的是應用落地的能力,要思考如何讓個人和企業更方便、簡單地使用AI大模型應用。“大模型的價值不僅僅在於互聯網場景,而是把大模型能力通用化、泛化、垂直化,和不同行業、不同企業具體的業務需求深度地融合。這樣的產業機會實際上才剛剛开始,未來至少有10年的紅利時期。”周鴻禕說。

目前,360智腦4.0版本已接入360全端產品,包括搜索、360瀏覽器、360安全衛士等。隨着大模型开放內測、應用場景的逐步落地,AI賦能的或許遠不只是產品本身。

“人工智能的理念還是應該以人爲本。我們無論做出多么強大的人工智能,都是在爲人類做有史以來最好的工具。通過工具的賦能,讓個人、公司、機構都能真正地提高勞動生產率。”周鴻禕覺得,大模型應該成爲人類的朋友和助手。

追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:周鴻禕談“百模大战”:彎道超車的關鍵在發展多模態

地址:https://www.breakthing.com/post/68392.html