繼米哈遊之後,又一位重量級選手入局這個特殊的AI方向
1年前

大廠都在投入的賽道,要有新變化了。

文/以撒
在ChatGPT把大語言模型帶火之後,我相信大家都在等一些重量級的AI應用出現。說實話,這件事真的急不得,至少在遊戲/互聯網行業都還需要一兩年來摸清方向。
但有一個大方向,卻是從一开始就非常清晰的:AI虛擬主播。原因很簡單,AI的推理、連續對話和角色扮演等能力,都與虛擬主播的要求高度契合。在AI語音也相當發達的前提下,已經有不少民間大神通過自己的研究,爲紙片人接入大語言模型,在平台上高強度直播。

大家可別小瞧虛擬主播這條賽道。要知道,遊戲行業有許多大廠都在這裏投入不小,比如騰訊、網易、米哈遊、完美世界……

不過要說他們已經經過驗證的AI虛擬主播,可能就屈指可數了。其中人氣最高的,顯然是米哈遊的鹿鳴,目前她僅直播過三次,我們此前的文章也聊過不少。

而在此之後排在第二的,可能要數7月14日剛剛首播的,枝江娛樂的阿花——你應該想不到,這位主播的形象並非美少女,而是一只羊駝……但第一次直播一個多小時內,她就拿下了121位艦長,雖然這個數量不及鹿鳴首播的300多艦,但放眼V圈來看,也是相當難得的成績了。

什么概念呢?舉個不一定恰當的例子:相當於手遊產品首測還沒做付費的時候,就有一百多號人充了大小月卡。

爲什么這只羊駝會這么受歡迎?實際上,阿花是與虛擬女團A-SOUL相關的NPC——A-SOUL可以說是目前V圈最火的虛擬團體了,制作團隊形象就是羊駝,阿花則是羊駝阿草(是一只白色的枝江羊駝NPC)的學妹。

除此之外,阿花背後還有Intel作爲“首席技術支持官”。背靠這兩位重量級選手,有強大的光環倒也不難理解。

而實際的直播觀感又怎么樣呢?看完這次首播後,我發現阿花在各方面的表現其實還算不上完全成熟。不過在內容背後,我卻看出了不小的潛力。

01

直播內容: 三種开發空間不小的能力

在直播中,阿花簡單展示了幾種能力。首先是作爲核心的對話聊天能力,在觀衆們輸入彈幕後,她會挑選一些回答。

從互動情況來看,大部分問題她都能做到較爲自然地回答。比如有人問她爲什么叫阿花,她的回答是“因爲我就像一朵花兒,雖然憨憨的,但也能給這個世界增添一點點可愛和色彩呢。”

當然,觀衆們少不了千奇百怪的輸入,遇到一些特別的梗或新知識時,阿花就顯得還不太會應對。比如有人嚇唬她,說“爆!爆!爆!”(大概是發言爆炸了的意思,V圈常用來开玩笑),她就不太明白這是什么意思。

不過在與A-SOUL和枝江娛樂相關的問題上,阿花應對得都不錯。像是有人問她和成員誰高,她的回答是自己站在別人旁邊小小的,但這並不重要,重要的是能一起唱歌、跳舞。其實這個問題本身就帶一些調侃和釣魚的意味,這么一看,阿花的回答還是挺得體的。

此外還有一點比較特別:因爲阿花是3D角色,她在說話時也會根據對話內容,做出相應的動作和表情。這給她對話的生動、真實程度都有一些加成——有時候也讓她看起來更加憨憨或可愛。相比於民間大多數的2D AI主播來說,這種能力的確比較少見。

此時的她還不理解一百艦的意思

除了對話聊天之外,阿花也表演了節目,與阿草和小黑一起跳了支舞,雖然羊駝跳舞看上去有點滑稽,不過我猜這次表演只是作爲一部分基礎演示,更深入的內容還會在後續放出來。

另外,因爲身處3D大場景中,阿花也能結合彈幕的互動投票結果,在場景中選擇某個位置“遛彎”,移動過去。

這項能力看起來也不算深度,但這次的場景比較小——以往A-SOUL曾經提到過“枝江开放世界”的規劃,在前幾天貝拉的生日會上,也已經放出了地圖原畫和部分場景。如果能讓阿花在更大的場景中交互,結果可能會更有趣。

枝江开放世界的地圖

貝拉生日會上的場景

02

綜合評價:

可能是AI虛擬主播的新解法

總的來說,枝江娛樂在首播中打出的“牌”算不上王炸,但僅通過這些牌,就足以看出他們的一些底氣和思路了。

首先在技術這塊,阿花稱得上底子硬、上限高。一方面,雖然能看出她在部分問答上還不夠熟練,但學習新知識本來就是大語言模型的強項,只要多聊天,她就能變得越來越聰明,應對一些V圈的梗也基本不成問題。

另一方面,他們與Intel的深入合作也對阿花的發展相當有利。在LLM推理部分,他們與Intel合作,對不同規模的LLM進行了完善的測試和分析,Intel的技術專家團隊在一個月內提供了Super-Fused FP16/AMX-BF16 LLM推理加速方案,極大提升了效能。

經驗證,對比Stock PyTorch性能,10/20/70億LLM推理任務都獲得了至多2.8倍的加速比,這讓阿花能以非常低的开發投入滿足部署性能要求。

另外,阿花歷經形象設計、模型制作、引擎適配、交互設計等多重流程,會逐漸從後台走進人們的視野。A-SOUL與Intel在第四代英特爾 至強 可擴展處理器上,引入Super-fused LLM推理加速方案所實現的效果也將逐漸爲雙方帶來更大的好處。這很有利於後續經營——比如在如今的V圈,3D勢(xx勢通常指直播定位)的成本問題是一個很難忽視的痛點,而阿花作爲AI主播,可能會有不小的優勢。

其次在內容這塊,阿花也能結合A-SOUL講更多故事、實現更多效果。結合整體的內容鋪排來看,阿花本身就是枝江大世界內容的一環。在粉絲觀看女團成員直播之余,她可以作爲補充,提升內容的豐富程度。這一點,有不少觀衆在首播時就已經意識到了。

別看她現在只是一只羊駝,在首播上,官方表示在學習足夠深入之後,阿花還會解鎖人類形態。到那時,一些能力可能才會展現出真正的威力。

這不,在不久後的Bilibili World上,阿花就兌現承諾,在Intel × A-SOUL线下直播訪談中的驚喜彩蛋環節中變成了人類形態露面,並現場演唱了一首歌。從觀衆的反應不難看出,大家都對阿花很感興趣。尤其是在她變身的時候,現場接連爆發了好幾陣呼聲……

綜合這些點來看,我覺得枝江娛樂和A-SOUL在AI虛擬主播方面,已經有了一條很明朗的路徑。因爲阿花展現出的能力雖有限,但已經有了很多獨特的優勢。

阿花的人類形態

首先,V圈中能穩定直播的3D勢本來就不多,在品質和互動性的提升上,有能力的團隊都在嘗試各種可能性。舉個例子:在直播中最常見的互動形式,仍然是通過彈幕投票決定直播內容,或是在場景中增加一個元件,並且顯示彈幕發送者的ID來增加參與感。

但要說再往後怎么做,在技術出現大突破之前,就很難有明確的頭緒。這也是許多觀衆都希望在A-SOUL這種團隊身上,繼續看到下一步動作的原因——作爲V圈頂流,他們的技術和玩法都很領先,能力到位,自然會有一些帶頭探索的責任在身上。如果他們能利用好AIGC,讓直播、遊戲和AI融合起來,相信就能做出更多新穎、有趣的內容,這個虛擬世界,也會變得更精彩。

而阿花這樣的AI虛擬主播,可能反而會在互動性上有新的解法。就拿場景的應用來說,由中之人扮演的3D虛擬主播,只要不是提前錄制好的播片,不管場景看起來多大,在直播中的移動很大程度上都會受到動捕場地的限制。像貝拉生日會做到的效果其實已經很驚豔了,但離完全不受限制的“开放世界”,肯定還是有一些距離。

如果從AI的角度來看,一個虛擬世界中的NPC顯然就不會受到這么大的限制了——他們在3D世界中可以去到更多的地方、實現更真實的效果。這樣一來,直播也就會更像一個具有互動性的开放世界遊戲。這種效果,對目前的虛擬直播來說是遙不可及的,但對AI來說就沒那么遙遠。

而且這種大地圖的應用,還只是出於3D角色本身的特點。如果再加上AIGC技術的應用,讓阿花結合枝江世界的背景講一些故事、玩一些互動遊戲,玩法可就更多了。

其次,大多數由民間自制的AI虛擬主播,往往都在長线運營方面有更大難度。如果你了解過,會發現一些AI勢吸引人的點在於,觀衆會嘗試用大量的調侃和梗來試探AI對話的邊界。這種試探確實能帶來一些有趣的對話,進而引流、出圈,但不得不承認的是,大多數觀衆其實很難長時間保持這種試探的熱情,相對來說也更難成爲忠實粉絲。

而相比之下,阿花背後的思路顯然是要走長遠路线的。它背靠A-SOUL和Intel,在技術和內容兩方面都有不小的優勢,並且也有自己的團隊枝江娛樂支撐產出。如果他們能規劃好這條賽道的後續經營,或許AI虛擬主播就不止是我們找樂子的存在了,而是真的能進一步擡高上限,甚至成爲不少人生活的一部分。

追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:繼米哈遊之後,又一位重量級選手入局這個特殊的AI方向

地址:https://www.breakthing.com/post/81648.html