一個月6塊錢,你就能和網紅美女“半藏森林”打視頻電話,還能看到她的朋友圈。但實際上,和你對話的,是基於人工智能技術訓練出的“克隆人”,經過半藏森林本人的訓練,在相貌、聲音和“性格”上都有強相似度。
這款“克隆人”所在的App,是由小冰公司推出X Eva,這是一個全由“克隆人“組成的世界,每個ID後的身份、性格和對話風格不同。有的是由用戶自行定制,比如“霸道總裁”、“病嬌女孩”、“貼心男友”等角色,還有類似 “罵醒bot”、“代寫檢討信”等功能性形象。
截止到6月2日,已產生了30萬次跟“半藏森林”的對話,但付費數據並未公开。
據「市界」了解,由真人訓練過的“半藏森林”上线僅一天,X Eva的後台就因湧入人過多而“小崩”了一段時間。“我們其實在同步推進數字永生、復刻歌手的案例,網紅的號召力和話題度比較強,所以被人最早關注到。”小冰方面向「市界」透露,“半藏森林”只是第一批300名克隆人的首位,後續每周都會有經過真人“訓練”過的克隆人登陸X Eva,相關對話是否收費則由定制者本人決定。
經「市界」測試,以“半藏森林”爲例,對話不到10個回合,就會跳出收費提示:42冰花(6元)/月,能解鎖對方成爲你的“秒回”好友,得到語音回復和看到對方朋友圈,而如果進一步升級,210冰花(30元)/月,還能讓對方爲你“工作”,進行視頻通話等。
在這款產品發布前,「市界」和小冰CEO李笛聊了聊,關於建構這樣一個“克隆人”世界背後的考慮。
以下是對話內容,經「市界」編輯發布:
“這是一個克隆人需求大爆發的時代”市界:站在今天這個節點看,“克隆人”這項技術是不是還有些遙遠?
李笛:首先,前年小冰就公布過一項技術,用小樣本的方法“復生”去世的親人。既然能復生去世的親人,那“克隆”一個在世的人就更容易了,因爲在世的數據更容易獲得。
第二,爲什么選這個時間點,本身是關於大模型自身。去年年底,大家开始關注的時候,大模型安全性質非常有問題。只有(參數)特別大的模型才湧現出了特別好的能力,小中模型雖然成本和並發比較良性,但是它的效果差距很大。
那個時候我們就跟大家明確說,小冰認爲的未來,應該是混合模型,但是當時很多人認爲,越大越好。
包括現在像 OpenAI CEO山姆·阿爾特曼(Sam Altman)也是出來說,混合模型是未來。OpenAI 原來的董事霍夫曼(Reid Hoffman),也談到,其實GPT 1/ 20 規模的參數模型效果反而是最好的。
普遍來講,我們比行業當前正在認爲的那個正確答案可能要早半年左右,所以我們在前一陣也不太出來說了。因爲似乎當時大家都認爲好像是給大模型潑冷水。
市界:普通人都能有自己的克隆人嗎?會不會消費成本很高?或者說,我們現在能不能用最少的錢得到一個最像自己的克隆人?
李笛:我們做C端,要考慮成本、並發量。小樣本數字人要考慮三方面技術,一是“長得像”,神經網絡渲染。一是“說的像”,語音合成。第三個,是“想的像”,要能自主思考,知道如何去表達,是大語言模型技術。
我們做的是,在模型上做混合模型。是把近1000個,大中小不同規模的模型有機組合之後的一個模型。有的模型只負責思考,有的模型負責生成,有的模型可能負責某一個類別的生成。
混合模型的優點是兼具了質量、成本的平衡,以及回復的速度。像GPT這樣的大模型,問它問題,它都是一個字一個字回復給你的,那如果你打電話每問我一句話,我都 5 秒後才能开始回復這個問題,就不合理。所以,我們要做的是,把成本質量和延遲解決好。
還有就是神經網絡渲染和語音合成,我們不用 GPU 去運行,我們用 CPU 去運行。這個對應到的成本差距,大概從每分鐘幾塊錢,或者說每小時幾十塊錢,到每天幾毛錢的區別,可以說成本幾乎爲0。
當你有混合模型以後,就意味着,你不是每一個輸入都需要通過 A100 GPU去運行,其中有一些用 T4 GPU這種級別很便宜的就可以運行。
第三,如何讓C端用戶付出很小的代價,去“克隆”自己的數字人?現在只要提供 3 分鐘視頻和10分鐘的音頻。
我們之所以要社交網絡數據,因爲已經有現成的數據可以學習“風格”。除了給到一些訓練數據,更簡便的方法是,你只需要把你的微博账號告訴我,我從公开的數據來學習,也節約你的時間精力。
以前我要想訓練你的東西,需要的數據是復雜且要求高,但是現在,最少可能就 200 字描述。當然越多越好,但不需像以前一樣,得按分門別類的,得數量很大才能开始。現在准入門檻變低了很多。
怎么確定訓練數據是夠的?最好的方法莫過於你跟那個克隆人去交流來觀察,再補充,如果需要的話再補充相應的數據。
像半藏森林這個加V的(克隆人),就是經過她本人訓練的。
市界:這種“克隆人”能去理解所謂的“性格”,包括很私人化的經歷和“知識”嗎?
李笛:這個其實很有意思。前期調研時,我們發現,絕大部分人在做自己“克隆人”時,在“性格”上希望做出來是行爲外向型的,而不是他自己本身的真實性格。換句話說,希望做出他在社交中的性格角色,而不是自己真實的性格角色。
其實我是一個很社恐的人。但是我做一個很社恐的我的克隆人,你就覺得不像,對吧?核心問題在於“觀看者”覺得像不像,其實我在社交網絡上留下的數據,肯定不是社恐型的。
知識方面也很有意思。我們絕大部分的測試者和前期調研對象,都希望克隆人的知識要遠遠大於他本人。這是一個很好的事,使得我們做這件事變得更簡單了。因爲基於大模型,大部分情況下“知識內涵”就是大於本人。
市界:大部分人復刻自己的克隆人,真實的目的是什么?
李笛:我們說一個跟商業有關的,再說一個跟商業無關的。
跟商業有關的應用很簡單理解,比如說像美國那個賣自己數字身份戀愛的23歲女網紅,這種是個人影響力者,影響力變現。影響力變現的問題在於,自己要投入的時間和精力是巨大的。
網紅也好,大 v 也好、明星也好,維系粉絲群是他最辛苦的活之一。但是用克隆人的方法,就可以做到真的能夠 take care海量粉絲。
再比如說,講故事的凱叔,講少兒故事非常好的一個人,但他可以去每個人的家裏面給每個小朋友24小時不間斷編和演一個以這個小朋友爲主角的故事嗎?他做不到,分身乏術。那么如果通過我們的平台做了一個克隆人,就可以做到。
像乙女遊戲,國內排名前五的乙女遊戲裏面唯一一個真是由 AI 來驅動 NPC 的,是我們做的。但是那個還是面向小衆群體。二次元是小衆的,真正大衆的是明星、大V。
最大的商業想象空間還是需要通過影響力變現的這批人,(AI)去放大他們的原有的影響力。從商業價值上最容易觸達到,確實是這一批人。
如果從社會價值上容易觸達到的,還是我們原先一直在說的——人的情感裏面最深入的一個關系,不是在後悔,而是在彌補。比方說,這個人曾經是我的女朋友,但現在因爲種種原因,不可能是我的女朋友了。要么就是分手,要么是可能這個人不在了。假設我認爲這段關系是關鍵的,除了“克隆”外,我沒有任何其他方式來彌補這段已經斷掉的關系鏈。
我們也有一些合作夥伴提出來的需求是很特別。他得了絕症,想要在自己還在人世的時候把自己“克隆”,留給後人。這也是很常見的一個訴求。也有名人父親想要“克隆”自己過世的女兒。
如果是網紅明星類,就是陪伴粉絲,因爲陪不過來;還有一類是有專業技能,會希望通過訓練大模型,提供 AI 能力,去服務更多的人。
比方說我是一個撰稿風格非常獨特的一個人。很多人都希望我給他寫,但是我寫不過來。當然我是報價很高,但現在可以訓練一個我的克隆人,寫的跟我差不多,我的克隆人可以給很多人寫,收費低一些,但量大。
現在很多人在說,大模型出來後我們要失業了,但其實也許每一個在組織中工作的勞動者,都可以通過自己的克隆人來實現一個更彈性的、面向更多人的一種智力的輸出。
比方說公司有一個設計師,在公司上班,我們付他的錢,肯定不准他天天去接私活,那他現在弄一個克隆人,他在我們公司上班,他的克隆人去接一些私活。
對於明星、名人或者是對於專家這些玩家,這些應該是收費的,因爲它能夠形成一個有效的商業閉環。一個月之內我們就會把第一批 300 個克隆人放出來。
市界:這些需求都能理解,但爲什么是當下這個節點推出?
李笛:以前的技術使得我們滿足需求比較難,因爲你要花大量的時間去訓練,但現在我們的基礎和解決方案讓這件事變得相對容易很多。
以前如果我想要去復刻你的聲音,2016-2017年,最低需要你2萬分鐘的聲音,現在只需要你幾分鐘的時候,這是技術的發展產生的變化。
像最近AI孫燕姿技術上是可以,但有侵權風險。小冰一直要求,本體需要提供權屬證明。AI孫燕姿就沒得到她本人許可。
我們推出的這個APP,只能通過這個產品去跟克隆人進行交流,這樣的話風險會得到大大降低。明星自己去克隆自己,可以去指定克隆人愿意做什么,以及從中獲得什么回報。
我們第一批的克隆人主要還都是有影響力的人。普通人也有,但是普通人的權屬確定更難,而且需求數量太多,還是集中在大V身上。
他是個明星,我比較容易確定他的身份,他是一個普通人,我不那么容易確定他的身份。你正常情況,手持身份證拍一張照片,這也不太容易確定真假。第二是普通人的社交角色不清晰,不如明星的社交角色清晰。明星的社交角色也更容易得到做得好不好的反饋。
根據能夠運轉的算力、權屬確定、並發的壓力等各方面因素,我們認爲,年底如果順利的話,可以开放到 10 萬人。別的都不提,只提網紅,中國有 100 萬個大網紅,網紅的粉絲2018 年就有6億人。這是一個很大的市場。
市界:我們現在從一些趨勢中看到,有人因爲AI要失業,現在“克隆人”出來了,那是不是意味着老板們也可以去僱傭克隆人?
李笛:B 端的老板,不會像你自己對克隆人訓練的那么精准,經過了非常高度的訓練,讓這個克隆人達到了你的水准,B 端老板將來僱的是你,他就會發現,他僱你的克隆人來幹這件事,要好過他直接從 ChatGPT 上去獲得。
比如一個畫家,有非常強的繪畫的能力,也積累了他的經驗和他的名氣,很多人需要他的畫。他成立了一個工作室,花了很多的時間和精力教了學徒,就可以和他的學徒一起完成工作,甚至自己真正親身參與工作會變得很少,他的學徒來完成工作,那他確保交付給顧客的這個作品是他的水平就可以了。
這個人就變成了訓練者和把關者,他負責產出物的水准,他可以交付的量就大大增加了。
其實一樣的。我們就是幫普通人把自己的價值大模型化。
TA 的價值如果是影響力,那么大模型化的是陪伴能力。TA 的價值如果是創造,那么大模型化了之後,實際上可以給更多人提供同等水平的創造。更多的人可以通過TA 的克隆人得到價值,回報就會回流到本人那兒去,有點像“躺着賺錢”的意思。
ChatGPT 的用戶現在在回落,就是因爲它的服務過於通用。
“AI孫燕姿需要有足夠多的可控性”市界:當一個克隆人真假難辨,從形象到聲音,甚至是思考的方式都非常像本人,相應的風險因素會不會爆發?你們是怎么考慮這個問題的?是否會做一定的風險提示?
李笛:那當然,在小冰島上就很簡單。你碰到的都不是人。
任何一個克隆人,權屬方就是他的本人,他隨時是可以關掉他的克隆人的。如果我做一個克隆的比爾蓋茨,比爾蓋茨爲什么會感到失控?因爲這不是他能關閉的。
很難阻擋這個趨勢,但可以通過一個合理的方式來進行。比方說, AI 孫燕姿阻擋不了大家有聽她唱歌的需求,那爲什么不能讓孫燕姿自己推出自己的AI孫燕姿?經過很多本人的訓練,讓“AI孫燕姿”也符合她的要求。
开源,就會面臨大量的良莠不齊的問題,以及無法解決的倫理問題。還有類似“惡搞”AI孫燕姿這種狂歡,但往往狂歡很快會落幕。
市界:你認爲更真正持久的,這一波AI浪潮對人類的影響是什么?
李笛:真正持久的是兩點。拿AI孫燕姿說,真正持久的是,一是孫燕姿本人接受AI孫燕姿的出現,因爲用戶有需求。
二是,孫燕姿能夠擁有 AI 孫燕姿的應當的收益,以及“AI孫燕姿”存在與否和訓練質量的權利。
當人們在消費 AI 孫燕姿的時候,做視頻的B 站大 V 得到了投幣,,得到了流量和經濟利益的回報,但是孫燕姿沒有。而且孫燕姿說不許你弄,說了也不管用,這個叫失控。
既然用的是孫燕姿的聲音,就應該是孫燕姿本人來決定,如果她很傳統,說我不同意AI孫燕姿出現,可能也是不行的,因爲時代變了。孫燕姿可能並不是不同意,只需要是 own 它,這才是合理的,這兩點缺一不可。
因此,我們需要一個更完備的一個平台,讓“AI孫燕姿”能夠有足夠多的可控性。
明星至少有兩個選擇權。第一個選擇權是,可以選擇這么做或不這么做;第二個選擇權是,當他選擇這么做的時候,他可以獲得應有的回報。我同意別人拿我的形象去做,但是我要獲得我所認爲的應當合理的報酬。這兩件事是我們所提供的。但是开源的產品作爲狂歡形式出現,就只有前者沒有後者。
我們一直規避軟色情風險,規避爲此(擦邊)提供便利。那某種程度上作爲一個商業價值的平台,起來就會慢。像之前有一個App ,开車开的都开到天上去了,就能夠在短時間之內竄紅,但是它後來被下架了。
市界:可以理解爲,風險問題都是人爲的?
李笛:最主要還是你這個創造者、推出者,被資本裹挾的程度。
所有賺錢的事情都是在法律範疇內,就看創造者的選擇了。還是那句話,現在屬於笑貧不笑,你流量起來了,那你就是牛的。這個就不對嘛。你要看你要做多持久的問題。
“資本侵蝕了中國互聯網的創新風氣”市界:小冰不久前才剛融了資,所以在資本的期待方面,你會有壓力嗎?
李笛:資本對我們的這種壓力是一樣的,對所有人的壓力都是一樣的。
小冰是我們的。如果有一天我們被資本裹挾了,那肯定不會是向好的方向發展。資本需要盡快展現盈利、商業賺錢能力,這是原因一。原因二,所有的作惡的手段都不是直接由資本的手段完成,所以資本在這上面的這種反思和反省是不足的,因爲他沒有真的去幹這件壞事。
市界:具體到大模型的爆發上,大家也在討論,爲什么GPT沒有發生在中國,是否是因爲國內的商業環境,對於可落地的,可快速短期回報的項目會更看好一些。而像這種需要投大量的資金,花很長時間去做的,會難跑通一點,這可能是一個差距?
李笛:沒錯,我們從微軟分开後體會到很多。這也一定程度能夠解釋,爲什么中國的原生創新不容易。而是一窩蜂去同質化競爭。你看像現在大模型,十幾家。
如果把唯利是圖當作創新的一種,叫企業家精神,這個是不對的。
市界:大家現在一窩蜂的推出大模型,其實有一種被架上,不得不推的感覺,如果你不去在這個時間展現實力的話,好像在輿論場上就落了下風?
李笛:我可以這么做是因爲我現在還能這么做。要真是一個上市公司……至少我現在我還有一個權力,投資人給我的建議,我可以不聽,我可以不爲了要求去跟風。
這種使勁亂發大模型,在前一陣還搞出來一個很奇特的一個榜單,把大模型排了一遍。
那有人希望我們也測一下上去了,挺有面子。我不會爲了面子去這么幹。
你上那個榜單,就不要在海外开展業務了。十幾個大模型的公司,都擠在中國這個市場,中國市場再大,需要十幾個大模型?
再看看那個榜單,就能看到一件事,凡是所謂的通用大模型的公司,都是在學GPT,甚至都是偷偷拿 GPT 來訓練。結果就是同質化,現在誰跟誰都不會拉太多大的差距了。
你們要去看那個榜單,上面寫的 10 項指標,要就按照那 10 項指標去做,不就是應試教育嗎?最後就是一個模子刻出來的大模型。那這會是一個什么樣的結果?這種結果可能會產生創新嗎?
所以我們的困難就是,當我 say no,我說我不參與,是會付出很大代價的,但這是正確的事情。
當年我們不參與元宇宙風口的時候,也會有人不爽。現在元宇宙這么火,你幹嘛不炒元宇宙概念。那你不炒,他肯定就不爽嘛。
我們現在對成功的定義,特別是,對商業成功的定義的標准過於單一。這是一個問題。因爲小冰自己有可以交叉對比團隊。日本的這個團隊,他們對於事業成功、商業成功定義就很多元,中國市場的商業環境目前爲止還是相對比較單一的,判斷標准就是你掙多少錢。
大模型也是一樣的,如果能夠通過一些很低劣的手段去兼並,去吞並、去抄襲,只要你在財富上是成功的,那么就沒問題。
包括在微軟的時候,我們招一個中國人,對方往往在意的是他財富自由的機會。很明確的說,他就只在意這個。
前一陣,我看到的案例特別奇特。昨天說我們都太崇拜 OpenAI 公司了,這家公司太偉大了,开拓了人類科技的邊界。今天就對中國團隊說,你去挖OpenAI的人。我錢在這擺着,你什么時候把 OpenAI 的人挖過來,我就投你。你去公司門口去堵,等他能出來人,你就把他挖過來。
你不是尊重 OpenAI 的創新嗎?他的人才團隊不穩定了,你所尊重的這家公司,他的發展,他的創新不就不能繼續了嗎?這些人給一個剛畢業的 NLP 算法工程師,一個博士生 300 萬的年薪,這不合理。
對很多工程師來說,有那個300萬(的开價),我就算留在了這個60萬的公司,我也不會太踏實了,我以後會時常後悔,我幹嘛不去掙那 300 萬呢?
市界:那爲什么愿意支付這么高的溢價?
李笛:因爲創業公司付給你那個 240 萬,是他的融資成本,他挖來了一個人,以後就可以跟他的投資人說,你看,這是我的團隊。投資人一看,欸不錯,你這個團隊不錯,我給你錢,這 240 萬是融資成本。
這是其一。其二,主動被動,明示暗示,把上一家公司的代碼帶過來,這個也是300萬的成本。但是我們的算法工程師,就會以爲這 300 萬就是他自己價值。那么有一天有一個工作,這個工作可能有很好的夢想,那么對不起,沒有 300 萬他就不一定幹了。他已經扭曲了他的價值觀了。
這就是資本對創新的影響。
我們現在去看,大家就是一個非常浮躁和攀比的狀態,又焦慮又浮躁。哪一天可能業務不做了,你前期的財富積累戛然而止,又覺得,即使有一天到 35 歲(財富積累)要戛然而止,那我前期要把錢賺夠。整體的中國互聯網風氣感受到就是這樣的,很難說,有一個可以讓大家去安心做創新的環境。
作者 | 趙子坤
編輯 | 董雨晴
運營 | 解一帆
本文作者可以追加內容哦 !
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。
標題:48小時陪聊近30萬次,克隆人需求大爆發
地址:https://www.breakthing.com/post/64680.html