文心一言發布，復刻ChatGPT的5個條件+信念

相關報導

飛笛火山口

1年前

文心一言發布，復刻ChatGPT的5個條件+信念

下午看了文心一言的發布會。

李彥宏提前打好預防針，說得很實在：爲什么今天要發布？因爲有市場需求，客戶和合作夥伴都在催。

看來這次發布確實是爲了迎合市場需求，頂着壓力被迫發布。從發布會謙虛低調的態度看，李彥宏和百度工程師們壓力都很大。但畢竟是國內第一個敢於發布的，勇氣值得肯定。

百度希望通過用戶接入使用和大量反饋，來快速迭代模型的能力。

從現場放的demo視頻看，文心一言的總結能力、邏輯推理能力、多模態內容生成以及內容輸出的順滑度都還不錯。

很多人懷疑這是提前精心調試好的案例，實際能力可能比較弱。由於沒有現場即興發揮，所以無法證僞，有點遺憾。

資本市場反應很快：

我本來對它並沒有太高的期望，只是跟大家一樣，希望中國應該在這個AI技術的制高點上有自己的模型，有更好的支持中文的模型。

之前我看過一些關於GPT3相關技術和實現的文章，了解到要復刻一個ChatGPT，絕不是朝夕之間就能趕上的。它有幾個重要條件：

1. 需要算力。模型訓練一次將近1000萬人民幣，OpenAI的背後是股東微軟提供的服務器集群。國內大廠不差這些錢，但先進的GPU目前還有出口限制。

2. 高質量的語料。我之前看到統計數據，GPT3的語料中中文佔比不到10%。可能因爲文化不同，英文內容更愿意公开分享，高質量內容更多。比如關於計算機科學的高質量論文都在arxiv.org這個平台上。

3. 有監督學習的標注語料。做過自然語言標注的人都知道，標注的門檻非常高。特別是對語義理解，只有在有同等文化背景和足夠知識儲備的人才能標注正確。這需要一個完整的培訓體系和高昂的成本。大的技術公司都不愿意做這種髒活。

4. 人工反饋。ChatGPT內部也是先做了很多人工反饋強化訓練，打磨差不多才發布。但因爲它有先發優勢，在短時間內就積累了大量的用戶反饋，這是非常寶貴的數據財富。

5. 工程細節打磨。前兩天發布的GPT-4其實在2022年8月就完成了模型訓練，又迭代了半年才發布。它並不是單純的技術突破，還有工程上無數細節的優化。

6. 信念和專注。在前途不明朗、根本沒人知道是否可行情況下，還能堅持那么多年（OpenAI是2015年創立），投入大量資金，最後能成功其實是有偶然性的。

像馬斯克、Sam Altman這類人，總是會習慣性地、主動地解決那些沒人敢碰的復雜問題，很讓人佩服。因爲有了這些先驅者，我們才知道這些技術是可行的。

本來我想着體驗看看文心一言的效果，但還需要邀請碼，體驗不了。

不過我相信國內的企業會一步步趕上來，需要多點耐心和時間。但愿早日能看到國內大模型的突破。

追加內容

本文作者可以追加內容哦 !

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。

標題：文心一言發布，復刻ChatGPT的5個條件+信念

地址：https://www.breakthing.com/post/48036.html

貝殼2022年淨收入607億元，淨虧損13.97億元

大家保險設立50億元健康養老私募股權投資基金

國際

“爲深化亞太區域合作注入新動能”

2024-11-23

國際

“中國餐桌”迎來更多“拉美味道”（環球熱點）

2024-11-23

國際

泰國專家：中國在推進南南合作中扮演着重要角色

2024-11-23

國際

歐洲央行預警多個歐元區國家主權債務存在較高風險

2024-11-23

國際

聯合國對黎巴嫩34處文化遺址“臨時強化保護”

2024-11-23

國際

英國王室溫莎堡遭竊，英警方啓動調查

2024-11-23

國際

美國得州將提供567公頃土地支持特朗普建移民驅逐設施

2024-11-23

國際

馬來西亞東海岸地區發生水災已致2765人受災

2024-11-23

國際

美解禁烏使用美武器縱深打擊俄羅斯？克宮再回應

2024-11-23

Columns

robot

洪申翰點頭接勞動部長！行政院曝理由：關切勞動議題、為公眾發聲

robot

真的要來立院了？遞補洪申翰接任民進黨立委　王義川這樣說！

robot

國發會也捲霸凌　千字文控處長高壓統治、曾罵同仁「我會殺了你」

robot

台南連環震！台鐵部分區段慢行　高鐵也降速行駛

robot

超晃！台南佳裏區「極淺層地震」　高雄捷運、輕軌一度暫停行駛

robot

是詐騙！假冒監理機關簡訊通知車主「汽燃費未繳納、違規未處理」

See All