硅谷手記|AI抄襲背後的硅谷“不光彩文化”
3個月前

  新華社舊金山6月3日電 硅谷手記|AI抄襲背後的硅谷“不光彩文化”

  新華社記者吳曉凌 黃堃

  “‘作假,直至成功’,這是硅谷不光彩的文化。”美國斯坦福大學人工智能實驗室主任克裏斯托弗·曼寧3日就該校某些研究人員抄襲中國清華大學等機構成果的行爲這樣評論說。他在社交媒體上還指出,該研究團隊應該深刻認識自己的錯誤。

 圖爲2024年5月30日,在瑞士日內瓦舉行的2024年“人工智能造福人類全球峰會” 上,參會者和中國移動开發的AI機器人下棋。(新華社記者連漪攝)

  5月29日,斯坦福大學一個研究團隊發布名爲Llama3-V的大模型,聲稱只要500美元的預訓練成本,就能用它獲得比肩GPT-4V等著名大模型的效果。這一消息在社交媒體和人工智能學術界被廣泛轉發。

  但業內人士很快發現,該大模型涉嫌抄襲清華大學等機構發布的 MiniCPM-Llama3-V 2.5大模型。它們都是基於开源的Llama3大模型,但清華團隊進行了獨特的訓練,包括利用“清華簡”(清華大學收藏的一批战國竹簡)訓練它識別古代中國文字的能力。測試顯示,斯坦福大學這個團隊發布的大模型居然也能識別“清華簡”。

  “已經比較確信,斯坦福這個團隊‘套殼’了我們的大模型研究成果。”清華大學計算機系長聘副教授劉知遠對新華社記者說。

  “我們從‘清華簡’逐字掃描並標注的數據集從未公开,而Llama3-V展現出了一模一樣的識別‘清華簡’能力,連做錯的樣例都一樣。”劉知遠是清華這個大模型團隊成員。他介紹說,在質疑聲發酵後,對方已經在網上刪除了此前發布的數據庫和宣傳文章,“從證據和對方反應來看,抄襲性質已比較確定”。

  曼寧發聲批評後,斯坦福該團隊的兩名成員夏爾馬和加格也在社交媒體上正式道歉,並表示要完全撤下Llama3-V模型。

  在當前的人工智能熱潮中,這個事件引發廣泛關注。有觀點認爲美國的人工智能全面領先,但該事件說明,雖然美國科技仍然整體領先,但遠非全能,也不應迷信美國單方宣布的“重大成果”。

  斯坦福大學所處的硅谷地區被認爲是美國科技創新的重鎮,既孕育了許多先進技術,也有“作假,直至成功”等被津津樂道的負面文化。

  比如,從斯坦福大學退學創業的伊麗莎白·霍姆斯曾吹噓有顛覆性檢測技術可“抽指血查癌症”,一度成爲全球聞名的科技創業明星,但後來被發現造假並因欺詐投資者罪名獲刑。放眼整個美國科技領域,近年來波音客機事故頻發等暴露了更多、更大的問題。

  在人工智能領域,前段時間還有個“著名”事件,在用中文問谷歌人工智能模型“雙子座”Pro版(Gemini Pro)它是誰時,它會回答自己是“文心一言”,這個問題很快被谷歌消除。業界人士認爲,其原因可能是谷歌在訓練大模型的中文時“參考”了中國百度公司的大模型“文心一言”相關數據。

  可見,中國科技近年來快速發展,一些獨特的優勢越來越引人注目,被美國同行“參考”甚至抄襲。

  “中國人工智能研究的國際影響力越來越大”,劉知遠說,“這次抄襲事件也從側面反映了我們的創新成果正在受到國際關注”。他說,從橫向來看,中國研究與國際頂尖成果仍有顯著差距,但從縱向來看,中國已快速成長爲人工智能科技創新的重要推動者。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:硅谷手記|AI抄襲背後的硅谷“不光彩文化”

地址:https://www.breakthing.com/post/130699.html