騰訊“混元”AI大模型登頂VCR榜單 展現了其在多模態理解領域的強大實力
1年前

5月31 日,騰訊“混元”AI大模型在多模態理解領域國際權威榜單VCR(VisualCommonsenseReasoning,視覺常識推理)中登頂,兩 個單項成績和總成績均位列第一。這是繼在跨模態檢索領域大滿貫、CLUE自然語言理解分類榜及CLUE總榜登頂後,“混元”AI大模型的又一重大突破,展 現了其在多模態理解領域的強大實力。

與跨模態理解任務不同的是,多模態理解任務要求計算機除了能夠做到識別層次的感知(如分類檢測等),還需要達到認知層次的感知(如判斷意圖、邏輯推理等)。

此次登頂VCR榜首的“混元”AI大模型由騰訊廣告多媒體AI團隊自主研發,同時借助騰訊太極機器學習平台的圖形處理器算力和訓練加速框架,在預訓練任務、訓練方式上進行了諸多創新改進和設計,有效提升了模型性能。

截至目前,“混元”AI大模型在MSR-VTT、MSVD、CLUE、VCR等多個領域的AI權威榜單中取得了第一名的成績,並刷新多項行業歷史紀錄。這意味着,“混元”在自然語言理解、多模態理解、跨模態理解等領域的技術實力已得到驗證。

谷歌工程師鬧烏龍,稱AI存在意識


追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:騰訊“混元”AI大模型登頂VCR榜單 展現了其在多模態理解領域的強大實力

地址:https://www.breakthing.com/post/39908.html