NVIDIA DGX SuperPOD 助力京東探索研究院 Vega-MT 模型
1年前
NVIDIA DGX SuperPOD 助力京東探索研究院 Vega-MT 模型
NVIDIA DGX SuperPOD 助力京東探索研究院 Vega-MT 模型大賽奪魁!發布者:NVIDIA英偉達中國
借助 NVIDIA DGX SuperPOD,京東探索研究院訓練了參數量近五十億的 Vega-MT 模型,在 2022 年第 17 屆國際機器翻譯大賽(WMT)上大放異彩。Vega-MT 在中文-英語(BLEU 33.5, chrF 0.611)、英文-中文(BLEU 49.7, chrF 0.446)、德語-英語(BLEU 33.7, chrF 0.585)、英語-德語(BLEU 37.8, chrF 0.643)、捷克語-英語(BLEU 54.9, chrF 0.744)、英語-捷克語(BLEU 41.4, chrF 0.651)和英語-俄羅斯語(BLEU 32.7, chrF 0.584)在七個翻譯賽道上榮獲冠軍。
作爲大規模 AI 基礎架構,NVIDIA DGX SuperPOD 具備完整、先進的基礎架構。相較於原來的 V100 集群,DGX SuperPOD 除了在單卡算力上取得了接近兩倍的提升外,在算力擴展性方面也呈线性增長,即擴展性方面相較於從前也取得了兩倍的提升。在多節點的情況下總計獲得了約 4 倍的提升。因此,原本需要數月才能完成類似模型(相當規模、相當復雜度)的訓練任務縮短到了兩周,研究人員也有了更充裕的時間針對模型優化。
客戶簡介及應用背景
京東作爲以供應鏈爲基礎的技術與服務企業。京東探索研究院(JD Explore Academy)秉承“以技術爲本,致力於更高效和可持續的世界”的集團使命,是以京東集團以各事業群與業務單元的技術發展爲基礎,集合全集團資源和能力,成立的專注前沿科技探索的研發部門,是實現研究和協同創新的生態平台。探索研究院深耕泛人工智能 3 大領域,包括“量子機器學習”、“可信人工智能”、“超級深度學習”,從基礎理論層面實現顛覆式創新,助力數智化產業發展及社會變革,以原創性科技賦能京東集團零售、物流、健康、科技等全產業鏈場景,打造源頭性科技高地,實現從量變到質變的跨越式發展,引領行業砥礪前行。
追加內容
本文作者可以追加內容哦 !
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。
標題:NVIDIA DGX SuperPOD 助力京東探索研究院 Vega-MT 模型
地址:https://www.breakthing.com/post/65325.html