速途網訊 日前,由工業和信息化部、寧夏回族自治區人民政府共同舉辦的2023中國算力大會在銀川舉行。會上公布了算力領域最具影響力專家學者共同評選出的算力中國·年度突破成果,阿裏雲“PAI靈駿智算服務”作爲國內AI智算基礎設施代表獲評此項重要榮譽。
該評選爲攻堅算力領域中的熱點、難點和關鍵問題設立,秉承“开創性、引領性、權威性、公平性”原則,旨在發掘在算力或相關產業達到全球領先水平的基礎理論、創新方法、方法模式和平台應用的創新成果。評審委員會由中國科學院院士、中國工程院院士、知名高校及科研機構專家、領軍企業技術帶頭人組成,集聚中國算力相關領域最具影響力的專家學者。
“PAI靈駿智算服務”是阿裏雲面向高速增長的AI計算需求打造的算力基礎設施服務,可一站式爲企業及开發者提供AI开發全流程的工程平台和智能算力。它具有超大並行計算規模、高性能、高效率、高利用率等特點,具備高達10萬卡量級的集群可擴展規模,能支撐多個萬億參數大模型同時訓練,其中單訓練任務可達萬卡規模,千卡規模的线性擴展效率達92%。
在此前實踐錘煉中,PAI靈駿智算服務穩定支撐了10萬億參數多模態大模型的耗訓練,在通義千問等大模型的訓練和應用中,將大模型訓練效率顯著提高近 10 倍,推理效率提升2倍以上。
該評選認爲,阿裏雲PAI靈駿智算服務“以高性能網絡、高性能文件存儲、高穩定性、極致軟硬件聯合優化能力和serverless化服務能力,爲大模型研究、AI for Science、AIGC等場景提供堅實支撐”。
PAI靈駿智算服務在多個核心技術領域具備領先性和創新性。動輒上千億參數的大模型訓練,並非靠簡單“堆顯卡”就能完成,而是囊括底層算力、網絡、存儲、數據計算、AI框架等復雜技術的系統性工程。除了要通過精巧的設計實現超大計算工程落地外,還要做到“又快又省”,“榨幹每一滴算力性能”。
在IaaS基礎設施層,阿裏雲打造了智能計算集群靈駿,通過端網一體、軟硬融合的可預期網絡技術對集群計算資源進行統籌和優化,實現芯片間微秒級穩定互聯和高效並行計算。相關技術創新大幅消除了AI算力拓展性瓶頸,靈駿集群規模最大可拓展至“10萬卡級”,能爲大模型的开發和應用提供靈活多尺度的智能算力,對上層平台應用提供便捷的容器化服務。
在PaaS平台服務層,阿裏雲機器學習平台PAI可對龐大訓練任務進行自動分拆和分配,通過硬件、網絡、框架一體化協同調度能力,提供速度最快、算力最省的高性能分布式訓練方案。同時,PAI配置了自動容錯訓練框架AIMaster,在大語言模型動輒數周、數月的訓練周期中,提供極致的穩定性保障,減少人工介入成本,可將大模型訓練時間縮短10倍。此外,PAI提供簡單易用的RLHF強化學習框架,能大幅提升大語言模型效果表現。
PAI靈駿智算服務還推出了國內首個serverless化智算服務模式,提供一鍵开通、按需分配、極簡運維的用戶體驗,支持AI計算資源靈活復用,可大幅提升集群利用率,降低客戶的使用成本。
據了解,阿裏雲PAI靈駿智算服務已被衆多企業及科研單位應用。阿裏雲與小鵬汽車合建的智算中心“扶搖”成爲國內最大的自動駕駛智算中心,將小鵬汽車自動駕駛模型訓練速度提升170倍以上。阿裏雲與復旦大學共同打造的雲上智算平台CFFF,近期發布了45億參數量的中短期天氣預報大模型,將預測速度從原來的小時級縮短到了3秒內。(梔橙)
本文作者可以追加內容哦 !
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。
標題:中國算力領域年度突破成果出爐,阿裏雲AI智算上榜!
地址:https://www.breakthing.com/post/90820.html