阿裏雲 2022-11-19 13:45 發表於浙江
近日,在國際視頻標准MPEG Technical Requirements工作組關於MPEG Video Coding for Machine(機器視覺視頻編碼,以下簡稱“MPEG-VCM”)的技術徵集提案評測中,阿裏巴巴達摩院聯合香港城市大學提交的方案在機器視覺任務中取得2項第一,是唯一一個斬獲多項第一的提案。
達摩院與香港城市大學的提案獲得兩項第一
視頻編碼是視頻信號存儲和傳輸的基礎,在上世紀八十年代开始進入標准化發展,經過多代的迭代優化,目前最新最高效的面向人眼的視頻編碼標准爲H.266/VVC標准。
但隨着自動駕駛,智慧城市和工業互聯網等人工智能場景的發展,面向機器的視頻編碼需求急劇上升,業界迫切需要全新的視頻編碼技術。
爲此,MPEG於2019年7月成立VCM工作組,推進機器視覺視頻編碼標准化工作,吸引了阿裏巴巴、愛立信、諾基亞、浙江大學及ETRI等國內外企業和機構的參與。
今年,MPEG正式向全球發布MPEG-VCM技術徵集書,共接收到來自全球16家企業和機構的提案,將爲後續標准制定提供重要參考。
在測評階段,所有提案在多項機器視覺任務和多個數據集上進行測試,以BD-rate和BD-rate(Pareto)指標衡量各個提案相對於H.266/VVC標准的碼率節省。
最終,達摩院聯合香港城市大學的提案(Proposal 02)在物體檢測任務中取得兩項性能第一。
達摩院提出了全新的VCM框架,聯合自適應時空域編碼方案JAST,該方案包括面向機器的預分析、面向機器的預處理、自適應時域變採樣、自適應空域變採樣和核心視頻編碼器五大模塊,最終有效提升面向機器視覺任務性能的壓縮效率。在標准測試條件的物體檢測任務中,JAST方案可獲得平均39.04%的性能提升。
達摩院研究員葉琰表示:“隨着超高清視頻、AR/VR、自動駕駛、智慧城市和工業互聯網等新應用的爆發,視頻編碼技術既要面向人眼也要面向機器,我們將持續深度參與國際視頻標准的制定,用創新技術爲各行各業降低帶寬成本。”
過去幾年,達摩院積極參與國際視頻標准的制定,在ITU-T和INCITS等重要國際視頻標准組織中擔任主席和副主席職位,達摩院自研的Ali266在全球編解碼頂級賽事MSU 2021比賽中獲得了全高清FullHD客觀性能賽道的8項第一和主觀賽道的冠軍。
$上證指數(SH000001)$ $深證成指(SZ399001)$ $創業板指(SZ399006)$
本文作者可以追加內容哦 !
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。
標題:達摩院參與制定國際視頻標准,提案斬獲兩項第一!
地址:https://www.breakthing.com/post/32116.html