亞馬遜雲科技多位AI大咖現身,都談了些什么?
2年前

文:鄒大斌

來源:雲數科技圈

2022世界人工智能大會(WAIC)於日前落幕。

經過過去四屆的發展與沉澱,今天的世界人工智能大會已成爲人工智能領域最有影響力的國際盛會之一,今年大咖雲集、國際大廠扎堆,充分彰顯了大會的國際影響力和磁力效應。亞馬遜雲科技受邀參加了2022世界人工智能大會,並主辦了“人工智能前沿技術趨勢與最佳實踐”的线上分論壇。

論壇上,亞馬遜雲科技人工智能與機器學習產品副總裁Bratin Saha博士、亞馬遜雲科技上海人工智能研究院院長、資深首席科學家張崢教授、亞馬遜雲科技人工智能开源項目首席產品經理、开源AutoML框架AutoGluon的开發負責人葉文銘、亞馬遜雲科技機器學習加速芯片Inferentia和 Trainium 的首席架構師 Ron Diamant等人工智能領域科學家、產品專家、高級學者分享了亞馬遜雲科技在人工智能與機器學習領域的探索過程以及該領域最新前沿趨勢與行業洞見。

01 機器學習重塑數據洞察

人工智能是當下增長最快的市場之一。IDC報告顯示,到2023年人工智能系統支出將達到979億美元,與2019年相比增加了2.5倍。在人工智能衆多分支領域中,機器學習是研究和應用最爲活躍的領域之一。根據Gartner的研究分析,到2024年,75%的企業將把機器學習技術真正用於生產,爲業務所賦能。背後的原因在於,機器學習解決了對非結構化數據的分析問題,重塑了對數據的洞察。

在人工智能和機器學習的推廣應用上,亞馬遜雲科技是積極的實踐者並一直走在前沿,從亞馬遜智能語音助手Alexa、無人便利店Amazon Go到亞馬遜電商網站都有機器學習的身影。從2016年开始,亞馬遜雲科技決定將機器學習的專業能力對外輸出,爲客戶提供各種人工智能和機器學習服務。

如今使用亞馬遜雲科技的人工智能和機器學習功能服務的客戶超過10萬,覆蓋金融、汽車、醫療、工業制造等衆多行業,其中包括衆多行業頭部客戶,如Capital One、飛利浦、湯遜路透、NFL、F1賽車、西門子和拜耳等,它們利用亞馬遜雲科技的機器學習能力取得了重要的業務成果。

大量客戶應用亞馬遜雲科技的人工智能和機器學習服務,進一步加速了該業務的成長,使其成爲亞馬遜雲科技有史以來增長最快的服務之一。

“在服務客戶的過程中我們學到了很多寶貴的經驗。其中之一就是,機器學習不再是我們需要規劃的未來,而是我們現在就需要駕馭的當下。”亞馬遜雲科技人工智能與機器學習產品副總裁 Bratin Saha博士在其主題演講中表示。

亞馬遜雲科技人工智能與機器學習產品副總裁 Bratin Saha博士

02 豐富的工業化工具集爲AI賦能

在亞馬遜雲科技一直在推動機器學習普及工作,爲此推出了豐富的機器學習工具集,以賦能具有不同AI/ML機器學習需求的开發者和使用者。這些工具集可以分爲三層:

基礎層是爲機器學習專家提供的經過優化的深度學習框架。如Tensorflow、MXNet,方便專家們快速地構建環境,避免框架兼容性和依賴性等問題,從而提升訓練速度、降低推理延遲。

值得一提的是,除了對現有深度學習框架進行優化外,亞馬遜雲科技還做了大量創新的探索工作,比如紐約大學、亞馬遜雲科技上海研究院等共同开發的面向圖神經網絡以及圖機器學習的开源框架Deep Graph Library(DGL)和亞馬遜雲科技研發並开源的AutoGluon代碼庫。

會上亞馬遜雲科技上海人工智能研究院院長、資深首席科學家張崢教授就DGL最新進展進行了分享。張崢教授透露,目前DGL 0.9已經推出,年內將發布DGL 1.0版。亞馬遜雲科技人工智能开源項目首席產品經理、开源AutoML框架AutoGluon开發負責人葉文銘分享並演示 了AutoGluon 如何在 5 分鐘內通過 3 行代碼徹底改變機器學習工作流程,助力开發者輕松構建超大規模的機器學習應用。

位於中間的是Amazon SageMaker。這是一個端到端的機器學習平台,它覆蓋機器學習應用的全流程,從數據標記、數據處理、特徵存儲、算法探索、模型推理到上线再到邊緣端設備管理等爲开發人員提供全過程支持。

最上一層是各種开箱即用的機器學習和人工智能服務。它們讓客戶無需機器學習的經驗,就能快速地把這些能力集成到他們自己的應用或者業務流程中,如人臉識別、聊天機器人,以及個性化推薦、企業級搜索、欺詐檢測等。

值得一提的是,與很多技術供應商不同,亞馬遜雲科技在推動人工智能和機器學習落地的過程中,非常重視機器學習的工業化,致力於實現智能化技術的普惠。

“機器學習要從極少數的專用應用程序,演變到在我們的生活中無處不在,就要通過自動化、工具化,通過部署和標准化的流程,即通過軟件的工業化來實現的。”Bratin Saha說。

03 強大的算力爲AI提供強力支持

人工智能應用大多數是算力密集型應用,非常依賴強大的算力支持,特別是一些參數高達數十億個的大模型訓練,對於算力的需求尤爲突出。爲了推動人工智能、機器學習的普及,亞馬遜雲科技一直致力於爲機器學習量身定制的基礎設施,讓客戶能獲得最佳性能,並且以最低成本來大規模部署機器學習應用。

一方面,亞馬遜雲科技充分利用業界最新的研究成果,能爲客戶提供基於英偉達、英特爾、AMD、賽靈思等新一代的GPU和加速器的實例,並持續不斷地優化成本。比如,G5實例相比基於G4dn爲推理提供3倍的性能增強;EC2 P4d實例與上一代P3和P3dn實例相比,可以降低高達60%的訓練成本,且訓練深度學習模型的性能提高2倍。

另一方面,亞馬遜雲科技通過自主設計的AI專用芯片進一步降低機器學習的算力成本。Inferentia是亞馬遜雲科技推出的首款AI定制芯片,面向推理場景。和基於GPU的實例相比,基於Inferentia的實例可提供多達2倍的量,每次推理的成本降低了70%。Trainium是另一款機器學習芯片,面向訓練場景,基於Trainium的實例也能提供比GPU更高的性價比。

“訓練模型的計算需求正以類似的速度增長,但傳統服務器計算能力的增長並沒有這么快。兩者的差距正在增大,差距的擴大意味着機器學習變得越來越復雜和昂貴。”亞馬遜雲科技機器學習加速芯片Inferentia和 Trainium 的首席架構師 Ron Diamant在演講時表示。

他說,亞馬遜雲科技研發Inferentia和Trainium的目的就是要爲客戶提供快速、易用使用、可擴展和負擔得起的機器學習加速實例。

04 讓更多的人使用機器學習

讓更多人能夠構建機器學習解決方案,也是機器學習普及的關鍵驅動因素。根據Linkedin關於新興職業的調查,在過去4年裏,對人工智能和機器學習專家的招聘需求增了74%,是其他新興職業增長率的2倍。然而,機器學習仍處於早期,企業很難找到合適的人才。

除了提供專業的工具外,還有什么辦法能幫到這個行業,讓更多人能使用機器學習術?亞馬遜雲科技想到了一個解決方案,這就是Amazon SageMaker Canvas。Amazon SageMaker Canvas是一個低代碼开發平台,它讓業務分析人員、營銷和銷售分析師,以及其他對機器學習並不熟悉、不會編碼的人也能從機器學習模型中獲得洞察。

當然,僅有Amazon SageMaker Canvas還不夠,學生也是亞馬遜雲科技重點關注對象。爲了讓學生也可以學習機器學習,亞馬遜雲科技推出了Amazon SageMaker Studio Lab。它是一個無需設置和付費的機器學習开發環境,甚至不需要有亞馬遜雲科技的账戶,只要有一個郵箱就可以开始使用。它不僅提供免費計算,還提供免費的存儲空間。

亞馬遜雲科技還承諾到2025年,幫助世界各地的2900萬人培養技術技能,爲之提供免費的雲計算技能培訓,機器學習教育也是其中之一。

另外,截至目前已有來自150多個國家、超過14萬的开發者在亞馬遜雲科技的DeepRacer項目接受過機器學習的培訓。這是一輛比例爲1:18的全自動賽車,由機器學習技術驅動。亞馬遜雲科技還提供免費的教育課程,這些課程原本是爲亞馬遜內部的機器學習大學准備的。比如,亞馬遜雲科技編纂了《動手學機器學習》這門課程已經被多所大學採用,如斯坦福大學、清華大學、新加坡國立大學、劍橋大學等,在GitHub上也开源了這門課程。

結束語

今天,成爲數據驅動的企業成爲不少企業的目標。根據Forrester的研究,數據驅動企業每年平均保持30%的增長率,同時,仍有68%的組織認爲他們沒有從數據中獲得實實在在的價值,原因是沒有現代數據战略。而這正是亞馬遜雲科技的用武之地。

實際上,幫助企業成就其現代數據战略,真正實現數據的業務價值,才是亞馬遜雲科技的真正布局,而人工智能和機器學習只是整體布局下的一環。它與亞馬遜雲科技的數據庫、數據倉庫、大數據平台等共同構成了亞馬遜雲科技的現代數據战略。

應該說,經過多年的努力,亞馬遜雲科技圍繞數據已經構建起非常完整的工具棧,並一直持續迭代創新,爲企業利用數據創新提供最大程度地支持。現在,工具已經備齊,如何用好它們就看企業自己的了!

追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:亞馬遜雲科技多位AI大咖現身,都談了些什么?

地址:https://www.breakthing.com/post/18560.html