編者按
66所有公司都可能與雲遷移作鬥爭,谷歌也不例外。這就是爲什么在 Google Cloud 中,我們有一個名爲 Alphabet Cloud 的團隊,其使命是協助任何 Alphabet 團隊安全、順暢地遷移到 Google Cloud。其中一些內部客戶包括 DeepMind、Vertex AI、Waze,以及今天的示例 Google 的芯片开發基礎架構團隊。該團隊向 Google Cloud 的遷移凸顯了消除本地基礎設施的限制如何釋放團隊的潛力,並賦予开發人員創新能力——在這種情況下,革命性的芯片組爲未來的雲基礎設施提供動力。
很多人都知道谷歌是因爲它的搜索工具、谷歌地圖和安卓等軟件服務,但你知道谷歌還开發了自己的專用硬件嗎?Google 在內部設計芯片,用於機器學習超級計算機、Pixel 手機、網絡基礎設施,甚至是 YouTube 的視頻加速器。
按照谷歌所說,公司芯片开發基礎設施團隊誕生於一個數據中心,在一個計算機機架上,但隨着工作負載變得越來越復雜,它迅速成長爲數十個機架和數百台服務器。隨着項目开始增多,實施挑战也隨之增加,硬件成本每年翻一番,而且每個新計劃都需要新的工程師和基礎設施。當團隊優先考慮招聘工程師來管理和優化遺留機器時,他們知道他們正在忽視他們的核心重點:增長和創新。
在完全遷移到谷歌雲之前,該團隊探索了一種使用谷歌內部軟件設計環境的混合解決方案,並將一些電子設計自動化 (EDA) 工作負載發送到谷歌雲中。雖然該方法在短期內是可靠的,但延遲傳輸工作負載以進行分析會使工程師等待結果。同時運行兩個桌面(一個用於其設計環境,一個用於其在 Google Cloud 中的結果)的額外負擔引發了重新思考。
相信有更好的解決方案可以最大限度地減少這種混合方法的挑战,芯片开發基礎架構團隊聯系了 Alphabet Cloud 團隊。Alphabet Cloud 團隊隸屬於 Google Cloud,負責幫助 Alphabet 的團隊加速採用 Google Cloud 的獨特產品,以推動更快的开發和擴展,就像客戶的平台團隊所做的那樣。
芯片开發基礎架構團隊與 Alphabet Cloud 合作,全面遷移到 Google Cloud。在對當前基礎設施進行全面評估後,他們的分析發現以下 Google Cloud 工具最有益:用於容器和數據的Google Kubernetes Engine (GKE) 、 Cloud Storage、Filestore、Cloud Spanner、Big Query和Pub /子。
遷移到 Google Cloud 帶來的商業利益是巨大的。第一個好處是雲的彈性,特別是按需增長和快速高效地請求資源的能力。提供新的專用計算基礎設施的准備時間從六個月縮短到幾天。該團隊獲得的另一個好處是降低了運營成本,這意味着他們現在可以管理更大的足跡。借助 Google Cloud,可以在數小時內識別並解決基礎架構錯誤。該團隊還可以更快地創新,因爲它在數據中心維護上花費的時間更少。
除了資源管理優勢之外,該團隊還能夠利用 Google Cloud 的 AI 和 ML 功能來設計更高效的芯片。他們利用 Google Cloud 中現成的各種 ML 算法來高效地導航大型搜索空間,並在芯片設計的各個階段應用獨特的優化。這縮短了芯片設計流程,縮短了上市時間,擴大了 ML 加速器的產品領域,並提高了效率。
芯片設計團隊已經推出了使用谷歌雲構建的完整設計,包括最近兩代 TPU 和 YouTube 的視頻加速器程序Argos VCU。沒有物理數據中心的大小限制,芯片設計人員能夠運行更多的工作來消除錯誤。自從遷移到 Google Cloud 後,該團隊在過去一年中將每日作業提交量增加了 170%,同時保持了平穩的調度延遲。跨多個 Google Cloud 區域的 250 多個 GKE 集群支持工作負載。該平台還調解了對在谷歌雲上運行作業所需的 EDA 工具許可證的訪問。
借助 Google Cloud 的 AI 和數據功能,芯片开發基礎架構團隊可以預測資源使用情況並因此使用更少的計算資源。通過谷歌雲中可用的海量存儲支持訪問所有元數據,芯片設計團隊可以優化數據存儲類型,爲工作提供最快的介質。芯片設計和开發現在只會繼續提高效率。未來,芯片开發基礎架構團隊計劃开源部分流程,特別是 Bazel 構建規則和回歸系統,以便其他芯片制造商可以從他們與 Google Cloud 一起使用的方法中受益。
本文作者可以追加內容哦 !
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。
標題:谷歌宣布,所有芯片設計都已經上雲
地址:https://www.breakthing.com/post/50562.html