阿裏雲瑤池數據庫-集雲原生大成,釋放AI價值
1年前

數據庫作爲數字基礎設施的根技術,歷經60年的發展歷程,從上世紀 50 年代的層次數據庫、網狀數據庫,到上世紀 70 年代的關系型數據庫,再到上世紀 90 年代的分析型數據庫,2000 年的非關系型數據庫,總體保持着10年一代的發展態勢。不過在數據庫發展的前50年,數據庫世界的主角都是國外的IT廠商。但是自 2010年以來,國內廠商在雲數據庫領域逐漸大放異彩,並在分布式、HTAP、Serverless等技術方面取得了一定成績。

隨着數字經濟的不斷發展,人們對數字體驗提出全量、全要素、全流程等數字化的新需求,這給數據庫提出了新的挑战。在這樣的大背景下,阿裏雲上周五在北京召开的瑤池數據庫峰會,讓我們看到在雲數據庫這樣一條全新的賽道中,以阿裏雲爲代表的頭部雲廠商,憑借其強大的先發技術優勢,向着“雲原生+一站式”演進,帶領國產數據庫實現換道超車。

峰會上,孫家廣院士強調了基礎軟件在數字經濟發展中的關鍵作用,並指出雲計算爲基礎軟件提供了空前的機遇與發展潛力。隨着雲計算創新的推進,數據庫作爲企業IT系統的核心組件之一,其架構也發生了重大變革。雲原生架構的數據庫已經成爲市場的中堅力量,是企業數字化轉型的核心驅動。

針對客戶的業務場景需求,阿裏雲宣布將雲原生數據庫PolarDB和雲原生數據倉庫AnalyticDB打通融合,形成“雲原生一體化”的HTAP解決方案,同時推出了全新多模雲原生數據庫Lindorm AI 引擎,可在數據庫內集成AI 能力,對非結構化數據進行智能分析和處理,進一步提升數據價值。


瑤池數據庫-雲數據庫2.0時代下阿裏雲的技術突破

雲原生是Do more with less理念的產物,Do more with less就是讓用戶以更少的操作,實現更好的智能化效果。早期的雲數據庫1.0,大部分是以ECS中的自建數據庫和雲廠商托管的RDS數據庫形態存在的,這些雲數據庫架構使用的是傳統架構,只是運行在雲基礎設施上,數據庫本身並沒有爲雲做太多的改造和適配。局限於其架構,各項資源等比率的限制,其彈性範圍、資源利用率都受到較大的限制。而在這個數字化的時代,雲數據庫1.0的形態明顯不符合要求了,只有能夠充分降低數據使用成本的數據庫才能生存,只有生於雲、長於雲、基於雲原生架構的數據庫,才能迎得用戶的青睞。

從技術層面上講,雲數據庫1.0一般實現了存儲計算分離和一寫多讀,但是CPU和內存依然強綁定,不過這種綁定對用戶來說是不合理的,比如對OLAP類分析型數據庫,用戶使用少量CPU就可以定期同步和更新數據,但對OLTP交易型數據庫來說,數據訪問一般存在熱點,因此少量的內存就足夠了, 而CPU的需求會遠高於對內存的需求。

對CPU和內存資源的解耦,是雲數據庫2.0最大的技術升級。針對這項技術,阿裏雲在2021年的SIGMOD大會上發布了題爲《PolarDB Serverless: A Cloud Native Database for Disaggregated Data Centers》的論文,對於雲數據庫2.0的改造方案進行詳細論述,PolarDB實現了內存與計算及存儲的解耦,內存進一步池化,使得彈性能力呈數量級提升。這種情況下,CPU和內存資源由於池化使得使用率大幅提升,讓雲原生的技術價值得到充分體現。


“雲原生+一站式”,平台化特性打开數據價值大門的鑰匙

在大數據領域的巨頭TeraData宣布退出中國市場之後,一站式的數據服務平台已成爲用戶最強烈的需求。對於傳統數據倉庫、數據湖等產品的用戶來說,將大數據技術棧進行开源組件替換的難度很大,雖然Hadoop等技術社區近幾年都在蓬勃發展,也發布了很多優秀的產品,但想讓這些產品融合在一起共同穩定工作就不容易了,讓數據在搬運,清洗,ETL等環節中不出問題恐怕要燒高香。在這種情況下想快速獲取數據價值,無異於癡人說夢。爲了應對這種國外巨頭退出,开源組件又難以協同工作的問題,最行之有效的解決方案,就是通過一站式、平台化的數據管理與服務解決方案,彌合不同種類數據庫組件與應用之間的鴻溝,讓用戶可以在同一個界面訪問數據庫。

在這種一站式數據庫的解決方案上,阿裏雲的瑤池數據庫堪稱其中典範,瑤池不但將PolarDB與AnalyticDB打通融合,形成“雲原生一體化”的HTAP解決方案。該方案爲用戶提供統一入口,內置實時同步鏈路,通過PolarDB和AnalyticDB數據共享,性能優化的行列轉換,兼具數據處理與分析能力,爲用戶帶來一站式的數據庫使用體驗。基於某遊戲行業客戶的真實場景測算,相比其他方案,雲原生一體化HTAP解決方案以50%的成本提供了2倍性能。這也讓用戶在TeraData退出中國後,有了成本更低、效率更高的數據庫產品可以選擇。


“Lindorm”AI引擎-开啓AIGC時代的智能計算

在數字時代,一切由數據驅動已經成爲了主流,而這背後的原因其實是目前驅動企業向前發展的源動力,已經由之前的石油、煤碳轉向了由數據驅動的供給和消費。而這其中,數據庫作爲供給側,AI 作爲消費側,是數據閉環中核心的兩大組成部分。

在經歷了近十年的移動互聯網大潮衝擊之後,目前我們在電商、視頻、音樂、小說等方面積累了海量數據,而在海量數據的衝擊下,我國的移動互聯網大廠轉而採用HBase等分布式开源組件處理這些大數據,從而形成了數據供給側升級的潮流,但是HBase等組件在數據消費側提供的查詢語言不是SQL,這也造成之前可視化、報表、表盤等等應用在這種NoSQL的技術環境下完全不可用,而且機器學習(ML)等新興的數據處理方法也鮮有與傳統SQL相兼容的方案。所以在數據消費側,傳統SQL與AI兩條线場景融合,形成一體化的方案,也是市場的強烈需求,業界呼喚一款能夠使用SQL來完成建模的數據庫產品,而瑤池旗下的雲原生多模數據庫Lindorm就是能解決這一痛點的解決方案。

在Lindorm內置的AI引擎中,僅用幾段SQL,就能在數據庫內完成模型部署和推理,省去安裝部署步驟,快速搭建起一個AI應用。

數據庫未來展望 - 四化漸成未來趨勢

如我們前文所述在數據庫領域,未來的發展方向就是將雲原生數據庫這一神器,持續向着技術創新的深水區推進。阿裏雲數據庫產品事業部負責人李飛飛在峰會上表示:“四化即——"雲原生化、平台化、一體化、智能化",將成爲數據庫技術發展的重要趨勢,其中雲原生代表着高可靠、高彈性、低成本、高效率;平台化代表着瑤池數據庫基於雲平台提供一站式數據管理與服務,提供標准的OpenAPI體系,減少業務煙囪;一體化則通過多產品一體化的體驗,簡化开發、管理和運維,避免數據搬遷,實現處理分析一體化、離在线一體化、集中分布一體化、多模處理一體化;智能化則代表了數據庫發展的未來,引領數據庫與AI深度融合,爲开發者和客戶提供更便捷的數據服務。

相信未來以阿裏雲瑤池爲代表的國產數據庫還將繼續朝着四化的方向前行,不斷提升技術優勢,並在一體化、智能化等方面,繼續挖掘發展空間,助力加速各行各業的數字化轉型。



追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:阿裏雲瑤池數據庫-集雲原生大成,釋放AI價值

地址:https://www.breakthing.com/post/51253.html