從高准確率的人臉識別系統到战勝人類頂級棋手的圍棋 AI,再到預測蛋白質結構的 AI…… 人工智能一直是近幾年科技領域的熱門主題。
特別是兩年來,預訓練大模型技術更是使得 AI 的通用能力往前邁出了一大步。AI 有望大規模地創造價值。一場AI風暴正襲來。
全球管理咨詢公司麥肯錫甚至在最近的報告《生成式人工智能的經濟潛力:下一波生產力浪潮》中也指出,生成式 AI 每年可能爲全球經濟增加 2.6 萬億到 4.4 萬億美元的價值。
無獨有偶,在幾天前的亞馬遜雲科技紐約峰會中,「生成式 AI」同樣也成爲全場提及頻率最高的關鍵詞。
「如今,大模型可以在大量無標注數據中進行預訓練,實現开箱即用,以處理各種通用性問題。此外,只需相對少量的標注數據進行微調,它們就能用於特定領域的應用。」亞馬遜雲科技數據庫、數據分析和機器學習全球副總裁 Swami Sivasubramanian 表示,「通過微調輕松定制預訓練模型的能力,絕對是遊戲規則的改變。」
亞馬遜雲科技數據庫、數據分析和機器學習全球副總裁 Swami Sivasubramanian 在亞馬遜雲科技紐約峰會上發表主旨演講。
那么,對於廣闊的各行各業,這種 AI 帶來的生產力變革究竟是如何一步步發生的?
憑借過去數年的客戶需求洞察和技術積累,亞馬遜雲科技將大量的 AI 能力集成到了簡單易用的產品之中,希望以最簡潔的方式將技術進步輸送到各行各業。在這場技術盛會上,亞馬遜雲科技一口氣推出了七項生成式 AI 新功能。
最強的生成式 AI 大模型,在這裏輕松調用
半年來,大模型之战如火如荼。當 OpenAI 和谷歌你追我趕,迅速崛起的「开源」力量也不容小覷。可以預見的是,在未來的大模型競爭格局中,「沒有一個模型可以統治一切」。
在 ChatGPT 發布兩個月後,Anthropic 公司就迅速开發出了「最強競品」 Claude,又在 7 月初完成了 Claude 2 的升級。被稱爲是「AI 社區內最強大的开源大模型」的 LLaMa,在不久前也升級爲 LLaMa 2,不斷擡高开源大模型的能力上限。
正像一些業內人士所說,任何一家閉源的大模型提供商都沒有護城河。不管是 LLaMa 還是 Claude,开源大模型都顯示出了迭代速度更快、可定制性更強、更具私密性的優勢。
而這些开源大模型的力量,正在越來越多地匯聚於亞馬遜雲科技的服務之中。
今年 4 月,亞馬遜雲科技發布了全托管基礎模型服務「Amazon Bedrock」,以「關鍵基礎設施提供商」的角色加入了大模型之战。
從希望應用大模型的企業角度來說,自研大模型需要數十億美元和多年的訓練,更優的解決方案是對一些已經非常強大的开源基礎模型進行定制化的微調,以滿足自身的多樣化業務需求。
Amazon Bedrock 的重要價值就在於此。這項服務可以讓所有人都可以基於已有的大模型、專用的 AI 算力和工具,再結合自己的數據开始構建生成式 AI 應用。
在最新擴展後的 Amazon Bedrock 中,匯聚了來自一批頂級大模型供應商的最新成果:
目前,Amazon Bedrock 提供了 Anthropic 最新語言模型 Claude 2、AI21 的 JURASSIC-2、亞馬遜自研的 Amazon Titan 系列模型的訪問。Stability AI 也在 Amazon Bedrock 中首發了最新版的文生圖模型套件 Stable Diffusion XL 1.0。此外,Cohere 成爲了最新加入 Amazon Bedrock 的基礎模型供應商,並帶來了文本生成模型 Command 和文本理解模型 EMBED。
相比於其他的一站式的大模型服務平台,Amazon Bedrock 的優勢在於,用戶可將其與亞馬遜雲科技平台的其余部分集成在一起,更輕松地訪問存儲在 Amazon S3 對象存儲服務中的數據,並能夠從 亞馬遜雲科技訪問控制和治理策略中受益。
生成式 AI 讓雲計算服務的競爭格局發生了改變,除了原有的存儲、計算、網絡等基礎設施,模型、框架和應用層面的能力提供變得更爲重要。在過去一段時間,我們見到了「模型即服務」這種全新商業的誕生。如同 Amazon Bedrock 這樣的一系列平台,正在將大模型變爲直接可用的服務,幫助各行各業的用戶接入生成式 AI,撬動了一個全新的藍海市場。
推動生成式 AI 走完落地的「最後一公裏」
在今天,即使生成式 AI 模型的功能已經如此強大,它們仍然無法代替人類「執行」一部分關鍵的、個性化的任務。
比如一位顧客想咨詢換貨,電商平台的 AI 客服當然可以迅速地告知顧客想要的款式、尺碼、顏色是否還有庫存,但無法完成接下來的訂單更新或交易管理的操作
這恰恰是「生成式 AI」轉化爲「生產力」過程中非常關鍵的一步。
問題並非不能解決:模型通常可以附加 API、插件、數據庫以擴展功能,爲用戶自動完成某些特定的任務。比如 ChatGPT 此前就推出了插件機制,還爲开發者提供了开放平台,允許更多用戶根據自己的需求、想法和專業能力進行擴展。
爲了簡化這一環節所需的工作,亞馬遜雲科技正式推出了 Amazon Bedrock Agents。
Amazon Bedrock Agents 可以擴展基礎模型以理解用戶請求,將復雜任務分解爲多個步驟,开展對話以收集更多信息,並採取行動來滿足用戶請求。开發者只需點擊幾下,就能創建完全托管的 Agents:
該功能創建的對話式智能體可根據專有數據提供個性化的最新答案並執行操作,幫助企業加速交付生成式 AI 應用程序,推動解決生成式 AI 落地的「最後一公裏」問題。比如,企業可以使用 Amazon Bedrock Agents 創建一個可以處理訂單的客戶服務聊天機器人,利用其內部信息(包括客戶資料和退貨政策)來定制化服務於每個訂單。
如果做個比喻的話,Amazon Bedrock Agents 就像是一個得力的助手。或許在不久的將來,我們就能享受這一功能所提供的用戶端服務:不只是顯示有哪些合適的航班、推薦口碑好的餐廳,還能直接幫忙預訂、跟進。
生成式 AI 時代的搜索技術變革
在解決大模型落地挑战的火熱討論中,「向量搜索」和「向量數據庫」的概念开始被越來越多的人熟知。這是檢索技術層面在生成式 AI 時代正在發生的變革。
首先,伴隨數據規模的增長,關鍵詞檢索已經不能滿足需求,向量檢索可作對傳統搜索技術的補充。通過將數據表示爲向量,模型可以快速分析和理解大量信息,准確地識別和匹配相似的項目。
其次,經過預訓練的大模型固然能力出衆,但也存在一些不足,比如缺乏領域知識、缺乏長期記憶、缺乏事實一致性的問題。而在數據規模不斷增長、算力日益珍貴的現狀下,向量數據庫可作爲大模型的「超級大腦」,打一份小抄,相對較低的成本補充動態知識,滿足用戶不斷增長的需求。
與向量數據庫的結合,讓大模型的綜合實力增色不少。此外,向量數據庫爲任何希望接入大模型的企業用戶提供了一種規避核心數據泄露問題的方法。
可以說,向量數據庫會成爲未來大模型研發、落地必不可少的基礎設施之一。
對於這一方向,亞馬遜雲科技早早發力,此前已上线多項支持向量的數據存儲服務,包括 Amazon Aurora PostgreSQL 兼容版關系型數據庫,兼容 PostgreSQL 的 Amazon RDS(Amazon Relational Database Service)關系型數據庫等。
在這一次的峰會上,亞馬遜雲科技又推出了適用於 Amazon OpenSearch Serverless 的向量引擎。該向量引擎支持簡單的 API 調用,可用於存儲和查詢數十億個 Embeddings。
該引擎由 Amazon OpenSearch 項目中的 k 最近鄰 (kNN) 搜索功能提供支持,爲客戶提供無服務器環境下的語義搜索服務。即使向量從原型設計期間的幾千個增長到數億甚至更多,引擎也能無縫擴展,無需重新索引或重新加載數據來擴展基礎設施。
順應大模型時代的廣泛需求,亞馬遜雲科技還正式宣布,平台上所有的數據庫未來都將具有向量功能,幫助客戶簡化運營,方便集成數據。
讓生成式 AI 落地多重加速
在這些重磅發布之外,爲了加速生成式 AI 的訓練和應用,亞馬遜雲科技已推出了一系列服務和工具。
最新動態是,兩項關鍵服務已正式可用:
其中一項服務是關於計算基礎設施,基於英偉達 H100 Tensor Core GPU 的 Amazon EC2 P5 實例已正式可用,滿足客戶在運行工作負載時對高性能和高擴展性的需求。
很多業界知名的生成式 AI 模型同時涵蓋問題回復、代碼生成、視頻和圖像生成、語音識別等功能,規模通常有千億或萬億參數,訓練時間甚至長達數月。這勢必會成爲普遍影響生成式 AI 落地速度的因素之一。
與上一代基於 GPU 的實例相比,Amazon EC2 P5 實例使得訓練最高提速 6 倍,曾經的幾天訓練時間可縮短到幾小時,幫助客戶降低高達 40% 的訓練成本。
另外一項服務是有關於开發工具。去年,亞馬遜雲科技推出了 AI 編程助手 Amazon CodeWhisperer 預覽版,獲得了开發者的高度關注。數據表明,與未使用該編程助手的开發者相比,使用者完成任務的速度平均快 57%。
現在,Amazon CodeWhisperer 已經正式可用,並且實現了與 Amazon Glue 的集成。
從此以後,开發者可以用自然語言編寫特定任務,Amazon CodeWhisperer 會直接在 Amazon Glue Notebooks 中推薦一個或多個可完成此任務的代碼片段,用戶可以選擇「接受最推薦的建議」、「查看更多建議」或「繼續自己編寫代碼」。
也就是說,即使完全不會寫代碼,你也可以嘗試用「說人話」的方法構建出完整的應用程序。
寫在最後
技術的發展往往超乎人們的預設。曾幾何時,研究者們還需要花費數月的時間進行數據准備、數據處理和模型訓練,不得不投入極其高昂的成本,只爲了完成某一項特定的任務。
今天,生成式 AI 已經能夠給出與人類創作無法區分的內容,處理此前 AI 並不擅長的知識性工作和創造性工作。行業的壁壘在某種程度上被打破、重構,一場由生成式 AI 引發的生產力革命正在發生。
通用人工智能(AGI)是否真能實現?想必現在,已經不會有人再站出來表示質疑。
在這場浪潮中,亞馬遜雲科技選擇的路线是做好「關鍵基礎設施提供商」的工作。它的優勢在於過去 20 年在人工智能技術上的深厚積累,在於對於超過 10 萬家客戶的深刻理解,在於打磨多年的高可用、強大的基礎設施。這些都會有力地推動亞馬遜雲科技加快生成式 AI 落地的徵程,幫助到每一位开發者或創業團隊。
這場生產力革命,已經在加速過程之中了。身處其中的企業,唯有迎風而上,方能傲立潮頭。
本文作者可以追加內容哦 !
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。
標題:輕松調用、分分鐘構建應用程序,端到端的生成式AI領導者亞馬遜雲科技加速企業創新!
地址:https://www.breakthing.com/post/84199.html