百度智能雲:千帆大模型平台接入LLaMA2等33個模型,推理成本可降低50%
1年前

8月2日,百度智能雲方面表示,千帆大模型平台已完成新一輪升級,重點升級了三大功能。

百度智能雲AI與大數據平台總經理忻舟表示,目前,千帆大模型平台已經全面接入LLaMA2全系列、ChatGLM2、RWKV、MPT等33個大模型,成爲國內擁有大模型最多的平台。接入的模型經過千帆平台二次性能增強,模型推理成本可降低50%。同時,千帆平台上线了國內最全的預置Prompt模板,模板數量多達103個,覆蓋對話、遊戲、編程、寫作十余個場景。第三,千帆是國內首家提供插件服務的大模型平台,本次升級再次發布多款全新插件。

2023年3月,百度智能雲推出“千帆大模型平台”,它是全球首個一站式的企業級大模型平台,不但提供包括文心一言在內的大模型服務及第三方大模型服務,還提供大模型开發和應用的整套工具鏈,能夠幫助企業解決大模型從訓練到开發過程中的所有問題。

忻舟表示,本次千帆大模型平台升級的目的是給企業、开發者提供更加靈活、多樣化、高效的大模型服務,客戶可選擇最適合自身業務的大模型,再利用千帆平台全套工具鏈進行模型再訓練,高效率、低成本地打造企業專屬大模型。此外,海量Prompt模板庫可提高大模型內容准確性和滿意度。

千帆接入LLaMA2等33個優質模型,推理成本可降低50%

當前,开源大模型生態發展迅速,大量優質模型湧現,在不同任務場景、參數量級與算力環境現出了差異化優勢。如何選擇適合的大模型、如何應用大模型能力提升市場競爭力,成爲越來越多企業迫切探索的方向。

爲了滿足企業對大模型多樣的需求,百度智能雲宣布,除了之前已經接入的文心一言、BloomZ之外,本次升級後,千帆大模型平台全面接入LLaMA2全系列、ChatGLM2、RWKV、MPT、Dolly、OpenLLaMA、Falcon等33個大模型,成爲國內擁有大模型最多的平台。企業用戶可將不同大模型搭配使用,以滿足不同細分場景的業務需求。企業和开發者可以登陸千帆大模型平台操作台,在“模型倉庫”中直接調用、部署。

忻舟介紹,千帆平台接入的大模型均經過嚴格優選,主要考核三大指標:模型效果、模型安全性、可商用。爲給企業客戶帶來更好的模型產品,千帆對這33個大模型進行了性能+安全的雙重增強。

一方面,千帆對每一個大模型進行了二次性能增強。通過優化模型、降低模型尺寸,實現模型推理速度的大幅提升。據測算,調優後模型體積可壓縮至25%-50%,推理成本可降低50%。這意味着,企業在千帆上調用這些模型可極大地節約成本,提升效果。

另一方面,千帆對第三方大模型做了二次安全增強,更好管控模型輸出的安全性。客戶在千帆上調用第三方模型,也享有平台的安全保障。

值得一提的是,爲方便开發者和企業做模型調優,千帆還提供多種低門檻調優工具,包括SFT(全量參數微調、Prompt Tuning、LoRA)及強化學習(獎勵模型學習、強化學習訓練)等,同一模型還可通過多種方式持續調優。

上线國內最全Prompt海量模板庫,大幅優化模型輸出效果

Prompt是指通過自然語言向大模型提出問題,問題的好壞將直接影響大模型的內容輸出質量。實際應用時,大模型往往因爲Prompt缺乏針對性、描述不清晰等原因影響到內容准確性。

爲幫助客戶提高Prompt提問質量、提升模型輸出滿意度,本輪升級後,百度智能雲千帆大模型平台上线了海量預置Prompt模板庫,模板數量多達103個,包含對話、編程、電商、醫療、遊戲、翻譯、演講等十余個場景。用戶可以根據需求選擇合適的模板,直接輸出給大模型, 即可提高模型內容的針對性和准確度。


忻舟在活動現場演示了不同Prompt給文心一言提問,會得到不同的效果。

原始Prompt:“《長安三萬裏》好看嗎?”,文心一言會輸出一個比較簡單的結果。

使用Prompt模板+原始Prompt:“我希望你充當一個電影評論家。你將編寫一篇引人入勝和有創意的影評。你可以涵蓋諸如情節、主題和基調、演技和角色、方向、配樂、電影攝影、制作設計、特效、剪輯、節奏、對話等主題。但最重要的方面是強調電影給你的感覺。什么是真正引起你的共鳴。你也可以對電影進行批評。請避免劇透。電影名稱是《長安三萬裏》“。因Prompt更詳細具體,文心一言回復了更符合預期的答案。

忻舟表示,很多企業使用大模型時,認爲效果不好是模型本身的問題,其實很多時候重新編寫Prompt就能達到預想的效果。海量Prompt模板的推出,大幅降低了Prompt撰寫難度。很多情況下,企業無需花費大量資源調優大模型,基於模板優化Prompt,即可得到滿意的模型效果。

國內首家提供插件服務的大模型平台,千帆插件功能再上新

插件是大模型能力的延伸,可以讓大模型的認知能力與外部信息、資源融合打通,極大擴展大模型的功能邊界。據了解,今年6月,千帆平台就上线了插件功能,是國內首家提供插件服務的大模型平台。

爲實現客戶更加個性化的需求,千帆大模型平台又發布了一系列優質插件功能。例如,剛剛上线的“Chatfile插件”,用戶可在大模型對話中一鍵上傳PDF/Doc格式文檔,大模型即可基於文檔內容實現知識點檢索,長文本摘要等功能。

值得一提的是,千帆的插件功能已率先應用於百度內部的辦公場景中,基於大模型技術打造的如流“超級助手”接入了會議室插件、內部搜索插件等20個插件。百度員工用自然語言與“超級助手”對話,即可實現文檔搜索、會議室預定、飯卡充值、休假申請等功能,大大提升員工辦公效率。

忻舟表示,大量客戶調研顯示,企業對插件功能的需求非常迫切,千帆第一時間上线該功能,是希望爲客戶提供更加個性化的服務,提升千帆平台的用戶體驗和滿意度。

“未來,千帆平台將發布更多優質的插件功能,讓客戶能夠更好地應用大模型。同時,我們歡迎所有开發者基於千帆平台共同打造豐富的插件功能,提升大模型的能力。“忻舟說。


追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:百度智能雲:千帆大模型平台接入LLaMA2等33個模型,推理成本可降低50%

地址:https://www.breakthing.com/post/84556.html