30多款大模型同台競技!在WAIC2023看盡國內AI主流大模型
1年前

探營2023世界人工智能大會,什么值得看

作者/  IT時報記者  沈毅斌

編輯/  王昕  孫妍

2022年的世界人工智能大會,帶領觀衆走進虛擬與現實相結合的世界——元宇宙。今年,ChatGPT火熱得發燙,國內的百度、華爲等產業巨頭紛紛秀出文心一言、盤古等自研方案——大模型順理成章成爲2023年世界人工智能大會的“主角”。


7月5日,2023WAIC世界人工智能大會九大“鎮館之寶”揭曉,其中與大模型相關的就佔據了“半壁江山”,此外還有30余款來自不同企業的大模型產品和技術悉數亮相,展示着大模型在千行百業的多元化應用。

商湯大模型能“說”善“畫”

“假設你是一名記者,請寫一篇關於本屆人工智能大會的報道。”


“今天有幸來參加在上海舉辦的2023世界人工智能大會,這場盛會匯集了來自全球各地的科學家、企業家、政策制定者,共同探討AI技術如何改變人們的未來……”這是《IT時報》記者探營時,與商湯自研的中文語言大模型——SenseChat之間的一段對話。

商湯現場工作人員介紹,本屆WAIC上商湯展出的SenseChat商量2.0最新版本,是基於“商湯日日新SenseNova”大模型體系下开發的千億級參數語言大模型。在知識准確性、上下文理解能力、邏輯判斷能力、創作能力等方面都有大幅度提升,甚至在一些細分指標上已經超過GPT3.5,是目前表現最好的中國語言大模型之一。其同時支持簡體中文、繁體中文、英文等多種語言交互,滿足不同人群、不同場景的對話需求。


訓練方面,商湯一方面利用大量企業垂直領域的數據進行訓練,增加SenseChat商量知識的深度和廣度;另一方面還上线了外接數據庫的功能,使用時只需要將SenseChat商量與企業自己的數據庫進行連接,便能自動檢索和學習數據庫裏的知識,從而保證問答數據的准確性。


不僅如此,商湯展台內還展示了一幅攤开的巨型卷軸,畫着一只穿着潮流、戴着墨鏡的酷炫小熊,這是本屆WAIC商湯帶來的另一款大模型——AI繪畫大模型秒畫SenseMirage。


現場工作人員介紹,秒畫SenseMirage 3.0的自研生成大模型參數已經提升至70億量級,不僅能實現更清晰、更精致的細節刻畫,生成速度也是秒級的。同時,在商湯的大語言模型的加持下,秒畫SenseMirage能夠更加准確地理解用戶表述,只需輸入幾個簡單的關鍵詞匯,便能自動生成畫作。例如輸入潮流、卡通、熊、墨鏡等詞語,就能繪畫出上文描述的炫酷小熊。

文心一格讓人人都能“P圖”

說到AI繪畫大模型,不得不提的還有百度的文心一格。作爲本屆WAIC的“鎮館之寶”之一,文心一格與文心一言遙相呼應,經歷了一年的迭代和更新,在質量與操作方面都有巨大進步。百度工作人員告訴《IT時報》記者,在畫面質量上,文心一格經過3D渲染等步驟已經可以生成接近實景的圖片,無論是人物面部表情,還是毛發等小細節,都能清晰准確進行刻畫。


“P圖”曾經是一項頗具門檻的圖片修改美化技術,如今百度文心一格上线的塗抹功能,利用人工智能AI編輯功能,獲取整幅畫作的編輯信息後,對塗抹區域的內容進行與原畫風格一致的補全編輯,並對補全畫作連接處進行平滑處理,最終生成用戶滿意的理想畫作,讓人人都可以輕松掌握“P圖”的技能。


值得一提的是,文心一格還推出首創性的圖片風格疊加功能,使用時只需要上傳兩張不同風格的圖片,通過調整參數或者輸入文字要求,便能自動融合成一張圖片,從而激發創作者靈感。


目前,文心一格注冊用戶超過600萬,廣告營銷、內容制作、遊戲原畫等多個場景都有應用,用戶通過微信小程序就能快速接入。

“式說”大模型重構企業級軟件

生成圖片、生成文案、生成攻略,在激烈的大模型賽道,第四範式走出了一條與衆不同的道路,即將大模型技術聚焦企業軟件領域,用生成式AI重構企業軟件。因此,聚焦to B的多模態大模型產品“式說”應運而生。

第四範式現場工作人員向記者解釋,“式說”不僅擁有輸入輸出多模態、知識庫、Copilot(微軟AI助手)、思維鏈等核心技術,同時具備內容可信、成本可控、數據安全等企業級優勢。首先,“式說”保證企業能私有化部署大模型,所需算力成本相對可控;其次,“式說”生成的內容更加准確、可靠,並且在信息輸出時定位原始出處,實現所有信息都“有據可查”;最後,在使用過程中,“式說”能做到知錯能改,不斷學習來更好地服務企業。


例如,一家零售門店的管理涉及員工管理、貨品採購、庫存控制、銷售增長、處理客訴等多個環節,這些都需要在不同的系統上完成;而門店店長在管理時,就需要從各個系統中獲取數據並進行篩選,甚至一些重要數據還需要找到專門數據團隊才能獲取,費時費力。


若是使用“式說”大模型後,零售門店店長可以直接通過對話形式,比如提問“查看商品銷量、值班人員狀態、違規操作”等關鍵語句,“式說”就能從不同系統中調用相關信息,讓日常散落在多個系統的管理工作在一個對話框上直接完成,管理將因此變得更加便捷。


在司法領域,司法人員不僅要掌握相關領域的法律法規、司法解釋,還要將法律知識靈活運用在法律分析、法律檢索、法律寫作、法律論證等具體實踐上。基於“式說”生成式AI打造的司法小助手,能在繁多的法律文件中快速定位並檢索資料,還可以進行相應的法律文書書寫、校對工作。此外,針對常見案件、速裁案件,可以協助提取審判的關鍵要素等,讓司法人員的工作更高效。


據悉,自“式說”發布以來,已經在金融、零售、醫療、物流、運營商、房地產等多個領域的上百家企業落地,積累了數十類國內最早的AIGC產業應用,成爲行業中不同崗位的得力助手。

華爲昇騰AI孵化原生大模型

去年WAIC,華爲昇騰AI帶着全球首個三模態模型“紫東太初”亮相,成爲“鎮館之寶”之一。今年,華爲昇騰AI再次憑借“大模型超級工廠”奪得“鎮館之寶”一席之位。與去年不同的是,“大模型超級工廠”並不是單一的大模型,而是在數據&模型准備、算力准備&模型訓練、模型部署上线&集成等階段全流程使能大模型的开發與應用創新。

華爲現場工作人員告訴《IT時報》記者,昇騰已原生孵化和適配30多個大模型,成爲 AI 大模型創新首選,其中,國內原生大模型有一半基於昇騰AI孵化。


爲了能更好地展現昇騰AI在大模型开發與應用創新的作用,華爲展台分別從軟件和硬件兩方面進行展示。硬件方面,大模型對算力需求的增長速度遠遠高於硬件算力的增長速度,因此,新建大模型就需要有一個AI集群,才可以滿足大模型的訓練需求。但AI集群建設又面臨着算力規模、液冷、跨域協同和可靠性4大關鍵技術挑战,Atlas 900 PoD A2集群基礎單元應運而生。


這台“大家夥”擁有黑色的金屬外殼,長方形的體型,看起來平平無奇,實際卻暗藏玄機。現場工作人員介紹,Atlas 900 PoD A2在算力規模上支持萬卡集群,這就意味着即便是GPT-4級別的算力需求也能很好適配;其次,Atlas 900 PoD A2採用液冷、互聯、供電三總线設計,交付周期由兩周縮短爲3天。數據顯示,Atlas 900 PoD A2的PUE(數據中心能源效率指標)值低於1.15,在綠色減排上表現出色。

軟件同樣也是訓練大模型的關鍵環節,“大模型超級工廠”設立了可診斷、可衡量、可恢復的多級可靠機制,若是其中某一節點發生故障,系統會第一時間記錄下來,同時將故障節點隔離,並調動其他節點資源繼續訓練,以此來保證訓練的穩定性。


“相比業界其他集群,我們能實現10倍級提升集群系統的穩定性。”華爲現場工作人員說。

排版/ 季嘉穎

圖片/ IT時報


追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:30多款大模型同台競技!在WAIC2023看盡國內AI主流大模型

地址:https://www.breakthing.com/post/75353.html