30多款大模型同台競技！在WAIC2023...

相關報導

IT時報

30多款大模型同台競技！在WAIC2023看盡國內AI主流大模型

1年前

30多款大模型同台競技！在WAIC2023看盡國內AI主流大模型

探營2023世界人工智能大會，什么值得看

作者／ IT時報記者沈毅斌

編輯／王昕 孫妍

2022年的世界人工智能大會，帶領觀衆走進虛擬與現實相結合的世界——元宇宙。今年，ChatGPT火熱得發燙，國內的百度、華爲等產業巨頭紛紛秀出文心一言、盤古等自研方案——大模型順理成章成爲2023年世界人工智能大會的“主角”。

7月5日，2023WAIC世界人工智能大會九大“鎮館之寶”揭曉，其中與大模型相關的就佔據了“半壁江山”，此外還有30余款來自不同企業的大模型產品和技術悉數亮相，展示着大模型在千行百業的多元化應用。

商湯大模型能“說”善“畫”

“假設你是一名記者，請寫一篇關於本屆人工智能大會的報道。”

“今天有幸來參加在上海舉辦的2023世界人工智能大會，這場盛會匯集了來自全球各地的科學家、企業家、政策制定者，共同探討AI技術如何改變人們的未來……”這是《IT時報》記者探營時，與商湯自研的中文語言大模型——SenseChat之間的一段對話。

商湯現場工作人員介紹，本屆WAIC上商湯展出的SenseChat商量2.0最新版本，是基於“商湯日日新SenseNova”大模型體系下开發的千億級參數語言大模型。在知識准確性、上下文理解能力、邏輯判斷能力、創作能力等方面都有大幅度提升，甚至在一些細分指標上已經超過GPT3.5，是目前表現最好的中國語言大模型之一。其同時支持簡體中文、繁體中文、英文等多種語言交互，滿足不同人群、不同場景的對話需求。

訓練方面，商湯一方面利用大量企業垂直領域的數據進行訓練，增加SenseChat商量知識的深度和廣度；另一方面還上线了外接數據庫的功能，使用時只需要將SenseChat商量與企業自己的數據庫進行連接，便能自動檢索和學習數據庫裏的知識，從而保證問答數據的准確性。

不僅如此，商湯展台內還展示了一幅攤开的巨型卷軸，畫着一只穿着潮流、戴着墨鏡的酷炫小熊，這是本屆WAIC商湯帶來的另一款大模型——AI繪畫大模型秒畫SenseMirage。

現場工作人員介紹，秒畫SenseMirage 3.0的自研生成大模型參數已經提升至70億量級，不僅能實現更清晰、更精致的細節刻畫，生成速度也是秒級的。同時，在商湯的大語言模型的加持下，秒畫SenseMirage能夠更加准確地理解用戶表述，只需輸入幾個簡單的關鍵詞匯，便能自動生成畫作。例如輸入潮流、卡通、熊、墨鏡等詞語，就能繪畫出上文描述的炫酷小熊。

文心一格讓人人都能“P圖”

說到AI繪畫大模型，不得不提的還有百度的文心一格。作爲本屆WAIC的“鎮館之寶”之一，文心一格與文心一言遙相呼應，經歷了一年的迭代和更新，在質量與操作方面都有巨大進步。百度工作人員告訴《IT時報》記者，在畫面質量上，文心一格經過3D渲染等步驟已經可以生成接近實景的圖片，無論是人物面部表情，還是毛發等小細節，都能清晰准確進行刻畫。

“P圖”曾經是一項頗具門檻的圖片修改美化技術，如今百度文心一格上线的塗抹功能，利用人工智能AI編輯功能，獲取整幅畫作的編輯信息後，對塗抹區域的內容進行與原畫風格一致的補全編輯，並對補全畫作連接處進行平滑處理，最終生成用戶滿意的理想畫作，讓人人都可以輕松掌握“P圖”的技能。

值得一提的是，文心一格還推出首創性的圖片風格疊加功能，使用時只需要上傳兩張不同風格的圖片，通過調整參數或者輸入文字要求，便能自動融合成一張圖片，從而激發創作者靈感。

目前，文心一格注冊用戶超過600萬，廣告營銷、內容制作、遊戲原畫等多個場景都有應用，用戶通過微信小程序就能快速接入。

“式說”大模型重構企業級軟件

生成圖片、生成文案、生成攻略，在激烈的大模型賽道，第四範式走出了一條與衆不同的道路，即將大模型技術聚焦企業軟件領域，用生成式AI重構企業軟件。因此，聚焦to B的多模態大模型產品“式說”應運而生。

第四範式現場工作人員向記者解釋，“式說”不僅擁有輸入輸出多模態、知識庫、Copilot（微軟AI助手）、思維鏈等核心技術，同時具備內容可信、成本可控、數據安全等企業級優勢。首先，“式說”保證企業能私有化部署大模型，所需算力成本相對可控；其次，“式說”生成的內容更加准確、可靠，並且在信息輸出時定位原始出處，實現所有信息都“有據可查”；最後，在使用過程中，“式說”能做到知錯能改，不斷學習來更好地服務企業。

例如，一家零售門店的管理涉及員工管理、貨品採購、庫存控制、銷售增長、處理客訴等多個環節，這些都需要在不同的系統上完成；而門店店長在管理時，就需要從各個系統中獲取數據並進行篩選，甚至一些重要數據還需要找到專門數據團隊才能獲取，費時費力。

若是使用“式說”大模型後，零售門店店長可以直接通過對話形式，比如提問“查看商品銷量、值班人員狀態、違規操作”等關鍵語句，“式說”就能從不同系統中調用相關信息，讓日常散落在多個系統的管理工作在一個對話框上直接完成，管理將因此變得更加便捷。

在司法領域，司法人員不僅要掌握相關領域的法律法規、司法解釋，還要將法律知識靈活運用在法律分析、法律檢索、法律寫作、法律論證等具體實踐上。基於“式說”生成式AI打造的司法小助手，能在繁多的法律文件中快速定位並檢索資料，還可以進行相應的法律文書書寫、校對工作。此外，針對常見案件、速裁案件，可以協助提取審判的關鍵要素等，讓司法人員的工作更高效。

據悉，自“式說”發布以來，已經在金融、零售、醫療、物流、運營商、房地產等多個領域的上百家企業落地，積累了數十類國內最早的AIGC產業應用，成爲行業中不同崗位的得力助手。

華爲昇騰AI孵化原生大模型

去年WAIC，華爲昇騰AI帶着全球首個三模態模型“紫東太初”亮相，成爲“鎮館之寶”之一。今年，華爲昇騰AI再次憑借“大模型超級工廠”奪得“鎮館之寶”一席之位。與去年不同的是，“大模型超級工廠”並不是單一的大模型，而是在數據＆模型准備、算力准備＆模型訓練、模型部署上线＆集成等階段全流程使能大模型的开發與應用創新。

華爲現場工作人員告訴《IT時報》記者，昇騰已原生孵化和適配30多個大模型，成爲 AI 大模型創新首選，其中，國內原生大模型有一半基於昇騰AI孵化。

爲了能更好地展現昇騰AI在大模型开發與應用創新的作用，華爲展台分別從軟件和硬件兩方面進行展示。硬件方面，大模型對算力需求的增長速度遠遠高於硬件算力的增長速度，因此，新建大模型就需要有一個AI集群，才可以滿足大模型的訓練需求。但AI集群建設又面臨着算力規模、液冷、跨域協同和可靠性4大關鍵技術挑战，Atlas 900 PoD A2集群基礎單元應運而生。

這台“大家夥”擁有黑色的金屬外殼，長方形的體型，看起來平平無奇，實際卻暗藏玄機。現場工作人員介紹，Atlas 900 PoD A2在算力規模上支持萬卡集群，這就意味着即便是GPT-4級別的算力需求也能很好適配；其次，Atlas 900 PoD A2採用液冷、互聯、供電三總线設計，交付周期由兩周縮短爲3天。數據顯示，Atlas 900 PoD A2的PUE（數據中心能源效率指標）值低於1.15，在綠色減排上表現出色。