國信證券:GPT4-V推動多模態應用 機器人是極佳落地場景
1年前

國信證券發布研究報告稱,隨着GPT-4V的推出,多模態將進一步擴大AI的應用範圍,機器人也是極佳的多模態AI應用場景,AI和機器人的持續融合也將進一步推動具身智能的發展,目前微軟、谷歌等巨頭均已在加大該領域投入。此外,隨着AI大模型成本下降與技術發展,AI應用產業將快速進步。建議重點關注AI應用、多模態、機器人領域相關個股,如螢石網絡(688475.SH)、寶信軟件(600845.SH)、金山辦公(688111.SH)、科大訊飛(002230.SZ)。

國信證券主要觀點如下:

多模態模型歷經多個階段的發展,性能實現飛躍,現爲AI大模型的新方向。

多模態模型綜合不同類型數據進行分析處理,擁有更高的准確性和魯棒性,更貼近人類學習模式。隨着大模型時代的到來,多模態技術迅速發展,如OpenAI的GPT系列不斷推出新版本,提升了語言生成、邏輯推理以及多模態處理能力,預計將在各領域得到廣泛應用。該系列模型不斷增強的功能和性能,標志着人工智能發展的新階段。

多模態模型的發展方向包括視覺理解、視覺生成、統一視覺、LLM支持以及多模態Agent,並從專業性向通用性改變,應用性增強。

近期研究表明,多模態大模型發展方向涵蓋了:1)視覺理解,涉及對圖像信息進行深入解釋;2)視覺生成,特別是生成符合人類意圖的圖像等內容;3)構建統一視覺模型,該方向面臨多重挑战,但在CV領域未來的應用中非常有價值;4)LLM支持的多模態大模型顯示出強大的跨模態理解能力;5)多模態Agent是當前研究的前沿方向,旨在通過將多個專家模型與LLM相結合來解決復雜的多模態理解問題。此外,多模態大模型已开始向通用方向轉變,並在文本、圖像、音視頻等多個領域展現出應用潛力,如教育、辦公、遙感、醫療和工業等領域。

機器人是多模態AI優質落地場景,商用落地有望加速。

多模態模型融合視頻、語言、文字等多方面能力,使得機器人能夠將不同感知渠道獲取的信息整合起來,形成更全面、准確的環境認知,從而更加高效地應對復雜多變的任務需求。多模態大模型的應用在機器人領域有充分的發揮空間。經過程序控制機器人、自適應機器人和智能機器人三波發展浪潮,智能人形機器人成爲發展趨勢。特斯拉打通了FSD和機器人的底層模型,Optimus採用端到端神經網絡訓練運行,實現視頻信號輸入,控制信號輸出。尤其Optimus在23年的快速迭代進步,市場對於人形機器人的產業落地預期將提前,Optimus有望成爲最快實現規模化商用的機器人。根據第三方預測,GGII預計到2026年全球人形機器人在服務機器人中的滲透率有望達到3.5%,市場規模超20億美元,到2030年全球市場規模有望突破200億美元。AI和機器人的持續融合也將進一步推動具身智能的發展,目前微軟、谷歌等巨頭均已在加大該領域投入。

風險提示:大模型技術發展不及預期;AI商業化落地不及預期等。

追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:國信證券:GPT4-V推動多模態應用 機器人是極佳落地場景

地址:https://www.breakthing.com/post/104661.html