財通證券:AGI賦能人形機器人 具身智能時代有望加速到來
1年前

財通證券發布研究報告稱,AGI是人工智能未來發展的方向,LLM和多模態推動AGI實現技術上的突破,“機器人+大模型”爲AGI走進物理世界提供了更多的可能性。隨着谷歌、OpenAI、Meta和特斯拉等科技大廠以及斯坦福等高等學府紛紛投入AGI的研究中,“機器人+大模型”將會進入發展的快車道,帶動機器人軟件和硬件系統的迭代升級,具有較好的發展前景。建議關注機器人整機領域的公司,如三花智控(002050.SZ)、拓普集團(601689.SH)等。

財通證券主要觀點如下:

AGI起於大語言模型,終於具身智能。

AGI(Artificial General Intelligence),即通用人工智能,也稱強人工智能,指的是具備與人類同等甚至超越人類的智能,能表現出正常人類所具有的所有智能行爲。AGI技術實現突破,離不开LLM大模型和多模態能力,在兩者結合下,AI具備了創造力。具身智能是邁向通用人工智能(AGI)的重要一步,國內外大廠及高等學府均开展了具身智能的相關研究,如微軟、谷歌、斯坦福、達闥機器人、智元機器人等。

人形機器人是AGI最佳載體,業界研究進展加速。

谷歌的RT-1是邁向視覺語言動作(VLA)模型的一個嘗試,通過吸收大量的真實數據,提升機器性能和泛化能力;RT-2是全球首個控制機器人的VLA模型,將視覺語言模型(VLM)與機器人操作能力結合,在泛化能力和湧現能力上均有明顯提升。GPT-4是OpenAI發布的最新GPT系列模型,是一個大規模的多模態模型,已應用在Ameca和Eureka等機器人上;

GPT-4V(ision)新增語言、圖像交互功能。Meta和CMU聯合打造出RoboAgent,突破了缺乏足夠龐大的數據集來訓練通用智能體和缺乏能夠生成此類數據的通用智能體的困境。特斯拉鏈接FSD和機器人的底層模塊,使用端到端的神經網絡,助力Optimus在任務操作方面展現出先進性。

“機器人+大模型”是邁向AGI時代的有效途徑:

人工智能大模型的語言處理能力可以被看作“大腦”,若想真正發揮通用人工智能的力量,未來的AGI需要有具身實體。LLM有助於實現任務級編程/交互,整個過程基本不需要或者僅需少量人類的介入和確認,降低了機器人的使用門檻。

多模態大模型使得機器人开始理解如何合理使用多種輸出能力來更好的完成任務。但離通用人工智能還很遙遠,仍然存在許多尚未解決的重大問題,如多模態融合、安全性、高質量訓練數據缺乏等。

風險提示:

特斯拉人形機器人量產進展不及預期;國產化替代進展不及預期;制造業景氣度恢復低於預期等。

追加內容

本文作者可以追加內容哦 !

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。



標題:財通證券:AGI賦能人形機器人 具身智能時代有望加速到來

地址:https://www.breakthing.com/post/110592.html