智源研究院院长:今年人工智能应用或迎大爆发,多模态是关键,王仲远谈具身智能:人形机器人前景与人工智能爆发之年

2025中关村论坛年会期间,北京智源人工智能研究院院长王仲远接受媒体采访展开。王仲远就具身智能与人形机器人的关系、人工智能应用发展趋势等问题发表了自己的看法,为我们揭示了相关领域的发展前景和面临的挑战。

红星资本局3月29日消息,在热闹非凡的2025中关村论坛年会期间,北京智源人工智能研究院(以下简称为“智源研究院”)院长王仲远,欣然接受了包括红星资本局在内的众多媒体的采访。

在采访过程中,当被红星资本局问到相关问题时,王仲远条理清晰地表示,各种不同构型的机器人都能够接入具身智能。具身智能并非是专门为人形机器人设计的一种智能。从长远的发展角度来看,人形机器人具有一定的优势,不过在短期内,其在产业落地方面仍然存在诸多难点。

他还信心满满地认为,今年人工智能应用预计将会出现大规模的爆发,尤其是在大语言模型的落地应用方面,有着极大的产业爆发可能性。同时,他着重强调,多模态是大模型必不可少的能力。

智源研究院院长:今年人工智能应用或迎大爆发,多模态是关键,王仲远谈具身智能:人形机器人前景与人工智能爆发之年

王仲远 主办方供图

具身智能并非“绑定”人形机器人

单臂、双臂等不同构型的机器人均可接入具身智能。尽管当下人形机器人的赛道异常火热,但也有一些观点指出,大部分工作实际上并不一定非要用到“人形机器人”这种构型。那么,该如何理解人形机器人发展的必要性呢?

“在某种程度上,我是赞同这个观点的。”王仲远在回答红星资本局的提问时如此说道。他还提到,目前行业里有不少机器人公司,已经开始对轮式构型的机器人进行迭代升级。这是因为轮式构型能够极大地避免双足机器人本身由于不稳定而带来的能力局限。

“我们觉得,从长远来看,人形机器人肯定是有它独特的优势的。”王仲远进一步解释道,“因为我们人类是双足行走的,这本身就是大自然选择的结果,而且整个社会的基础设施也是依据人类的这种构型来建设的。”

王仲远认为,“类人”这种构型能够更好地适应社会的基础设施,同时还能从海量的互联网数据中更好地学习人类技能。所以,从长期发展的角度来看,人形机器人无疑是一个正确的发展方向,有利于具身智能或者具身大脑模型的迭代更新。

“然而,从短期来看,我们更关注产业落地的情况。不得不说,人形机器人在产业落地方面确实还面临着很多困难。现在很多的机器人仅仅处于‘能走’的阶段,正努力从‘能走’朝着‘走得快’‘走得稳’的阶段发展。”

王仲远再次强调,单臂、双臂等各种构型的机器人都可以接入具身智能,具身智能并不是专门为人形机器人设计的智能。

今年人工智能应用预计会出现大爆发

多模态是大模型必备能力。外界有一些投资人表示不太看好具身智能产业。但站在研究机构的角度,王仲远对具身智能的长期发展持有非常乐观的态度。他形象地举例说:“就好像10年前我们看待无人驾驶技术一样,具身智能一定会进入应用落地的阶段。”

王仲远明确指出,今年在人工智能的应用方面预计会出现大规模的爆发。“特别是中国拥有海量的应用场景,当基础模型的能力达到可用的标准时,就能迅速实现落地应用。”他特别提及了大语言模型的落地应用,认为其存在着非常大的产业爆发可能性。

“但我也多次强调过,仅仅依靠大语言模型是远远不够的。在真实的行业环境中,数据并非简单的文本形式,所以‘多模态’是大模型必须具备的一种能力。”

王仲远还介绍说,目前的多模态大模型,特别是多模态理解大模型还处于相对早期的发展阶段。2024年,智源研究院发布了全球首个原生多模态大模型Emu3,该模型能够将文本、图像、视频从一开始就进行原生统一的训练。他认为这样的统一原生多模态大模型有望助力大模型在各行各业更好地落地应用。

此外,王仲远还提到,外界认为现在的模型,尤其是基础模型的性能提升相对缓慢,一个很重要的原因就是在数据、算力方面遇到了瓶颈。他强调,整个大模型的技术还远远没有发展到尽头,算力依然处于紧缺的状态。

本文围绕北京智源人工智能研究院院长王仲远在2025中关村论坛年会期间的采访内容,阐述了具身智能与人形机器人的关系,指出具身智能并非仅适用于人形机器人,人形机器人长期有优势但短期产业落地有困难。同时,王仲远预计今年人工智能应用会大爆发,强调多模态是大模型必备能力,还提及多模态大模型发展阶段及模型性能提升遇数据、算力瓶颈等问题。

原创文章,作者:Serene,如若转载,请注明出处:https://www.qihaozhang.com/archives/7956.html

(0)
SereneSerene
上一篇 2025年3月29日
下一篇 2025年3月29日

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注