大模型的“火”烧到了人形机器人身上

小夏 科技 更新 2024-02-03

视觉中国。

文本:了解金融和经济学。

如果大模型是雷神之锤,那么适合它的钉子在哪里? 在过去的一年里,每个人都在拼命寻找这个问题的答案。 人形机器人是所有科技公司中为数不多的共识之一。

近日,据外媒报道,Microsoft和OpenAI正在洽谈参与人形机器人公司FIGURE的新一轮融资,本轮融资金额可能高达5亿美元。

这是OpenAI投资的第二家人形机器人公司。 这不是一个孤立的案例。 几乎所有设计大型模型的人和公司都对人形机器人有着强烈的热情,并投入了研究资源。 从英伟达到谷歌,从亚马逊到Meta,甚至马斯克。

作为一项经历了几经风雨的高科技技术,市场对人形机器人的热情已经完全被AI大模型“点燃”。 正如许多人所期望的那样,人形机器人是通过AGI(通用人工智能)通往生成式AI道路上不可或缺的重要硬件载体。

人形机器人正在重新回到人们熟悉的聚光灯下。

这笔投资并不是OpenAI第一次投资人形机器人公司。 去年3月,来自挪威的人形机器人初创公司1X Technologies(简称:1X)获得由OpenAI Ventures**领投的2350万美元融资,成为OpenAI投资的首家硬件公司。

OpenAI的创业公司**全称是“OpenAI创业基金”,投资方向更侧重于率先实现AI技术落地的方向。 这也是OpenAI投资1X的重要逻辑。 OpenAI的一位高管曾公开表示,“投资1X的时机是其机器人硬件已经成熟,可以在AI的加持下打开更广阔的劳动力市场。 ”

现在,机器人轨道又被加了,说明OpenAI对人形机器人轨道高度看好。 作为人形机器人领域的领先创业公司,1X和Figure都推出了人形机器人产品。

其中,1X有两款机器人产品,工作机器人EVE和国产双足机器人NEO,正在开发中。 Figure去年还发布了首款通用人形机器人Figure 01,现在Figure已经与宝马达成协议,在汽车制造领域部署“通用人形机器人”。

事实上,OpenAI对人形机器人的热情由来已久,比大家想象的还要高,甚至OpenAI也曾在内部成立机器人部门。

早在 2017 年,OpenAI 的机器人团队就发布了 RoboSchool,这是一款用于模拟机器人控制的开源软件。 2018年,团队研发的机械臂已经能够自由地“盘核桃”,即灵活地玩弄木块。 当然,OpenAI机器人团队最有名的研究还是它研发的机械手,可以单手扭转魔方。 ‍

当然,OpenAI并不是唯一一家对人形机器人情有独钟的大型模型公司。 一个有趣的现象是,几乎每家在大型模型领域有所建树的公司,都或多或少地布局了人形机器人。

以谷歌为例,去年 10 月,DeepMind 发布了 RT-X 机器人模型,并开放了训练数据集 Open X-Empodiment。 今年1月,谷歌DeepMind团队和斯坦福大学中国团队共同研发了一种通用机器人Mobile Aloha,可以炒菜和做家务。

至于马斯克,更不用说,去年7月成立了一家名为X的公司艾尔的人工智能公司,今年年底,特斯拉推出了人形机器人擎天柱,预计将于明年交付。

在AI模型落地的过程中,人形机器人扮演着什么角色,能如此受宠?

在谈论大型模型和人形机器人之间的关系之前,我们需要对什么是人形机器人有一个认知。

需要明确的是,机器人并不是一个新事物。 在人形机器人问世之前,工业机器人已经是一个超过500亿的市场,广泛应用于汽车、3C、纺织、包装等行业。

然而,工业机器人也有明显的缺点,即缺乏通用性。 传统的工业机器人不能直接使用,需要系统集成商进行集成。 机器人的系统集成不仅需要高度的定制和对客户流程的理解,而且还在很大程度上依赖于工程师的经验。 这注定了工业机器人适用于大规模、重复性的生产工作。

工业机器人与其说是机器人,不如说是自动化设备。 在这一点上,人形机器人无疑更接近我们对机器人的理解。

人形机器人,顾名思义,就是在形式上更接近人类的机器人。 然而,外在形式只是外观,其核心是机器人的智能性和多功能性。 我们之所以选择“人形”,只是因为我们所处的世界是由人体创造的,而人形可以操作所有工具,具有最广泛的适应性。

从物理维度来看,人形机器人由三个模块组成,分别是“四肢”、“小脑”和“大脑”,其中“四肢”由灵巧的手和传感器等一系列硬件组成,“小脑”负责运动控制,“大脑”主导机器人的环境感知、推理和决策以及语言交互。

大模型的出现引入了语义理解和推理生成能力,相当于改变了人形机器人的“大脑”。 大型模型对人形机器人的提升主要体现在感知能力和思维决策能力两个方面。

首先,大模型强大的拟合能力使得人形机器人在执行目标识别、避障、3D重建、语义分割等任务时能够达到更高的精度。 例如,人工智能现在可以识别障碍物,但如果路边有人举着牌子说前方的桥坏了,请绕道而行。 过去,人工智能很难理解这种情况,但基于大型模型的人形机器人有可能识别和理解这些信息。

思考和决策的能力意味着人形机器人具有良好的知识完整性,可以将一条指令分解成多个子任务和子指令,以完成不同场景下的各种任务。 假设你对一个机器人说“加热”,它知道它会去加热微波炉。

随着谷歌、英伟达等公司对大模型+机器人的深入探索,上述积极效应也得到了证实。 2022 年 12 月,谷歌发布了 RT-1 型号。 这是一个基于机器人数据的端到端模型,输入端有短图像序列和文本描述的任务,输出端有动作指令,包括7维手臂动作指令、3维基本运动指令、1维状态切换指令。

研究人员让机器人执行了700多项任务,结果显示,采用RT-1模型的机器人在以前看到的场景、以前看不见的场景、干扰的场景和背景变化场景中表现出更高的成功率。

值得一提的是,这是机器人首次通过大型、多样化、与任务无关的数据表现出泛化性,并执行了一些以前从未见过的任务。

去年 7 月,谷歌发布了 RT-2,这是一种视觉语言动作模型。 在这个模型中,谷歌将参数的数量从35m增加到55b。 研究人员以与RT-1相同的方式测试了RT-2模型。 结果表明,RT-2对未知场景的理解能力、推理能力和泛化能力均明显优于RT-1模型。

可以说,基于大模型的AI技术使人形机器人的泛化成为可能。 作为硬件载体,人形机器人也让生成式AI越来越接近AGI的目标。

虽然大模型的引入有“常识”,并带来了一定程度的泛化能力,解决了自然语言理解和任务规划两大难题,但越来越多的公司正在发布人形机器人,似乎这一切离我们越来越近了。 但我们必须清醒地意识到,人形机器人在真正落地之前还有很长的路要走。

人形机器人智能化大模型的突破是可喜的,但并没有解决机器人硬件的问题。 人形机器人的操作能力和运动能力需要借助硬件本体硬件和算法来实现,但在过去50年的人形机器人研究中,这一难度一直没有被克服。

例如,扫地机器人可以在底盘中向前滑动,四足机器狗可以依靠四肢来保持稳定和平衡,但人形机器人只有两条腿,只能依靠一条腿来保证整个身体的稳定性和平衡性。 大型模型在帮助身体运动方面的能力有限。

人形机器人公司面临的另一大挑战是数据。 人形机器人的模型训练需要有大量的决策数据支撑,如果数据不足,输出结果容易漂移,成功率也会受到影响。

目前,远程操作数据是机器人收集数据的重要方式,其操作逻辑是先学习和分解人是怎么做的,然后对应机器人想怎么做。 由于使用真实世界的数据,数据质量最高,但收集成本也很高。 例如,谷歌用于训练 RT-1 和 RT-2 的机器人数据是在 17 个月内收集的 13 个机器人。 当年,OpenAI解散了机器人团队,获取和收集的困难是一个重要原因。

这也是大型模型公司部署人形机器人的原因。 借助机器人的硬件本体,AI可以与外界信息有更多的接触,而这些数据也有反馈AI算法的可能。 例如,特斯拉的自动驾驶汽车在高速公路上积累的数据为FSD算法系统提供信息,提供了最基础的数据基础。

尽管存在这些问题,但仍然无法阻止越来越多的大型模型公司涌入人形机器人赛道。 很多人把去年称为人形机器人真正产业化的第一年。 但很少有人记得,在2016年,人形机器人热潮的浪潮,退潮了,所谓人形机器人公司寥寥无几,最终幸存下来。

当一项超乎想象的新技术开始商业化时,最初的震惊很快就会消退。 参与的公司需要接受商业法则的考验,同时推动技术成熟。 个人电脑和互联网行业经受住了这样的考验,反过来又重塑了整个世界。 人形机器人已经突破了好几次,停滞了好几次,现在随着大模型的风口,又有一批新的企业又走到了这一阶段。

相似文章

    大型号之火烧进手机领域

    正文 刘匡.AI模型从年初到年底一直很火,但似乎与普通人还有一段距离。不过,现在情况似乎有所改变,各大手机厂商都在争先恐后地将大模型放进手机中,让AI 触手可及 在很多人看来,手机厂商进入AI模式只是又一次炒作,但实际上绝非如此。公开资料显示,头部手机厂商多年前就已经开始布局AI,有的厂商甚至砸了数...

    人形机器人需要什么样的大模型?

    我们今天分享的是关于机器人行业的研究报告 人形机器人需要什么样的大模型?专题报告 奇幻电影的世界 研究报告内容摘要如下大型模型需要自主 可靠和可靠多模态感知实时准确的运行控制普遍化紧急能力机器人模型的最终目标是提高人形机器人在不同场景和任务中执行的能力。对于有限的应用场景和任务,从决策 感知和执行三...

    人形机器人 当大型模型落地时,它从机器人拿起一杯咖啡开始

    近日,来自清华大学 复旦大学等国内顶尖高校的余支队伍在上海进行了一场机器人大赛,最终来自复旦大学 国防科技大学 中科院软件研究所的支队伍脱颖而出。比赛的主题和内容设计非常有趣,一般都是一般性的比赛,需要这些团队在咖啡馆场景中竞争,参赛者不仅要 教 服务机器人如何扮演咖啡馆服务员的角色,还要应对顾客和...

    机器人行业观察:大模型视角下人形机器人的现在与未来

    报告作者 五矿分析师齐岩 工业机器人的技术虽然成熟,但不能解决泛化问题,不能满足现代制造业柔性生产的需要。我们相信,人形机器人将作为工业机器人的补充,与工业机器人一起推动制造业的智能化发展。人形机器人 只是外观,人形机器人的核心价值在于通用 智能。在未来的工厂中,工业机器人 人形机器人和体力劳动可能...

    未来,人形机器人产业将借助大模型进入发展“快车道”

    曾经在电影中看到的机器人,如今正乘着大模特的东风,离我们越来越近。特斯拉最近展示了最新版本的擎天柱机器人擎天柱II。在最新发布的 中,第二代人形机器人似乎比上一代更具灵活性,包括更优雅的行走姿势和更自由的双手,甚至可以用来完成煮鸡蛋等精细任务。除了特斯拉之外,许多技术制造商都试图将大图像语言模型的能...