曾经在电影中看到的机器人,如今正乘着大模特的东风,离我们越来越近。
特斯拉最近展示了最新版本的擎天柱机器人擎天柱II。 在最新发布的**中,第二代人形机器人似乎比上一代更具灵活性,包括更优雅的行走姿势和更自由的双手,甚至可以用来完成煮鸡蛋等精细任务。
除了特斯拉之外,许多技术制造商都试图将大图像语言模型的能力和知识迁移到机器人领域,例如Microsoft的ChatGPT for Robotics,谷歌的Palm-E、RT-1、RT-2,以及Voxposer和Bobocat。
那么,这是否意味着人形机器人真的会进入我们的生活呢?
人形机器人很漂亮,但离商业化还很远
在擎天柱第二代机器人发布后,特斯拉表示,第二代擎天柱机器人在保留原有功能的同时,重量减轻了10公斤,机器人具有更好的平衡性,例如能够自由下蹲和站立,行走时的速度提高了30%。
擎天柱最大的升级是双手,它有11个自由度,可以更细腻地移动物体,比如**显示,机器人可以拿起鸡蛋轻轻放下,这要归功于传感技术的改进。 全新擎天柱的发布标志着特斯拉更接近于创造一个“通用的、双足的、自主的人形机器人”。 特斯拉的目标是能够为人形机器人执行危险、重复和乏味的任务。
马斯克早在2024年就表示,“未来,每个人都会拥有人形机器人,这个市场将是数百亿美元。 ”
但实现这一目标可能需要很多年。 特斯拉预计Optimus机器人的商业版本将在未来三到五年内上市,但早期版本可能会首先在生产线上进行测试。
我们需要了解的是,人形机器人具有复杂的软硬件结构,是智能机器人领域技术难度极高的一个分支。 其中,软硬件系统的结合和通信的实时可靠性是保证人形机器人鲁棒运动的基础。 此外,动态稳定的运动控制也是人形机器人面临的一大挑战。
除了技术难度,成本一直是人形机器人难以商业化的重要原因之一。 例如,虽然Potuton Power的Atlas机器人已经可以规划自己的路径,并实现后空翻和跑酷等高难度动作,但它是以大量强大的液压驱动器为代价的,因此制造成本仍然很高,估计为200万美元。
然而,尽管面临巨大挑战,我们仍然很高兴看到机器人行业的发展,随着ChatGPT的爆发,科技巨头们不断加强其生成式AI产品,这可能会将机器人行业带到一个新的水平。
被大型模型点燃的具身智能
长期以来,人类对人工智能技术和应用的探索从未停止,今年,以ChatGPT为代表的生成式AI风靡全球,深刻影响了内容创作行业,带来了效率的大幅提升。
但人工智能的应用远不止于此,虽然生成式AI让类人大脑变得越来越智能,但它始终是抽象的,如果具体化,比如增加一个机器人身体,它能不能成为一个具身的智能机器人。
具身人工智能也被认为是人工智能的终极形式。 他们用自己的身体来感知,通过与环境的互动,他们获取信息、理解问题、做出决定并采取行动。 一般来说,可以理解为AI模型被机器人的外壳覆盖,机器人生长AI模型的大脑。
图灵奖得主、上海智慧研究院院长姚志志认为,人工智能领域的下一个挑战将是实现“具身通用人工智能”,即如何打造能够通过自我习掌握各种技能的高端机器人,并在现实生活中执行各种通用任务。 清华大学计算机科学系教授张波院士也在一次工业智能论坛上提出,随着基础模型的突破,通用智能机器人是未来的发展方向。
英伟达创始人黄仁勋在ITF World 2023半导体大会上表示,具身智能是一种能够理解、推理、与物理世界交互的智能系统,是人工智能的下一波浪潮。
在Microsoft研究院发布的《ChatGPT for Robotics》一文中,研究人员利用ChatGPT大语言模型(LLMs)将人类语言快速转化为机器人的高级控制**,从而控制机械臂、无人机等机器人,ChatGPT带来了机器人应用的新范式。
目前,已经可以在ChatGPT的对话框中输入命令,控制机器人在房间里找到“健康饮料”、“含糖和危险信号的东西”,以及无人机的镜子**。
谷歌和德国柏林工业大学的一组人工智能研究人员宣布了视觉语言模型PALM-E,该模型集成了5400亿个参数的PALM模型和220亿个参数的视觉VIT模型,总参数量为5620亿,是目前已知最大的视觉语言模型。
该模型在多任务处理中表现出强烈的感知能力,机器人可以在被问到时从抽屉里拿出东西,然后走到人身边递给人,研究人员要求机器人推动“旁边的绿色补丁”,即使机器人以前没有见过装饰品。
对于国内外科技公司不断布局机器人产业,但更多的是行业巨头,对于这样的表现,一位分析师朋友告诉元宇宙新声音:“科技巨头有资金、有实力、有技术,虽然细分**链市场不一定由巨头主导,但整体来看, 人形机器人市场可能成为科技巨头的游戏。 ”
虽然巨头们已经开始布局具身智能,但元宇宙的新声音认为,LLM方兴未艾,仅从一般智能理论上可行,如何实现还有很长的路要走。 从这个角度来看,被大模型火起来的具身智能,目前还处于语言和视觉两大经典AI任务的阶段,未来还有很大的拓展空间。
促进国内机器人产业发展的政策
机器人一直被誉为“制造业皇冠顶端的明珠”,是衡量一个国家科技创新和高端制造水平的重要标志,随着人工智能的发展,我国也在政策、市场等方向推动机器人产业升级。
11月初,工信部印发《关于人形机器人创新发展的指导意见》,提出到2024年,人形机器人创新体系初步建立,突破“脑、脑、四肢”等多项关键技术,确保核心零部件安全有效供应。 整机产品达到国际先进水平,并已实现量产,并在特种、制造、民生服务等场景得到示范应用。
从地方**来看,北京已经开始建立产业集群。 11月2日,北京率先成立国内首个省级人形机器人创新中心。 该中心由机器人整机、核心部件、大模型等企业共同组建,开展通用人形机器人本体原型、人形机器人通用大模型、运行控制系统、工具链、开源操作系统、开发者社区等五大重点任务。
除了北京,上海、深圳等地也发布了类似的行动计划,都包括开发人形机器人。 例如,深圳提出开展通用具身智能机器人的研发和应用,加快建立人形机器人制造创新中心上海提出建设国际化算法创新基地,加快人形机器人创新发展。
在政策的推动下,国内各大厂商也在不断努力创新产品和技术。 早在 2022 年 8 月,小米甚至率先在特斯拉推出了其首款全尺寸人形仿生机器人 CyberOne。 目前,CyberOne除了出现在科技主题的展会上外,还在电影拍摄、特效制作、场景修复等方面发挥着重要作用。 据了解,小米集团已经与《流浪地球3》达成战略合作,或许CyberOne将出现在这部电影的第一面镜子中。
科大讯飞是继小米之后又一家自主研发的人形机器人制造商,在10月24日的科大讯飞开发者节上,公司董事长刘庆峰正式向公众推出了人形机器人产品。 据介绍,该机器人是与宇树科技联合研发的,科大讯飞将以人形机器人为牵引力,推动“视觉-语言-行动”多模态具身智能模型。
与科大讯飞同日,首亮一流机器人产品,以及造车新势力小鹏汽车。 何小鹏在“1024科技日”上介绍,过去五年,小鹏主要探索四足“机器马”,而这一次只用了5个月就完成了双足人形机器人PX5的稳定行走。 PX5 目前只有 1 个5米高,小鹏希望未来能做出更高的机器人,并将XNGP、XEEA电子电气架构、XGPT灵犀大模型、XNET20 智能驾驶系统等与智能汽车同源的技术,快速植入机器人系统。
对于我国而言,机器人产业作为蓬勃发展的新兴生产力,核心技术创新、人工智能、高端制造等加速发展,同时也推动“机器人+”场景不断深化,面向未来,机器人产业的创新发展,将加快建设制造强国、数字中国,为推进中国式现代化提供更加有力的支撑。
写在最后
我们看到,2023 年是世界上第一个人形机器人诞生 50 周年,在此期间,不断有探路者失败或挣扎着在这个行业中找到自己的案例。 元宇宙新声音认为,今年出现的新一轮人形机器人研发热潮,有望在政策支持和市场推动下实现技术突破和规模效应,为未来人形机器人的商业化奠定基础。
可想而知,人与机器人的融合将是一个具有历史意义的过程,对整个社会产生深远的影响。 在这个过程中,我们不仅要考虑技术的发展,还要对机器人与人类之间的伦理道德问题进行深入研究,并在两者之间找到平衡点,从而确保机器人融入人的过程符合社会发展的需要,创造一个更加和谐、 稳定和美好的未来。