多模态大型模型落地机器人行业 国内多家企业实现技术突破

小夏 科技 更新 2024-01-31

近期,国内多家企业在“大模型+机器人”方面实现了技术突破。

业内人士认为,随着技术的不断进步和应用场景的拓展,对多模态大模型和机器人的需求将不断增加,为企业提供广阔的市场空间。 此外,与其他行业的合作也将为多模态大模型和机器人的发展带来新的机遇,如与医疗、制造等行业的合作,可以实现更广泛的应用场景和商业价值。

多模态机器人实现技术突破。

截至12月13日**,布科股份、埃福特、绿谐波等多只机器人概念股涨超4%。 新闻方面,特斯拉发布了擎天柱第二代(擎天柱)人形机器人**,搭载了特斯拉设计的执行器和传感器,行走速度提升30%,改善平衡和全身控制。

“多模态”AI是指可以处理文本、音频、图像等多种形式内容的大型模型。 随着多模态大模型的快速迭代,国际厂商不断关注其在机器人领域的应用,纷纷探索机器人规划、控制、导航等主要任务。

智山投资总经理何立告诉记者:“多模态大模型融合了视觉、语音和传感器数据处理技术,极大地丰富了机器人的认知和决策水平。 该技术在机器人上的应用有望在复杂交互、自然语言理解和环境适应领域取得重大进展,并激发它们作为高度自主助手或劳动者的无限可能性。 ”

国内已经有企业在这一领域处于领先地位。 12月12日晚,欧比中光发布大型模型机械臂10 产品,可以使用语音提示作为输入,利用多种大模型的理解能力和视觉感知能力生成空间语义信息,使机械臂能够理解并执行动作。 在其同步披露中,机械臂成功完成了一系列语音命令,包括“将绿色方块放入黄色方框”和“请恢复原始状态”。

欧比中光联合创始人兼CTO肖振忠告诉记者:“公司希望通过工程研究,让大模型机械臂落地到实际场景中,包括提高机械臂自动绕过复杂障碍物完成第一类指令的能力,解决大模型+机械臂的泛化问题, 并最终实现通用场景落地。 ”

据不完全统计,迅雷达、亿嘉禾等上市公司近期披露了基于多模态大模型的机器人研发进展。

大规模商业采用仍需要时间。

我国机器人产业具有一定的产业基础。 具有聪明头脑和更灵活肢体的模态机器人正在成为多方竞争未来行业的新赛道。

何力认为,在国内市场,公司积极投入关键技术环节的研发和生产,特别是在传感器、精密机械部件、执行器、创新材料和轻量化结构件等领域,呈现出蓬勃的发展势头。

谐波减速器是工业机器人的核心部件。 绿谐披露已完成工业机器人谐波减速器技术研发并较早实现规模化生产,在该领域率先替代进口产品,大大降低了国内机器人企业的采购成本和采购周期。 其推出的新一代Y系列谐波减速机,通过数学模型创新、轴承设计和加工工艺优化,使其刚度指数较现有其他产品翻了一番。

不过,有业内人士认为,“多模态+机器人”仍处于发展阶段,实现商业化仍面临诸多挑战。

首先,技术成熟度低,存在技术瓶颈。 例如,模型的可解释性、稳定性和安全性需要进一步提高其次,大型模型和机器人的研发和生产成本较高,维护和运营成本相对较高,需要大量的人力和物力。 郭涛说。

肖振中对此表示赞同,他告诉记者:“大语言模型(LLM)结合视觉感知,将让各类机器人和机械臂落地在更多场景中,如工业制造、柔性物流、商业服务等。 目前,大模型与实际数据的结合还存在一定的差距,大模型消耗的算力也很大,应用逐步落地需要三到五年的时间,业务成熟可能需要更长的时间。 ”

但公司坚信,这是正确的方向,前途一片光明。 肖振中表示,欧比中光正在打造机器人和AI视觉平台,通过研发多模态视觉模型和智能算法,结合机器人视觉传感器,形成自主移动定位、导航、避障的完整产品解决方案,积极迎接智能机器人时代的到来。

相似文章

    多模态大型模型落地机器人行业 国内多家企业实现技术突破

    近期,国内多家企业在 大模型 机器人 方面实现了技术突破。截至月日 布科股份 埃夫特 绿谐波等多只机器人概念股涨超 业内人士认为,随着技术的不断进步和应用场景的拓展,对多模态大模型和机器人的需求将不断增加,为企业提供了广阔的市场空间。此外,与医疗 制造等行业的合作也将为多模态大模型和机器人的发展带来...

    人形机器人 当大型模型落地时,它从机器人拿起一杯咖啡开始

    近日,来自清华大学 复旦大学等国内顶尖高校的余支队伍在上海进行了一场机器人大赛,最终来自复旦大学 国防科技大学 中科院软件研究所的支队伍脱颖而出。比赛的主题和内容设计非常有趣,一般都是一般性的比赛,需要这些团队在咖啡馆场景中竞争,参赛者不仅要 教 服务机器人如何扮演咖啡馆服务员的角色,还要应对顾客和...

    深化AIGC大模型多模态应用,AI Agent加速应用普及

    报告制作人 招商局 跟踪当前AIGC行业的发展,大模型的多模态发展进一步深化,尤其是文盛 能力的快速提升,将大大降低创作门槛,开拓C端创作的商业空间,以及游戏 影视制作等B端应用空间。在应用端,随着大模型能力的提升和大模型开发工具门槛的降低,AI智能体的构建能力有望快速下沉,这将推动AI应用的进一步...

    谷歌发布了 Gemini,一款性能优于 GPT 4 的多模态大模型!

    近日,谷歌CEO桑达尔?Pichai 和 DeepMind 首席执行官 Damith Hassabis 在谷歌官网上的一篇文章中宣布,谷歌最新的多模态大型模型 gemini版本 正式上线。该模型被称为 Gemini,不仅优于 OpenAIGPT 模型,而且还是最强大 用途最广泛的模型之一。Gemin...

    谷歌发布了 Gemini,一个性能比 GPT 4 更好的多模态大模型?

    Gemini 是 AI 领域的革命性突破,Google 发布了 Gemini 版本 有望在性能上超越 OpenAI 的 GPT 模型,成为目前功能最强大 用途最广泛的模型。Gemini 的独特之处在于它是一个多模态模型,能够同时理解和操作不同类型的信息,例如文本 图像 音频和 Gemini 使用原生...