AI大模型驱动周期演化加速,3D视觉感知开启机会空间

小夏 科技 更新 2024-01-31

在人工智能模型的推动下,投资者和行业都在思考它带来的影响和机遇。 由于逐渐具备了“智能涌现”的能力,产业链端如何承担这些技术赋能和投资节点的选择也变得重要。

近年来,投资者的主要主题之一是人工智能。 松岭投资某村总经理张晨告诉21世纪经济报道记者,“通过对AI方向的积累和学习,我们公司形成了一种生态化的做法:在感知周期时,我们重视AI视觉、触觉、嗅觉、类脑领域的布局;现在是模型周期,未来将走向行为周期。 无论人工智能周期处于哪个发展阶段,我们都坚定看好中国产业发展。 ”

除了偏向自然语言端的ChatGPT外,Meta还将在2024年发布其图像AI大模型SAM(Segment Anything Model)。 据介绍,这是图像分割的基础模型,无需额外训练和零样本泛化即可实现区分物体和理解图像的能力。 业内人士认为,这开启了机器视觉的GPT时刻,将推动跨视觉场景的应用,如自动驾驶、安防监控等。

去年上半年(2024年),我还是有一些担忧,甚至有一种危机感:当AI如此强大,任何数据输入都能得到好的结果时,有没有可能我们就不需要3D感知行业了?广健科技创始人兼CEO朱立向记者分析,“但通过与硅谷业界的交流,我们一致得出的结论是:第一,AI对数据的依赖性很强,如果输入的数据很差,就会导致输出结果不好,所以好的传感器是很有价值的;其次,人工智能最终需要计算,成本也应该被考虑在内,在传感器和计算能力之间找到平衡点很重要。 ”

生成式AI的出现,缩短了不同AI开发周期的持续时间,也带动了产业链的演进,开拓了新的空间。

AI 驱动的演进

如果AI模型类似于执行计算的大脑,它需要足够的触角和营养来支持大脑的运行,因此围绕AI感知端发展壮大相关产业链非常重要。

天风指出,乐观地认为,3D视觉有望通过与AI更紧密的融合,实现更高效的智能感知和控制系统。 通过将深度学习、机器学习、大型语言模型等人工智能技术应用于3D视觉感知,可以实现更高效的数据处理、特征提取和模式识别。

张晨向记者分析,在他定义的AI发展的三个周期中,AI的感知周期阶段主要是通过感知外部环境,如视觉、嗅觉、大脑等,丰富具身智能所需的相关信息,核心是解决信息获取问题在模型周期中解决机器思维和决策问题的过程;行为周期可能是目前人类认知无法实现的应用。

SAM模型的出现,为基于图形和视觉的产业链应用开辟了新的空间。

SAM 模型大纲)。

目前,模型周期的发展进程正在缩短,比如多模态融合的研究,如果投资机构在2024年初不部署,未来可能就没有机会了。 由于人工智能发展如此之快,知识几乎每周都需要更新。 张晨感叹,目前AI行业已经进入模型周期,基础模型和行业模型都有不同类型,大模型应用阶段会有很多投资机会。

在这种逻辑下,一村松伶面对感知周期,很早就开始参与3D视觉领域龙头企业光建科技的投资。 在近期广建科技宣布的2亿元B轮融资中,中金资本、宜村松龄、重庆科兴等机构参与投资。

据介绍,广建科技成立于2024年,至今已完成六轮融资,成立后几乎每年都有新一轮融资,融资金额从最初的几百万元到如今的数亿元,总融资额超过5亿元。

朱莉曾是苹果3D传感项目的负责人,在探索了这一细分领域的增长空间后,选择回国创业。 他告诉记者,3D视觉传感意味着提高机器的感知能力,构建X-Y-Z空间坐标。 与2D视觉相比,3D视觉主要服务于机器算法,更准确、更安全,也具有更强的隐私性,可以为人工智能带来更好的感知能力。

大型AI模型的出现扩展了机器的原始功能。 例如,之前在设计家用扫地机器人时,通常需要植入多种分类模型才能有更好的性能,但对于一般的大模型,机器可以快速改进一个模型。 ”

因此,对于视觉传感行业来说,AI大模型的出现可以带动产品更全,进而推动AI相关软硬件的规模化应用。 SAM模型主要解决了感知层的通用性问题,使空间感知信息转化为自然语言处理的过程更加高效。 “坦率地说,对于大多数应用公司来说,自己很难构建一个大的基础模型,但通过引入这种底层能力,并将我们的数据嵌入到一些垂直应用上进行微调,我们可以带来差异化的价值。 他进一步指出。

当然,在大模型的应用方面,我们还是处于应用端的,所以我们不需要着急早点参与进来。 朱丽表示,成为大模型的应用参与者,探索新的方向是可能的,但没必要过早地在大模型本身上投入,比如微调等动作。 因为你现在正在做的事情很可能会在几个月后被 Open AI 的功能升级所抵消,所以捕捉你自己的垂直场景的核心至关重要。

感知端路线图

面对汹涌澎湃的AI浪潮,产业链厂商的技术和应用路线图也在逐步拓展。

朱莉表示,本次B轮融资的背景是,公司正处于业务快速增长的节点。 一方面,当前的业务增长需要注资来支持更大的市场份额;另一方面,通过一定的资金储备,公司可以在感知、算法、计算三个关键环节构建更深层次的壁垒。

我一直在想。 视觉感知几乎与智能化相关行业有关,选择做什么,首先要定位价值链中创造的东西。 朱莉分析,由于目前现实生活中的人工智能应用,超过85%的信息来自视觉信息。 光健的目标是通过视觉能力解决智能设备与人、空间的交互问题。

他继续表示,广建科技已经打造了“一流的库”,最终目标不是预测市场会选择哪条技术路线,而是先储备能力和产品,然后根据行业需求,帮助市场做出好的技术选择,引导市场向更有效的方式落地。 让技术真正赋能行业,赋能市场。

手机是第一个将3D视觉行业推向拐点的应用,苹果率先在iPhoneX中应用Face ID,快速降低首链成本,从而有进一步探索其他行业应用的可能。

2024年,有明显的趋势,国内多家主要手机厂商在旗舰手机中专门配备了安全芯片,在这方面,3D视觉将比2D视觉具有更大的优势,旗舰手机的成本空间相对较高,3D视觉应用将有更多的想象空间。 朱丽对记者分析道。

从量级来看,即使手机行业目前处于一定的发展瓶颈期,但依然是一个体量超过10亿台的大市场,对于第一连锁企业来说,哪怕只用在10%的手机中,也是数亿部手机的发展空间。

除了手机,支付也是生物识别场景快速增长的市场。 “面支付是我们这几年投资的方向,掌上支付将是下一个趋势。 随着行业的推动,信息安全保护相对谨慎的欧美国家也认可了这种生物识别支付方式,相比于用户可能担心人脸信息的隐私,掌上支付被认为是开放社会中最好的生物识别形式。 他继续说道。

据悉,目前光建科技已与微信支付达成深度合作,将掌刷技术推广到交通、体育、校园、零售、餐饮、办公、共享充电等场景,与刷脸支付相比,便捷性和用户体验都有所提升。

掌上支付的应用场景)。

在近几年XR行业的跌宕起伏中,苹果的Vision Pro内置了大量的光学器件,这也将是3D传感领域的一大机遇。 但即使苹果将在2024年量产其产品,但很明显,这还不是消费者可以大规模接受的应用终端。

朱莉认为,Vision Pro现阶段的重要使命是提供大量的专业开发者来构建应用生态。 因为XR行业没有杀手级应用,所以行业拐点不会很快到来。 “或许在2-3年内,业界对XR的应用趋势达成共识,同时,预计2024年左右,或许会迎来市场真正需要的XR产品。 基于这一判断,光建科技目前也在与创新产品公司合作开发新的产品解决方案,但会谨慎控制投资。

机器人和汽车是另外两个具有高增长空间和天花板的终端市场。 根据朱莉的分析,机器人市场可以带来相对较高的附加值;“我们目前将专注于服务汽车市场的2-3家国内客户,将产品打磨到足够好,然后考虑将产品销往全球。” ”

循环中的寻路

智能汽车无疑是当前视觉传感产业链的重要驱动力之一。 然而,面对不同的场景,主机厂可能会有一个快速选线和调整的过程。

朱莉向记者分析,智能汽车3D视觉感知的落地场景有两种:智能驾驶和人机交互。 目前,智能驾驶相关应用,如辅助驾驶、自动泊车等,多为激光雷达厂商,但其高成本意味着一般应用门槛高。 人机交互在汽车智能化的浪潮中也非常重要,“它类似于智能手机和功能手机的区别,无论是键盘交互还是屏幕交互,体验都非常不同。 他补充说,这部分能力可以从以往消费电子领域的积累中延伸出来,涉及汽车如何理解人给出的指令(空中交互、手势交互等),如何理解车内环境等。

例如,当一个人进入汽车时,座椅如何根据人的需求自动调整,我们已经可以提供这种解决方案。 朱丽介绍,3D视觉可以解决一定的隐私和安全问题,比如车内的疲劳监测场景,需要车内的摄像头和算法,但3D视觉不是构建图像信息,而是空间信息,“即使最坏的情况被黑客抓获,他们也不知道这些信息背后是什么样的图像。 ”

我们相信,3D视觉将是未来解决座舱内人机交互的关键技术,但我们还不会参与到车辆外部的视觉感知中,用于自动驾驶。 朱丽补充道,由于自动驾驶市场内卷严重,找到能够实现商业闭环的切入点很重要,不计成本也不能内卷同时,随着大车型的兴起,自动驾驶未来的发展路线将存在诸多变数,之前的架构设计很可能会发生重大变化,因此目前需要谨慎。

据介绍,2024年3月,广建科技开始与国内新车企业联合开发座舱3D视觉解决方案,此前已交付基于软件的视觉感知系统。 “2024年,我们获得了TS16949(质量体系要求)资质,2024年,我们可以提供软硬件集成解决方案。 他指出。

光建科技车规级3D摄像头)。

从产业发展来看,3D视觉传感是早期由美国和日本厂商开发并成熟的,现在我国产业链企业存在相对分散的局面。

张晨向记者分析,让AI了解物理世界是什么样的,是3D传感产业链的主要优势,也是为机器提供关于物理世界的深度信息的关键环节。 “我们觉得机器视觉经历了多轮经济周期变化,目前欧美日等市场在各自细分领域都找到了发展规律,优势明显。 在这个方向上,从技术到产品打磨和量产,都需要积累、迭代、收获反馈。 机器视觉在中国的发展,尤其是3D视觉,也要经过这些过程才能找到规律。 ”

消费电子行业的特点是迭代速度快、周期短,但其爆发力却惊人。 因此,创业团队必须具备敏锐的商业嗅觉,了解技术演进的趋势。 这也是我们有兴趣投资广建科技的原因。 他说。

据悉,广建科技预计将于2024年第四季度开始实现盈利。 “3D视觉将是未来人工智能进入人类生活的重要桥梁。 朱立总结道,目前人工智能在生活中的渗透率越来越高,在需要人机交互的环节上将有广阔的发展空间。

相似文章

    AI大模型带动,定制化芯片风潮逐渐升温

    近日,亚马逊 Microsoft Meta 谷歌等科技巨头纷纷加大对自研芯片的投入,希望减少对英伟达的依赖。值得注意的是,在人工智能和自动驾驶等应用的驱动下,大多数科技巨头选择定制芯片来满足自己的需求。定制芯片的重要性日益凸显。定制AI芯片的趋势正在上升 在人工智能模型热潮的推动下,英伟达这家占主导...

    AI大模型的潜力与未来 创新驱动企业发展

    在最近的一次活动中,创始人 董事长兼首席执行官李彦宏分享了他对人工智能模型的看法和期望。他认为,大模型的价值不仅在于新超级应用的产生,更在于现有产品的转型升级。这一观点揭示了人工智能技术在未来发展中的巨大潜力,也为企业的创新发展提供了新的思路。首先,大模型的出现将推动AI技术的进一步发展。随着算力的...

    AI大模型专题2023 AI大模型及应用报告

    今天分享AI大模型系列深度研究报告 AI大模型专题 年AI大模型及应用报告 报告制作人 徐福昌 报告总计 页。专题报告 人工智能学院 注意力机制实际上来自于人们处理外部信息的能力。因为人们在任何时候接收到的信息都是无比庞大和复杂的,远远超过了人脑的处理能力,所以人们在处理信息时,会关注需要注意的信息...

    AI大模型话题 随着大模型能力的快速发展,AI将重塑各行各业

    今天分享AI系列深度研究报告 AI大模型话题 随着大模型能力的快速发展,AI将重塑各行各业 报告制作人 国新 报告总计 页。专题报告 人工智能学院 提升AI大模型能力主要有三种方式 模型参数数量 训练数据量 训练回合数。模型参数数量的改进 以 OpenAI 的 GPT 模型为例,第一代 GPT 模型...

    AI大模型专题 大模型时代耳机战略地位的核心受益者

    今天分享AI大模型系列深度研究报告 AI大模型话题 大模型时代耳机战略地位的核心受益者 报告制作人 民生 报告共 页。专题报告 人工智能学院 . 中国领先的耳机和音频设备综合制造商 漫步者是中国领先的耳机制造商,根据Canalys数据,截至Q,该公司的TWS耳机在国内的市场份额为 年,公司在北京中关...