人工智能技术(AI)自上世纪五十年代提出以来,已经经历了70多年的发展,但人工智能已经成为全社会关注的基础技术,进而成为世界各国高度重视的关键战略发展方向, 或在过去十年中。在这短短的十年里,人工智能技术呈指数级发展,人工智能的加速演进,带领各行各业加速向智能化迈进。
现代人工智能的出现,首先是基于深度学习技术的感知智能,我们称之为AI10 次。 所谓感知智能,就是让机器真正具备与人类相同的视觉、听觉、触觉等感知能力,这是人工智能在安防领域最成功的应用,比如对特定感兴趣的物体进行检测和分析。 另一方面,人们显然不满足于人工智能仅仅看到、听到和处理信息,而是期望机器像人类一样学习、思考和推理,这就是认知智能领域的用武之地。近两年,随着大模型的兴起,人工智能技术向认知智能迈进的步伐大大加快,并得到了快速发展。 可以预见的是,AI20 时代将是分界线,20 及以下我们认为是传统的深度学习模型,20后,更多的大型模型技术不断涌现,并将逐渐占据主导地位。 当然,AI20不是人工智能技术的终结,展望未来,我们希望机器能够真正成为人工大脑,取代人类的决策和判断,也就是我们所说的AI30 在决策智能时代。 人工智能技术要达到这个顶峰还有很长的路要走。
现代人工智能的发展,为科达这样的安防厂商带来了新的活力和机遇。 科达在2024年推出了第一款感知相机,这代表着我们从感知智能进入现代人工智能赛道2024年,科达提出“安全+AI”战略;2024年,科达率先在业界提出AI像素级推理、AI超低光、AIISP等概念,引领行业技术潮流近两年来,科达积极投入大模型的研发。 科达基于现代人工智能的九年技术沉淀,为公司的安防产品、业务服务和解决方案带来了巨大的效益,一个又一个明星产品层出不穷,不仅为科达创造了经济价值,也保障了社会公共安全,产生了良好的社会效益。
感知智能是指借助人工智能算法等前沿技术,将物理世界的信号映射到数字信息世界,构建多个数据,并以人类熟悉的方式进行通信和交互。 十年前,深度学习算法的出现带来了我们所说的AI1,使这一愿望的最终实现成为可能。0 技术革命。
深度学习算法通过大量的数据训练来学习特征,并不断优化模型,可以处理复杂的数据结构和非线性问题,实现高精度的分类和分类。 它最大的优点是不需要人工设计和选择特征,只要有数据,机器就会自动学习目标的最佳特征,大大减少了机器感知过程中的人工干预,为机器实现感知智能提供了最重要的基础支撑。
在安防监控行业中,最常见的深度学习算法是对人、车辆、物体和其他感兴趣的物体进行分析。 例如,与人相关的人像识别、与车辆相关的车辆损坏分析、非机动车识别和属性分析,以及其他特定对象的分析,如船舶、动物、文字等。 目前,这些基于深度学习的感知智能算法已成为安防领域各种应用中不可或缺的工具,不仅大大减轻了人类的工作量,而且通过感知智能,机器可以比人类看得更清楚,分析更准确。 因此,AI10的感知智能算法在安防应用中占据了重要地位。
感知只是人类的基本能力之一,人们希望AI能够拥有人类最重要的认知能力,为我们做更多的事情。 以安防应用为例,我们并不满足于AI只分析场景中一个感兴趣的目标,而是希望机器对场景周围的环境有一定的了解,也就是希望机器能够具备初步的认知智能能力。
所谓认知智能,是一门基于人类认知系统的技术科学,以对感知信息的深刻理解和对自然语言信息的深刻理解为主要研究方向。 如图1所示,对于安防行业来说,这两个研究方向有着非常直接的应用。
首先,我们来看一下深度理解感知信息在安防领域的应用,这与AI1不同分析0时代的人、车、物等特定目标,AI20 在安防领域,泛监控场景的应用很多,如交通、政法、城管、校园、建筑工地等场景中的人群情况、安防事件、数据参数甚至健康环境分析等。 这些应用更强调场景中物体与目标与周围环境之间的相互关系,因此人工智能需要具备一定的理解和识别能力,我们称之为场景图像理解。 一些典型的例子包括:交通事故分析,如人行横道、障碍物检测、违章停车等;道路安全事故分析,如洪水、雪、雾、火等;分析市政治理事件,如人群聚集、道路占用、乱扔垃圾、冒烟车辆等。
使用传统的深度学习算法来完成这些泛安全场景理解任务非常困难,由于这些场景的多样性和任务的可变性,带来了数据采集难、标注难、标注成本高、算法泛化性能差、鲁棒性不足、算法交付时间长、扩展性差等诸多问题。 因此,AI10时代的感知智能算法很难用于场景的深入理解。
认知智能在安防领域的另一个方向是基于自然语言信息对行业知识的理解。 安防厂商提供给用户的行业解决方案,必须对行业知识有深刻的理解,传统上用自然语言文本来描述,并生成相应的知识图谱来承担。 例如,公安知识图谱是通过数据分析、文本语义分析等手段,提取公安应用中的人、物、地、机构、虚拟身份等实体,并根据属性、时空、语义、特征、位置连接等建立相互关联,构建多维度、多层次的关系网络。 再比如司法机构的知识图谱,系统梳理法律领域的实体、属性和关系,建立逻辑关联,通过知识图谱技术进行数据挖掘,辅助法律工作者更好地理解和应用法律知识。 安防厂商往往必须掌握相关行业的知识图谱,才能提供专业的行业解决方案。
然而,知识图谱本身的构建和应用存在诸多挑战,难以推广。 首先,需要建立高质量的知识图谱构建模型,定义清晰的实体和关系,并使用合适的数据源和知识表示,所有这些都涉及大量的人工经验和判断其次,知识图谱的构建需要大规模的自动知识获取,而知识图谱需要大量的知识作为基础此外,还需要对知识图谱进行不断的更新和迭代,而知识本身并不是封闭的,而是不断的扩展和变化,知识图谱难以处理不完整或动态变化的知识。 构建和应用这些知识图谱的困难意味着需要找到一种新的方法来使机器能够访问知识。 显然,这超出了感知智能的范畴。
可以看出,对于认知智能在安防应用中的两个深入理解方向,AI10的算法已经不够用了,那么我们的对策是什么呢?这是 GPT 模型。 所谓GPT大模型,是指基于Transformer架构的生成模型(GPT的'G'),它是通过非常大量的语料库或图像进行预训练(GPT的'P')的具有大量参数(如OpenAI的GPT-4大模型,参数近万亿个)的大模型。 经过艰苦研发,苏州科达推出了适合安防行业的KD-GPT,它包含三类大模型,分别是:多模态大模型、行业大模型和AIGC图像大模型,如图2所示。
GPT作为生成式AI模型具有诸多优势,其中最基本的有以下两点:一是大模型是多任务处理的。 在以前的深度学习模型中,一个模型对应一个任务,但现在大模型可以用一个模型处理多个下游任务其次,得益于Transformers的结构特性,大型模型已经具备了检索和理解信息的能力,这也是传统深度学习模型所不具备的特性。
KD-GPT多模态大模型(见图3)将多模态的信息作为输入,融合模型内部的信息,可以解决所有疑难的数据问题。 例如,如果我们想检测图片中是否有烟雾,我们只需要输入提示:“烟雾”和待检测的**,大模型就可以直接输出检测结果,而无需收集数千个烟雾**进行训练。 同样,如果 alt 文本输入为“flame”,则大模型可以自动检测 ** 中是否存在火焰,而无需进行特殊的数据训练。
KD-GPT的行业模型(见图4)采用了“通用大模型+行业数据+训练调优”的思想,使得这个大模型可以轻松解决构建行业知识图谱需要完成的几项任务,在做好知识推理和质量评估后,行业大模型可以完全替代行业知识图谱的功能。
科达的AIGC图像模型是另一种大型模型,也可以为人工智能算法生成大量的训练数据。
从认知智能到决策智能,需要在数据、学习、多模态数据处理、决策树模型和个性化算法等方面取得重要进展。 这些进步将有助于迎来一个完全智能社会的时代。
大模型是实现决策智能的重要工具之一,因为它们具有高效的数据处理能力和强大的特征工程能力。
但是,我们还必须面对大型模型的一些问题:
1.公平
大模型是基于大量数据的预训练和改进训练的不断调整,如何保证大模型不受预训练数据和推广的偏向?
为了保证大模型的公正性,我们需要使用多个**数据进行预训练,这样可以避免模型过度依赖某一类型的数据,从而提高模型的泛化能力。 同时,对于选定的训练数据,需要投入人工清洗和标注,以保证数据的质量和可靠性。
2.透明度
大型模型本质上是神经网络,神经网络的透明度和可解释性尚未得到有效解决。 如何评估和监控模型的决策过程?
学术界一直在积极研究大型模型和神经网络的问题,例如训练辅助模型来评估主模型的性能。 例如,详细分析大模型每一层的输出,以找到规则的共性。
3.包含
无论是训练还是部署,大模型的成本都非常高,科达这样的安全公司如何做大模型?对于不同尺寸科达的客户,我们怎样才能得到一个大家都能用的大模型呢?
为了降低使用大模型的成本,需要考虑使用预训练模型,选择合适的模型架构,并针对每个企业和用户单体使用分布式计算。 更重要的是,企业和社会各方面应共同努力,通过计算基础设施建设、计算服务平台建设、算力共享机制的建立、大模型技术研发的推进和大模型激励政策的制定,让更多的人和企业轻松获取和使用大模型计算资源。 这需要全社会的共同努力。
4.友好
如何避免大模型提供的所谓**信息(如教唆犯罪),如何保护人的知识产权或大模型的知识产权不被其他大模型窃取和侵犯?
在设计和使用大型模型时,首先要遵循道德和法律规范,避免对社会和个人造成不良后果。 目前,国家已初步制定和颁布生成式人工智能相关法律政策,规范生成式人工智能的开发和使用,限制大模型的使用范围和方法,防止其被滥用和侵害他人权益,确保其符合公共利益。 另一方面,尊重和保护知识产权也是发展大模型的基础,国家应加强对大模型的知识产权保护,鼓励创新和技术进步。
综上所述,虽然大模型的出现被称为AI的第二次革命,但在技术成熟的曲线上,大模型要达到成熟还有很长的路要走。不仅如此,要想在安防领域实现真正的决策智能化,大模型不会是唯一的关键技术,人工智能需要不断创新发展,还有很长的路要走。
随着科学技术的飞速发展,技术变革已成为推动安防行业进步的重要力量。 从模拟到数字,从标清到高清,从有线到5G,从功能化到智能化,每一次技术变革都给安防行业带来了新的巨大增长。 可以预见,随着技术的不断发展,安防行业仍具有充足的动力和广阔的前景。 要积极拥抱包括人工智能在内的各种技术变革,充分利用新技术优势,提高安防工作的效率和质量,共同促进社会和谐稳定。 苏州科达愿与业内朋友、上下游企业携手共进,共创安防行业的未来
温张勇,苏州科达科技有限公司***