1、随着企业数据基础的提升,大数据分析带来的价值将进一步提升
近年来,随着各国和地区大数据产业政策的鼓励和数字经济的深入发展,全球大数据市场呈现出快速发展态势,数字技术已经渗透到各行各业,从超市、物流快递等基于地理信息的数字追踪等数字化支付方式, 到智能制造企业中基于数字孪生技术的零部件设计、生产和装配,任何企业都会在生产经营过程中产生、加工、分析和辅助决策。
近年来,Hadoop、MPP等大数据处理技术发展迅速,涌现出一大批以大数据平台和软件产品为核心的大数据企业,但主要解决底层存储或计算问题。
未来,随着下游行业数据基础设施的进一步完善和企业管理者数字化意识的不断提高,将为大数据分析提供良好的数据基础,大数据分析带来的商业价值将进一步凸显。
2、决策指导分析、可解释机器习、多模态数据融合将成为行业技术演进方向
在当前的大数据分析市场中,描述性、诊断性、一流分析的应用较多,决策指导分析应用等深度分析的应用较少,在与人类生命、财产、发展、安全等密切相关的领域尚不发达。 未来,随着大数据分析技术应用领域的拓展、技术的提升、数据共享开放机制的完善、产业生态的成熟,具有更大潜在价值的决策指导的应用将是发展的重点。 为了实现决策指导,有必要在分析中包含有关业务对象的尽可能全面的信息。 来自同一对象不同维度的信息通常包含在不同模态的数据中(例如文本、音频、图像、**等)。
这些互补信息的整合是进一步提高模型分析能力、实现决策指导应用的重要途径之一。 多模态数据融合对不同模态数据中包含的信息进行提取、编码和整合,实现异构信息的互补性,从而提高算法模型的效果。 多模态数据融合将成为未来大数据分析和挖掘应用的重要发展方向。
决策指导分析模型在国民经济各个重要领域的应用,需要评估算法模型的决策对实际业务的影响,可解释性将成为大数据算法模型的重要需求。 算法模型的可解释性是指算法模型的内部工作原理和输出结果的具体原因,可以用人类可以理解的方式进行解释或呈现。
目前,广泛使用的机器习和深度学习习算法(如各种神经网络算法)中有很大一部分是“黑盒”算法,其内部机制无法直接用人类语言逻辑来描述。 在大多数复杂的应用场景中,可解释算法的效果与这种“黑盒”算法的效果有些不同。 如何通过技术手段使“黑盒”算法模型具备必要的可解释性,如何开发出与目前广泛使用的“黑盒”算法模型具有同等效果的可解释算法模型,将是未来大数据分析与挖掘的重点研究领域之一。