中国人民银行发布的《金融科技发展规划(2022-2025年)》是金融科技发展的重要指南。 《规划》强调金融科技在推动金融业现代化转型、提升金融服务效率和风险防控水平等方面的重要作用。 同时,方案中提到的金融数据中心智能运维机制的建立和完善,将对金融科技产业的发展起到重要推动作用,这也意味着将投入更多的资源和支持投入到该领域的研发创新中, 从而促进技术在金融领域的广泛应用,提高运维管理的效率和质量。
昆仑银行在数字化转型过程中积极应用博瑞数据应用性能监控平台业务系统升级,实现应用执行流程全面监控跟踪,秒级性能诊断,大大提高了团队运维人员的工作效率。 同时,借助应用性能监控平台,提升可视化能力,降低运维成本,银行运维环境更加直观安全可观察。最终,该解决方案不仅解决了客户现有运维系统改造建设的问题,而且本文的前瞻性技术也发表在中国人民银行“电子金融”。在杂志上。
以下为原文,约3000字,预计阅读时间为8min。
近年来,随着金融科技的快速发展,新技术、新业态的涌现,数字化正在重塑金融生态新模式,银行业务正向线上化、智能化方向转型。 在数字化浪潮中,国内银行机构纷纷推出数字化转型战略,推动和赋能自身业务发展、内控管理、风险防控等,以期在激烈的市场竞争中脱颖而出。
在数字化转型过程中,银行业经常面临组织敏捷性不足、网络环境不稳定、数据治理难、运维效率低下等问题,导致业务处理效率低下。 同时,银行业务场景多样,在业务探索中需要创新发展系统间调用关系、各模块状态等运维方式。
项目背景分析
在数字化时代,数字化转型已成为各行各业发展的必经之路。 这一转变给行业和企业的发展带来了新的变化和转型动力,也形成了一种新的企业管理和运营维护形式。 然而,这也给涉及不同业务系统和新旧IT系统的整体IT架构带来了前所未有的挑战。
昆仑银行将数字化转型视为弯道超车的重要措施,但在实践中仍面临工具分散的问题,依靠运维人员的经验和各种专业分析工具的频繁切换,实现故障定位、影响分析等操作,运维效率还有提升空间。 为满足自身业务需求,解决技术痛点,昆仑银行通过内部推广和应用性能监控,满足数字化转型和对外赋能的需求。 这为昆仑银行的数字化转型提供了有力支撑,也彰显了金融科技在提升运维管理效率和智能化方面的巨大潜力。
项目建设特点及成果
昆仑银行在构建应用性能监控(APM)解决方案时,采用APM探针技术对采集到的性能指标数据进行处理、分类、整理和存储,实现平台应用系统的自动化安装和监控。 探针监控使用字节码等相关技术,在不修改程序的情况下,实现对应用执行过程的全面监控和跟踪,体现了探针能力的稳定性、高性能和可扩展性。
通过进一步优化和建立智能运维机制,昆仑银行可以更好地感知风险,发现异常和故障。 这为昆仑银行的数字化转型提供了强有力的技术保障。 同时,还实现了智能报警、根本原因分析、一流呼叫跟踪等能力,保障客户环境稳定运行。 主要技术框架如下图所示。
APM技术平台架构图。
疑难解答和位置
在日常的IT运维工作中,我们有时会面临一些复杂的故障定位场景,比如大量系统几乎同时产生高等级告警,这些系统依靠各种网络相互支持和依赖,每个系统本身也承载着一个复杂的系统架构。
在这种情况下,如何在有限的时间内定位故障并快速恢复业务,是运维人员面临的低频次但高风险的问题。 与传统的故障排除相比,运维人员需要对这些告警进行全面分析,以确定可能的根本原因。 一般的想法是,每个应用系统的负责人会找到数据库、操作系统、中间件、网络等团队,确认是否是系统造成的。 如果没有,则需要通过预先绘制的上下游系统关系图梳理出可能的根本原因节点,然后查询对应疑似根本原因系统的架构中是否存在故障,以便进一步处理。 由于相关工作不仅存在跨部门沟通,而且需要较强的视觉和逻辑思维能力,对运维人员的要求极高。
在某年费缴纳活动中,面对海量告警数据,利用应用性能监控系统实现端到端性能,快速定位性能问题,逐层剥离分析问题,实现秒级性能诊断,最终将发现问题解决的时间从几小时压缩到几分钟, 大大提高了团队运维人员的工作效率。
** 级别调用跟踪
通过一级呼叫跟踪技术,自动获取呼叫拓扑、业务系统中各模块状态、关联关系,可视化应用的呼叫关系,从而快速定位故障,缩短故障排查周期,有效提高运维效率。
昆仑银行网贷平台接入应用性能监控系统后,实现从程序入口到执行的全环节监控跟踪,快速识别下游系统延迟问题,并及时采取相应措施,确保网贷平台稳定安全运行,为用户提供优质的服务体验。
标准化运维数据
控制器作为探头接入和数据处理组件,接收探头侧上报的指标数据,完成指标数据的分类处理、入库、探头配置的交付。 探针和控制器之间的交互主要包括两种协议:配置和上传。 config协议是探测器数据采集策略控制协议,由控制器根据用户配置的数据采集策略传送到探测器。 上传协议是探针原始数据上传协议,负责对探针上传的原始样本数据进行处理,控制器在接收到原始数据后立即响应探针,对协议数据进行异步处理,包括协议分类、正则化、存储等。
完成指标、日志、告警、配置、流程等运维数据建模,完成基础对象系统、指标体系、配置管理等建模,实现运维数据治理,保障数据的时效性、完整性、相关性、有效性,为应用监控场景和智能分析场景提供优质数据支撑。 主要技术框架如下图所示。
网页监控平台架构。
收益与展望
·构建数字化运维体系
昆仑银行通过积极应用绩效监控(APM)系统,打破了银行传统的运维模式,借助数字化转型,实现了公司科技创新能力的精准画像,实现了企业信用在金融领域的数字化,推动了科技创新金融服务的精准化和智能化。
·积极赋能业务创新发展
应用性能监控(APM)系统为银行业务发展提供多元化支撑和突破点,监控和运维工作的内涵多样化。 进一步将数字化理念内化融入日常业务运营和金融服务中,赋能业务部门,提升业务部门执行效率,实现业务与技术更深层次的融合。
·创建可观察的运维环境
目前,昆仑银行已全面升级改造运维监控管理体系,低成本开放跨部门、跨系统流程,在全流程治理过程中完成部分数据治理。 此外,还将发现和解决问题的时间从几小时缩短到几分钟,解决了运维效率低、风险预测和维护不力的问题,提高了可视化能力,提高了工作效率,降低了运维成本,使银行的运维环境更加直观、安全、可观察。
在不断进取的道路上,昆仑银行将始终坚持技术驱动、内外联动、数字化转型赋能场景生态建设,深入探索以体验为核心的全流程体验服务体系,打造优质产品品质,持续推动金融企业运维管理创新, 根据自身特点和金融业务场景需求,夯实网络运维系统的数字化管理基础,提升金融科技赋能水平,全面提升企业竞争优势。
部分获奖案例
博瑞数据秉承“客户至上”的理念,致力于技术赋能,帮助客户实现智能运维,提升组织运营效率,创新实践案例获得权威机构认可。 以下是部分获奖案例。
中国光大银行“云原生背景下运维监控体系建设”。
发表在《电子金融》杂志上。
东方**“全生命周期智能数字体验项目”。
电子金融。
2021年度科技金融业务突出贡献奖。
宏泰**“互联网金融业务绩效监控系统”爱分析
2022年中国IT运维创新实践案例。
中海油“多云资源监控与治理”,中国电子学会
2023 年最佳实践案例。
万科的“Bonree One赋能应用可观测性监控能力”。
京观传媒. 2023年度优秀数字化创新企业服务案例。
华安** “用户会话监控的智能异常检测与分析实践”。
中国信息通信研究院.
2023 XOPS“灵鑫杯”优秀案例。
IFC** “智能可观测性平台建设”。
中国信息通信研究院.
中国AIOPS现状调查报告(2023)。
南航“端到端全栈监控中的智能运维实践”。
中国信息通信研究院.
中国AIOPS现状调查报告(2023)。
国元** “建立一体化智能可观测平台,实现APP体验数字化”。
数据猿。 金猿案例展。
昆仑银行“一体化智能可观测平台,充分保障业务稳定”。
数据猿。 金猿案例展。