中国农村金融网欢迎您! 设为首页   | 加入收藏   | 投稿邮箱
首页> 科技> 科技前沿>

搭建分布式数据库 夯实数字化转型之基

来源:中国农村金融杂志社 作者:王守军 江苏常熟农商银行金融科技总部基础研发部副总经理 发布时间:2023-12-05

当前,数字化浪潮之下,随着移动互联、大数据等信息技术的快速发展,经济社会发展形态加速向数字化转变。银行业的数字化转型是建设数字中国的重要一环,其主要业务特征就是把数据作为新型生产要素,通过挖掘数据要素潜能,实现金融服务的数字化、线上化、移动化。

随着数据量和并发访问量的增加,传统集中式数据库存在软硬件成本高、扩展能力差、并发性能不足、容灾能力弱等问题,已无法持续满足银行高并发、高可用的业务发展需求。

直面不足 传统集中式数据库存在弊端

常熟农商银行原数据库技术架构为小型机AIX+DB2集中式数据库,主要存在几项弊端:成本高昂,原技术架构扩展性及容灾能力需要多份冗余的高端小型机、大容量高端存储以及相应的软件平台支撑,投入动辄上千万元;扩展性差,原技术架构的扩展性无法满足金融业务发展对资源的灵活缩容需求;并发性能不足,原技术架构在高并发业务以及大批量数据处理时存在明显的性能瓶颈;容灾能力弱,原技术架构无法同时满足数据中心级容灾和数据一致性要求。

分布式数据库便是针对这些问题而发展衍生出来的一项创新。面对海量数据的高并发查询及批处理压力,常熟农商银行基于业务场景将数据拆分到多台x86服务器上,每台服务器单独承担部分数据存储和相应业务处理的工作,实现水平扩展和分布式数据计算、存储、管理,具有高可用、高并发、高容错性等优点,能够极大地提高业务系统的稳定性和可用性。

多面考量 引入OceanBase分布式数据库

常熟农商银行于2018年引入国产化原生分布式数据库OceanBase,以“随时随地为客户提供个性化、全方位普惠金融服务”为目标,逐步应用到业务中台、大零售营销、移动厅堂、手机银行等重要业务系统,并于2020年完成分布式数据库从“单中心三副本”到“三中心三副本”架构的改造,实现了数据中心级容灾能力。

为什么要引入OceanBase分布式数据库,主要有几点考虑。一是技术路线的差异化对比。当前,分布式数据库实现的技术路线主要分为“分布式中间件+单机数据库”“非对称计算节点+分布式存储”和“原生分布式数据库”三种技术路线,不同路线的特征差异比较大,主要结合应用架构和业务发展诉求从数据库技术能力和产品演进等维度进行对比分析和选型。二是语法兼容性的成本考量。OceanBase分布式数据库既兼容MySQL数据库语法,又兼容Oracle数据库语法,可有效降低存量在运行系统的升级改造成本以及新系统引入适配改造成本。三是产品生态全方位分析。产品生态能力主要从数据迁移平台、社区生态发展、培训认证体系、售后技术支持等维度全方位分析,满足业务发展对分布式数据库平台的可持续稳定运行需求。

科技赋能 打造分布式数字化核心账务系统

为发挥金融科技赋能业务创新发展,推动数字化、智能化、生态化转型,常熟农商银行启动“合芯4.0”项目,采用微服务、应用多活和分布式数据库的全新技术架构,打造新一代分布式数字化核心账务系统。

项目于2022年4月成功投产上线,上线后系统运行平稳、性能卓越。其中,日终批量时长从数小时缩短到9分钟内,提升41倍;季度结息耗时缩短到16分钟内,提升46倍;批量代发20万笔可在55秒完成,提升651倍;业务TPS处理能力峰值提升到5500笔/秒,提升46倍;日终扣款30万笔可在6分钟完成,提升25倍,为业务稳健快速发展提供了有力支撑。

分布式数据库架构的创新价值主要体现在“四重容灾”“异构双容”“双芯多活”“资源池化”四个方面。

“一主三备”超强容灾。主集群采用“两地三中心五副本”架构,具备数据中心级容灾,自身支持数据零丢失容灾切换,应用自动恢复,同时部署同城备集群、异地备集群和同城DB2异构备库。在“合芯4.0”项目容灾测试阶段,通过对分布式数据库的软件、硬件、网络三大场景的41个关键案例进行全方位测试验证,容灾能力满足核心账务系统业务连续性需求。

数据库异构,应用双兼容。核心账务应用程序经过适配改造和数据库配置调整,一套应用程序同时兼容OceanBase分布式数据库和DB2数据库,业务交易数据通过同步平台准实时同步,实现了核心账务应用系统的数据库异构容灾机制。

主备集群异构芯混合部署。OceanBase主集群和同城OceanBase备集群分别采用x86芯服务器和ARM芯服务器,主集群承载实时读写和批处理业务场景,同城备集群承载监管报送供数等查询场景。

资源池化,灵活扩展。基于业务发展趋势规划分库方案,同时各分库通过分布式数据库租户机制承载,并将租户均衡打散到所有服务器上,充分利用所有主机资源满足业务需求。所有租户之间实现资源隔离和故障隔离,租户动态增加或降低资源配置可实现弹性伸缩,集群通过增加服务器节点和租户在线迁移实现横向扩展,可有效满足未来业务快速发展的资源灵活扩展需求。

优化提升 运维分布式数据库

常熟农商银行自引入分布式数据库OceanBase后,逐步应用到OA办公、业务枢纽、手机银行、智慧食堂、超网、国际结算、企业综合金融服务平台和核心账务等业务系统,目前租户数量已达140多个。国产化分布式数据库的成功上线只是金融业务数字化的起点,在业务快速发展和分布式数据库技术快速更新迭代的趋势下,如何保障分布式数据库长期稳定高效运行愈发重要。

“运维前置”,提前化解风险。采用“运维前置”策略,持续在数据库对象设计、性能压测以及生产性能巡检等阶段全方位进行对象设计评审优化和TOP-SQL分析优化,提前发现性能风险或性能问题,并加以优化和解决。采用分布式数据库构建历史库集群,历史库集群采用低成本硬件部署,基于业务诉求将主集群中业务历史数据定时归档到历史库中供业务查询使用,主集群主要用于承载在线实时读写交易场景,极大地缓解了高并发业务场景下主集群的运行压力。

完善容灾机制,保障业务连续性。分布式数据库的数据备份恢复及容灾机制对于业务系统稳定运行应急保障至关重要。第一,充分利用OceanBase分布式数据库的数据闪回查询能力,可有效快速应对数据级灾难问题的解决。第二,按需将数据备份进行存储或转储保留,并定期进行备份恢复校验,以验证备份介质的有效性。第三,每年按规划定期基于灾备管理平台进行全流程自动容灾演练,定期验证分布式数据库架构容灾机制和恢复预案。第四,鉴于业务数据量的快速增长,为充分发挥分布式数据库架构优势,搭建高带宽备份专网环境以及分布式混闪存储,以提升备份恢复时效,为平台高效运行和业务连续性提供有力保障。

保障多中心DNS高可用性。在应用双机房双活以及分布式数据库多中心部署架构下,从应用端发起请求到目标服务器之间需要经过硬负载F5到OBProxy再到目标OBServer,该链路最多可能会发生三次跨机房访问。DNS由F5 GTM提供,机房内和机房间均实现高可用;VIP由F5 LTM提供,机房内实现高可用。

规划建设智能运维平台。为更高效满足新型敏捷化业务发展需求,充分发挥分布式数据库资源池化等优势,规划建设智能运维平台,基于专家经验和机器学习等算法对收集的可观测基础数据进行全方位分析实现一键交付、优化中心、实时诊断、自治自愈等高效运维能力,将大幅提升分布式数据库运维交付效率,提升业务系统运行稳定性和金融服务体验。

分布式数据库是银行业数字化转型的重要支撑,它的应用创新实践标志着银行业的国产化迁移改造正在从边缘系统向核心系统攻坚。常熟农商银行将充分发挥分布式数据库高可用、高性能优势,为业务提供稳定、快速、安全、可靠的数据支持,向客户提供更优质的金融服务。

网站编辑 - 古慧子