(CWW)数字化时代,业务“在线”是每个企业的常态。作为企业经营管理软件中最关键的应用系统,ERP承载着企业所有的业务流程和数据资产,是企业日常运行的重要依托。因此业务7*24小时“在线”的“可靠性”成为衡量ERP的一大关键指标。
日前,华为宣布实现自主创新的MetaERP研发,完成对旧ERP系统的替换,经历了月结、季结和年结的考验,交出“零故障、零延时、零调账”的满意答卷,证明了MetaERP系统的“可靠性”。这背后离不开华为云GaussDB数据库的支撑。
金融级可靠性,MetaERP的“极致要求”
(资料图)
华为旧ERP系统随华为业务发展运行了20多年,支撑着每年数千亿产值的业务和全球170多个国家业务的高效经营,具备“强一致性”的典型特征:不仅承载华为250多个会计核算场景、140多个核算模板、3000多个核算规则, 还需要完成海外100多个子公司的多准则适配,灵活编排业务规则,当国家会计准则发生变化,不用IT改程序就可以直接调整,对账本的准确性、灵活性和一致性要求极高。
这让MetaERP的替换从一开始就面临着一个“极致要求”:绝对的强一致和高可用,确保单单、单帐、账实一致性,达到金融级的可靠性。如何在替换旧有数据库的同时,达到这样的要求,成为GaussDB团队从一开始就摆在首位的工作。
GaussDB高可用容灾部署满足业务需求
什么样的数据库才有这样的能力?当时,团队面临两个选择,一是继续沿用马来西亚子公司此前使用的业界开源友好的PG数据库,二是使用华为自主创新的华为云GaussDB数据库。最终,GaussDB依托自身的优势,提供同城AZ内、跨AZ、异地跨Region的两地三中心容灾方案,很好地满足了华为业务对MetaERP永久在线的需求。
为了实现数据的强一致性,GaussDB通过DCF(分布式共识框架)模式提升了容灾能力的规格,支持一致性日志复制,在任意节点故障、主备切换情况下保障日志不分叉,并且支持一致性选主,确保任何故障下都不会发生脑裂双主,SLA服务达到了99.99%。
在保证数据一致性的前提下,团队围绕容灾也展开很多研究,支持了流式容灾,突破了基于物理日志的并行复制技术,支撑MetaERP高效完成同城3AZ高可用部署,并且通过异地跨云容灾集群的搭建,实现了异地1700多公里的城市级容灾能力,当一个地方发生故障,另一个地方快速完成容灾集群的切换,确保故障情况下数据不丢失,保障业务正常运行;6小时以上的闪回能力,避免了人为失误操作导致的数据丢失,同时闪回查询对系统性能的影响极低;
通过三副本数据强一致技术,实现RPO等于零,数据不丢失,安全守护每一笔存货交易的准确记录,交易成功率100%,截至目前,系统运行实现了做到了“数据零丢失、业务永在线”。
GaussDB全面支撑MetaERP稳定运行
为了确保系统足够稳定可靠,整个上线过程中,GaussDB团队进行了多次真实场景的故障演练,比如对准历史故障异常场景,选定了断网和断电演练。对断网场景进行了单机柜断网、整排机柜断网和AZ级断网演练,对断电场景进行了单机柜断电、整排机柜断电和市电掉电演练。
做单机柜断电时对西安机柜进行了误下电演练,做整排机柜断电时对贵阳小母线进行了误下电演练,而针对市电掉电对东莞EDCM9模块进行了掉电演练。最后结果显示,无论是在哪种情况下,系统端到端故障都能保证在5分钟之内快速恢复,达到了预期目标。在充分的故障场景测试下,MetaERP的高可用和高可靠能力得到了全面的验证。
可靠性是ERP系统的“生命线”。实践证明,华为云GaussDB完全经受住了这场世界级的攻坚考验,也完全具备支撑大型一体机系统迁移上云的能力,并积累了丰富的经验。未来,华为云GaussDB将一如既往地持续聚焦真实业务场景,潜心研磨数据库根技术,为企业数智化转型保驾护航。