基于Veritas Netbackup备份平台的 优化措施 下载本文

内容发布更新时间 : 2024/12/24 21:05:05星期一 下面是文章的全部内容请认真阅读。

龙源期刊网 http://www.qikan.com.cn

基于Veritas Netbackup备份平台的 优化措施

作者:张庆丹

来源:《信息安全与技术》2014年第06期

【摘要】NBU备份平台能自动进行系统的集中备份,为数据安全提供有效保障,但运行中也存在一些问题。本文给出了针对运行中存在问题的四个优化措施。实践表明,这些措施切实解决了备份平台恢复时间长及流量带宽占用大等问题,进一步提高了备份平台的可靠性。 【关键词】备份平台;Catalog;异地备份;策略调整;数据恢复 1引言

数据中心是各种IT应用服务的提供中心,是数据计算、网络、存储的中心。人民银行的数据中心在经过基础设施平台、应用平台、存储备份平台以及管理下发平台等多个工程的建设后,已成为区域性技术服务的枢纽,提高了人行的整体科技服务水平。各应用系统集中于门户展现,促进了科技工作的数字化和信息化;管理下发平台通过及时的文件传送,实现了各信息节点间的数据共享;存储备份平台通过统一的备份管理软件、集中的备份平台及并发写入等技术解放了人力,大大提高了备份效率。

数据中心中最重要的就是数据,所有的应用及安全都是围绕着数据来部署的,要保障数据的完整性及安全性,存储中心的建设发挥了重要的作用。人民银行省级数据中心存储备份平台采用NBU(Symantec Veritas Netbackup)系统作为建设载体,它能够自动对各类应用系统进行集中备份,为重要业务系统数据安全提供有效保障。但在实际使用中发现存在故障恢复时间长、备份占用带宽多、自动备份操作失败及无法定期验证数据有效性等问题。本文探讨的就是针对这些问题进行实践和摸索后的基于Veritas Netbackup备份平台的优化措施。 2优化背景及措施

存储备份平台由针对每个系统进行备份转变为由统一的备份管理软件及集中的备份平台进行备份,通过将手工操作转变为无人值守的自动操作大大提高了备份效率,也保障了数据的安全。但运行至今,发现系统中存在某些问题:一是没有对存储管理平台的日志索引文件(Catalog)进行备份,导致恢复时间过长甚至恢复失败;二是没有有效地规划备份使用的存储单元(Storage Unit),导致跨网段备份占用几乎整个局域网交换机的带宽资源,影响其它系统的运行;三是数据库系统初始连接参数不够,导致部分应用系统备份失败;四是没有定期检查备份数据库的有效性,可能存在无法恢复有效数据的后果。经过长时间摸索实践,通过对备份范围、备份策略和数据库参数等进行调整优化,提出了优化措施,大大提升了数据中心备份系统运行效能。

龙源期刊网 http://www.qikan.com.cn

2.1异地备份Catalog文件缩短恢复时间

省级数据中心存储管理平台使用的NBU软件中有一项非常重要的数据,是它的日志数据库,通常称为Catalog,它是备份主服务器(Master Server)的心脏,它记录了关于所有备份数据的数据;在进行存储备份平台中数据文件的恢复时,首先需要读取Catalog文件以便在磁带库中定位指定时段备份文件的位置。如果没有它,无法进行备份内容的定位,任何一个文件和备份磁带的索引关系将无法得知,数据的恢复工作也无法进行。目前Catalog文件只在专用磁带上备份,一旦NBU服务器发生灾难故障需要恢复时,若Catalog文件丢失,需要通过对所有磁带的全扫描重构Catalog后进行备份系统的灾难恢复,或通过读取专用磁带上Catalog文件进行平台恢复,所花的时间很长,往往超过数小时,甚至可能恢复失败,容易引发更大负面影响。

经过探索,将存储备份平台中主服务器(Master Server)安装目录下的Catalog文件,通过GTP异地数据备份系统进行异地备份,既大大增加了Catalog文件的安全性,又因从异地备份中可以快速读取Catalog文件进行平台恢复,通过直接读取最近日期的索引文件,再现备份数据存储情况,最大限度地降低了恢复的难度,在发生重大灾难时为第一时间恢复业务系统运行提供了技术支持。

2.2调整备份策略有效降低网络负担

数据中心存储备份平台在对数据量较大的业务数据进行备份时,出现了核心交换机与服务器所在的生产区交换机流量高达88Mbps、占整个网络近90%的带宽的情况,较大的通信流量对其他系统运行、备份产生了一定影响。通过研究NBU的备份机制我们发现通过调整备份策略能够解决这个问题。省级数据中心使用了NBU三级备份机制,即同时安装了备份管理服务器、介质服务器(Media Server)、备份客户端(业务系统服务器)。其中安装了光纤HBA阵列卡的备份管理服务器、介质服务器均可实施备份策略,但介质服务器的作用往往被忽略了。以往新增备份策略时,备份客户端的数据备份默认选择备份管理服务器进行数据备份,由于备份管理服务器与备份客户端不属于同一网段,备份数据传输必须经过核心路由器设备,形成较大跨网段通信压力。通过备份策略的调整,将与备份管理服务器不同网段的备份需求,改用与备份客户端同一网段的介质服务器进行备份,备份数据不经过核心路由器进行传输,避免对跨网带宽的占用。

同时,也大幅减轻了备份管理服务器运行压力,介质服务器也起到备份数据分流作用,分担了备份任务,多个业务系统数据可并行备份,减轻了备份管理服务器运行压力,进一步提高了数据备份效率。如图1所示蓝色的数据流路线为原备份策略的数据流向,由于备份客户端与备份服务器不在同一网段,使得生产区交换机与核心交换机间需要传送数据,形成了网络拥堵;通过调整备份策略,令备份客户端选择同一网段的数据库服务器作为介质服务器,解决了网络拥堵的问题,数据流向见红色路线。 2.3优化数据库参数提升备份成功率

龙源期刊网 http://www.qikan.com.cn

省级数据中心DB2数据库系统同时在用活动数据库“NUMDB”配置数值偏低,值为8。在创建门户系统时,其中一个用户建设的数据库就有7个,之后又陆续增加了多个应用及自建系统数据库。造成在省级数据中心进行新增数据库操作时,经常提示数据库连接不上的错误:“maximum number of concurrent databases have already been started SQLSTATE=57032”,并且在使用NBU进行数据库备份时,新增数据库备份策略实施时提示失败:“The backup failed to back up the requested files”。这些都是因为活动数据库参数配置不当造成的。由于修改数据库连接参数需要停止整个数据库,对应用系统的不间断运行是有影响的。因此通过修改此数据库连接参数,且在使用“update dbm cfg using NUMDB MaxDB”命令调整参数配置时充分考虑最大数据库连接数NUMDB的可选值,解决问题的同时,避免了在新增应用时再出现同样的错误。 2.4定期检查备份文件保障数据库安全

省级数据中心存储备份平台对数据库服务器上的DB2数据库及LOG日志都设置了完善的备份机制,每天的全备份策略确保了数据库备份的安全,但是数据库备份文件的有效性却没有得到充分的验证。万一磁带库上存储的备份文件都是“脏数据”,将导致灾难事故发生时,无法完成有效数据库的恢复操作,数据库内容丢失引发的后果将是不可想象的。因此通过定期使用nbdb2.sl64程序对数据库文件进行恢复及使用备份平台对archivelog进行文件系统恢复,对磁带库上的数据库备份文件进行恢复,检查备份数据的有效性,有效保障数据库备份的安全可靠。 3结束语

在对省级数据中心存储备份平台实施上述优化措施后,备份的可靠性及恢复的效率得到了很大的提高。进行应急演练操作时,有效的Catalog备份文件最大限度地降低了恢复的难度,平台的恢复时间从数小时缩短到数分钟,切实加快了省级数据中心灾难恢复的速度;日常应用的备份操作均能正常进行,数十个应用的上百G数据能通过不同的介质服务器有条不紊地进行备份,且网络流量带宽无明显增长,业务系统的运行不受任何影响;数据库备份的有效性和可靠性都能得到检验。通过反复跟踪和观察,在实施上述改进措施后,所有系统运行稳定,备份平台工作正常,网络流量也未现异常,优化取得了较好成效,有效保障了省级数据中心区域性技术服务枢纽功能的实现。 参考文献

[1] 张庆丹. Veritas NetBackup三级备份机制的典型实现. 福建电脑,2013,(10):165-166.

作者简介:

张庆丹(1983-年),女,福建三明人,硕士研究生,工程师;主要研究内容和关注领域:系统运维、数据备份。