DBA的首要重点工作是备份。小编听到或遇到太多类似的事件,发生意外事件时,发现备份工作没有做,或者备份被损坏,无法恢复。这可能导致公司采取严厉措施规定什么样数据必须保存,并得处理数据丢失的严重后果。在完美的数据世界中,DBA应该了解对恢复事件和数据丢失的要求。
在灾难发生时,RTO是允许你宕机的时间,RPO是允许你丢失的数据量。DBA的目标应该是尽可能将数据流失接近零。在制定灾难恢复计划的备份计划时,你应该假设所有其他级别的保护都失败,从备份中还原是你防御的最后一道防线。
如果你真的走到这最后一道防线,最后的备份就是你将丢失的数据量。这将帮助你确认备份的频率,如果数据丢失量的要求低,你就需要频繁备份。你应该高频率备份的唯一备份类型是日志备份。这就意味要么是完整恢复模式,或大容量日志恢复模式。
有可靠的备份不仅仅意味着只是备份,而是指知道备份可以恢复,知道何时进行恢复。这就是测试备份的用武之地了。作为最低限度,你应该使用BACKUPVERIFYONLY命令来测试备份是否可恢复。
除了验证备份之外,强烈建议使用CHECKSUM选项,对所有的备份和恢复进行验证。CHECKSUM选项执行额外的检查,可能时会确定数据库是否已损坏。如果额外的检查发现数据损坏,备份操作将失败,并提醒数据已损坏。此外,它还会对整个备份文件执行校验,这将帮助你检测是否备份文件是在创建后被损坏的。
DBA能够确保备份可恢复的最好方法就是通过执行实际的恢复进行测试。DBA应该做的第一件事情和最后一件事情都是备份。如果小编遇到新的服务器或环境,做的第一件事情就是确保所有的服务器都有备份,并成功运行。之后,会重新检查备份情况,基于实际的RPO和RTO需求制定一个灾难恢复计划。如果DBA没有做到第二步,还算情有可原,但是没有可靠的备份就是一个无可饶恕的失误。假如发生灾难或意外,DBA却没有可靠的备份,恐怕工作难保。