某某茶叶有限公司欢迎您!
金沙棋牌在线 > 必赢棋牌官网 > 数据库运维保障

数据库运维保障

时间:2020-02-07 19:56

数据库运维保障

 

国庆假期本来是可以开开心心去玩的,但是由于某些突发情况,例如天灾导致的数据库故障的情况还是有可能出现

如果出现这种情况不但破坏了国庆假期玩乐的美好心情,节后上班也可能由于没有做好预防措施要遭遇领导挨批。

 

为了避免发生这种情况,对于公司业务系统的相关运维人员来说不能掉以轻心,一定要做好预防措施。

以下是总结的一些突发情况预防措施

 

1、做好公司业务系统的监控报警,关键时刻启动应急预案

 

2、服务器选择双电源服务器,避免单电源故障造成的服务器宕机

 

3、选择优质的机房,机房一定要有发电机,遇到台风这类天灾不能到机房正常关机或者处理的情况下,发电机非常重要

 

4、服务器配置UPS,双电源服务器,一个电源接入市电,另一个电源接入UPS,避免立刻断电的情况下服务器非正常关机

 

5、数据库做好容灾方案,保证系统的可用性,SQL Server通常选择的策略有:故障转移集群、镜像、日志传送、AlwaysOn等,根据自身需求选择合适的容灾方案

 

6、异地灾备,万一机房出口网络中断可以切换到别的机房,重要业务系统考虑两地三中心的异地灾备方案

 

7、安排运维人员值班,在类似于国庆、春节这些长假期节日里面,可以考虑让一些运维人员24小时在机房值班

 

TIPS说明

对于前四个措施,是基本要求,因为本人曾经看到过一些比较旧的机房,发电机也没有,市电供电也不是特别稳定,如果不配备双电源和UPS,那么服务器宕机可能性就会比较高

如果机房设施条件不是太好,经常停电、网络出口不稳定,那么大家应该也不会选择这样的机房,机房不稳定,公司的业务也会受到牵连。

 

对于SQL Server的灾备方案,如果资金允许的话可以购买存储,并且用SQL Server故障转移集群,数据库放在共享存储里面。

如果资金不允许又要数据不丢失,可以考虑使用SQL Server镜像和AlwaysOn,把镜像配置为高安全模式或者把AlwaysOn配置为同步模式,可以做到Failover的时候数据不丢失。

而资金不允许,但是可以容许分钟级别的数据丢失,可以考虑日志传送。

 

而一些非常非常重要的业务就需要考虑异地灾备,例如全市断电、运营商的网络出口出现问题,这时候就需要考虑切换机房。

 

对于最后一点,安排相关运维人员值班本人认为是最有效的,因为谁都说不准哪一天可能遇到地震或者水灾,这时候相关人员可能不能到机房或者公司进行应急处理

这时候只能依靠值班人员进行处理。

 

首先结合软件生命周期、项目的开展,数据库的生命周期大致可分为这么几个阶段:

其中“规划”、“开发”、“实施”所要做的主要工作如下:

  1. 规划:在立项后,对于数据库平台的软硬件选型,以及大致的数据库架构。1.1 配置多少台服务器,服务器的内存大小/磁盘空间、IOPS/CPU核数/网络带宽等;1.2 选择的操作系统/数据库产品/第三方工具,及相应版本;1.3 整体架构,比如是否考虑:HA, Scale out, load balance, 读写分离等策略。

2. 开发:开发的工作,通常是在开发/测试环境上进行的,测试结束后搬到生产环境。2.1 数据库设计;2.2 SQL编程及调试;2.3 开发过程中的SQL优化。

3. 实施:开发的数据库程序到生产环境的部署。到这里,基本是项目上线了。后面就进入了运维阶段。3.1 前期规划时数据库物理架构的部署;3.2 开发/测试完成的数据库程序部署。

接下来,对于运维工程师来说,这是你的主要工作了,我们详细介绍下:

一. 数据库运维做些什么?从上面的图来看,运维是项目上线后的工作。看看从项目上线开始,运维都做了什么。1. 部署环境1.1 数据库安装(如果服务器太多,可以选择静默安装);1.2 参数配置(操作系统、数据库实例、数据库参数);1.3 权限分配(登录、数据库用户权限)。

2. 备份/还原对于数据库来说,有个可用的备份是非常重要的,防止有数据损坏,用户误操作等造成的数据丢失。保证了数据的存在,运维才有意义,否则其他工作做的再好也是白搭。

3. 监控对于运维来说,首先要保证数据库的运行,然后就是运行中系统的性能。所以监控主要分为这两点:3.1 数据库运行状态,有没有什么数据库中断或异常、错误或警告?3.2 数据库性能,有没有什么性能问题或者性能隐患?