6月17日下午16点30分左右,新浪微博机房宕机故障导致该平台全线瘫痪,此次故障持续约一小时,事后新浪微博官方方面表示,此次故障的原因为“外部机房整层掉电”。大部分业内人士对此也议论纷纷,很难想象到拥有着庞大用户量的新浪微博数据中心会因电力保障问题而宕机。
本次事故的发生也再次引起业内人士对于机房基础设施与运维的关注与重视,电力作为机房运行的核心部分,在一些高级别的机房中,一般采用双路市电与UPS保障其冗余性。尤其是像新浪数据中心这样高级别的机房,只有在两路电源同时断电情况下,UPS才会自动启用并发出警报,如果机房工程师未能及时处理,而UPS电力耗尽,最终则会导致数据中心宕机。
此次新浪宕机事件的发生,也引发了其他中小型企业在为服务器选择机房方面的顾虑。那么,选择机房时,应该注意哪些问题呢?
1. 机房级别
在选择服务器所放置的机房时,需了解该机房是否达到国际认证标准,Uptime Tier认证在业内是认同度最高的标准,一般可以获得该认证的数据中心都需要投入大量的资金建设,也是由一些比较有实力的运营商来维护,因此其机房的运维技术、应变能力以及基础设施配置都会相对较高,容错性较强,宕机概率极低。很多自建机房由于投入资金有限,很难达到该标准,基础设施冗余性不足,虽然运行成本较低,但是服务器稳定性较难获得保障。
2. 运营商、服务商的运维技术水平
即使基础设施冗余性足够强大,也可能由于人为原因,如工程师未能及时获取预警信息、技术能力有限、应变经验少等导致了服务器宕机现象,而本次新浪微博宕机事件的背后,很大可能性就是因为这个问题。在选择机房、网络服务商时,应更关注其技术服务以及处理问题的应变能力。具备专业认证的服务商,在技术方面能够获得较大的认可。
互联先锋作为资深的海外网络服务商,具备IDC/ISP双证专业服务商,长期与海外优质供应商、运营商合作,技术人员对接速度快,能够较快处理突发问题,运维经验丰富。精选5大洲30多个主要国家的Tier3+级别机房,冗余性强,能够有效减少服务器宕机概率,确保企业服务器运行稳定,避免因宕机而造成不必要的损失,最大程度保障企业利益。