北京时间1月18日,由网易代理的暴雪旗下卡牌游戏《炉石传说》遭遇重大故障。此次维护于1月17日凌晨1点开始,至1月18日下午18点完成。更可怕的是,《炉石传说》的数据并未恢复,备份数据库也出现故障,因此这款游戏的玩家被迫回滚至1月14日15点20分。
在《炉石传说》服务器故障公告中提到,《炉石传说》数据库因意外断电而发生故障,导致数据库损坏。虽然暴雪和网易的工程师在事故发生后立即启动修复工作,重启服务器并尝试恢复数据,但遗憾的是这些尝试由于相关数据的故障而未能成功。
线上游戏服务需要不间断、玩家数量庞大、游戏进度等数据不能丢失,这对线上游戏服务商的数据保护和业务连续性提出了非常高的要求。除了《炉石传说》服务器故障,还有很多线上游戏宕机事件,我们按照时间顺序来回顾一下。
网易多款游戏及服务无法访问
事件:2015年5月11日晚,网易旗下梦幻西游、鬼灭之刃、天谕等游戏均无法正常访问。有传言称故障原因是网易大楼发生火灾。网易官方发布声明澄清,2015年5月11日21点,因主干网络遭受攻击,导致网易部分服务暂时不可用。
补偿方案:网易旗下部分游戏产品表示将对玩家进行补偿,但具体补偿方案未知。
星辰祝福等三个服务器群出现异常
事件:6月15日凌晨,因服务器数据异常,在6月14日22点至6月15日临时维护前有在线活动的猎人,可能因服务器异常的影响而遭受损失。
补偿方案:对这三组服务器全体猎人分别发放4万银币作为补偿。
风云服务器异常
事件:2016年11月12日,风云服务器出现服务器异常,异常期间可能造成服务器临时回滚。
返利方案:如您在三国商城购买过道具,系统会重新发送道具,需您到大红路确认收货;如您在交易站购买过道具,系统会重新发送代币,完成交易。
Steam服务器故障事件
事件:12月23日,Steam开启冬季特卖,很多玩家都准备将愿望单上的所有游戏全部买下来。然而,活动开启后不到一天,很多玩家突然发现Steam出现重大故障,几乎所有服务都不可用,玩家无法打开在线模式,也无法购买任何游戏,只能打开离线模式。最重要的一点是,这次故障是全球性的,全球的Steam用户都受到影响。很快,媒体爆料称,故障是由黑客组织Phantom Squad对Steam服务器发起DDos攻击造成的。
补偿计划:未知。
Lion Roar 直播服务器停机
事件:2017年1月14日,因机房施工事故导致服务器故障,导致20:00左右狮吼直播客户端无法正常使用。
补偿方案:受影响的玩家可获得狮毛奖励补偿:用户在直播间看直播时通过右下角红包所获得的狮毛将翻倍。
通过一系列游戏服务器故障事件,我们总结了几个主要原因:
1、同时进入游戏的玩家数量过多,服务器负载过重;
2、线路挖断或电源断电;
3.黑客DDOS攻击;
4.服务器硬件问题,例如服务器过热;
DBA 是一个需要付出很多努力的工作,不然也不会有公司为了避免游戏公测期间宕机,把服务器带到寺庙开光的营销活动。从《炉石传说》事件中可以看出,事故发生在 1 月 18 日,系统恢复到 1 月 14 日,恰好是周六,这是周末的全量备份。这应该是传统的备份策略,如果系统实时备份,通过 CDP 恢复到数据库最近的可用点,就不会导致玩家丢失 4 天的进度数据。
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:https://www.fwsgw.com/a/sanguo/203084.html