简要分析B站点服务器故障的原因和解决方案
浏览:358 时间:2021-11-9

7月13日23点左右,B站的客户和网页都发生了访问故障。无法打开。过了一会儿,“B站崩塌了”的话题也突然浮出水面。

23点45分左右,B站的主页端和App恢复正常。14日凌晨,B站的推特发表道歉声明,称部分服务器室发生故障,无法访问。这次事故可能是服务器的故障。

服务器的头是什么?

服务器密码是指由于某种原因服务器无法正常运行,导致网络无法使用。对于网站来说,服务器的更新带来的影响很大,不仅影响用户对网站的正常访问,还影响网站搜索引擎上的排名和外部品牌的形象。

服务器发生的原因

1.服务器环境的客观原因

机房突然停电,温度太高的话,服务器会死机,切断电源,这种情况发生的概率很小。正规的IDC制造商正在进行预防措施。

2.无法承受服务器的负荷。

这是比较常见的情况,由于网站流量突然大量增加,或受到攻击,受到程序中毒等,导致服务器压力骤增,造成资源枯竭、冻结的情况。

3.不合理的应用程序

如果公司为了减少成本的投入,借用一些配置和性能低的服务器,在这样的服务器上安装一些大型软件的话,很容易造成服务器过载运行,发生故障。

此外,环境设置、错误程序、数据库丢失等诸多细节可能会导致服务器的丢失。

服务器解决方案

1.共享存储集群

除了单个机器的单箱外,还可以通过追加一台备用主机,构建基于共享内存的热准备集群。增加一台物理服务器作为服务器的设备,在备用设备上配置业务系统,共享热存储集群产品,从而实现应用的高可用保护。在主机上运行的系统发生异常故障时,为了保证应用服务异常、硬件设备故障等网站的连续运行和访问性,可以将系统切换到备用主机。

2.数据镜集群

通过配置两台服务器,其中一台作为主机,通过活动Ip向外部提供服务,主机生成的数据直接写入主机的本地盘,通过网络实时传送到准备机保证两台服务器数据的一致性。而且,如果主机发生故障(服务器故障、应用系统故障、网络故障等),主机在保证数据完整性的前提下,将数据库切换到备用机运行,继续向外部提供服务确保生产管理系统的持续运营。

3.切换解析密码

将分析面向多个Ip,实现您的切换,确保网站的持续访问。中科三者智能云分析系统在发现目标服务器的密码时,为了维持网站的可用性,可以迅速切换到事先配置的备份服务器进行解析具有监控和切换功能,允许用户通过原始域名访问正常运行的备份服务器。

4.远程灾害

根据系统环境、网络环境,配合灾害的需求,构建远程灾害对策。将管理系统生产服务器的数据实时复制到机箱服务器,确保两台机器数据的一致性。当主服务器发生故障时,可以通过备份服务器快速恢复服务系统。如果当地的机房完全瘫痪,可以通过灾害应对住宅公网Ip映射服务,对外提供服务。

5.云容灾害

将生产中心的数据和业务实时准备在云端,如果发生生产中心事故,可以迅速利用云惠系统及时接收业务。在不同区域的云之间,构筑数据和业务上的准备,最大化业务系统和数据的安全。

6.两架双层架子

为了实现多个功能模块之间的相互协作和服务器、磁盘阵列、存储信道等软硬件的完整容积,使用多功能双机壳解决方案为用户提供高容错性、构建高安全性、高性能的集群平台。为用户构建零数据丢失并应用高可用保护的高级集群灾害方案。

B站在短时间内解决了故障,恢复了网站的正常访问,但是这次事故给B站带来了严重的影响。不仅影响了用户的正常访问,B站的股价也在短线内下跌。因此,要做好服务器的防护措施,维护政府和企业的网络安全,保障业务系统的持续性和访问性是极其重要的。