阅读视图

发现新文章,点击刷新页面。

弱鸡鸡的机房

某次单位进行电力监控的升级改造,要在半夜的时候断电进行操作。理论上大半夜没有作业,大家都在睡觉,这样的操作影响应该是最低的,但关键是第二天,整个单位的业务瘫痪了。因为浪潮的智能化系统挂掉了。我一整天都不知道是怎么回事,反正就好像单位那个刷车车船排队的网页无论如何打不开,理论上正常的话,单位早上8、9点就会有重车校验的图片以及说明,但是那一天一整天都没有,从调度信息来看,理论上那天是要装船的,但是车船记录都没有。我以为是微信在平板上登录了,但实际上没有,所以我退出了手机的微信。我还清楚记得那天是周日,因为那天傍晚吃过晚饭我回单位,但结果是当我准备从家里离开的时候,打开手机打开微信才发现单位同事找我要前几天的库存数据。一个管网络的人找我要库存数据,你们的数据就没有备份?后来我才知道,因为半夜进行电力改造,但是单位的服务器没有提前手动关掉,所以对服务器来说,等于是突然断电,突然断电导致数据丢失,并且出现莫名其妙的错误。

机房的升级改造之前,浪潮的数据库会出现错误,绝大多数情况都是缓存数据满了,于是新的数据没法写入,这时,你能看到非常明确的提示,接下来,网管同志就知道该如何做了,另外一个情况就是整个系统越用越慢,这种情况谁也说不清到底是怎么回事,但重启一下就好了。

电力监控改造是有计划的,但是管机房的人却少了这个心眼手动把数据库关掉。在机房改造之前,我不知道那里有多少设备、有多少UPS,直到周二我去询问情况的时候才被告知,现在的机房服务器的设备多了很多,UPS也大了很多,但现在的UPS蓄电池只能支撑两个小时。两个小时能做什么?即便机房24小时都有人值守,但可能打个瞌睡都不止两个小时了。

这一次也是一个周日,我们遇到了也说不准到底是什么原因的突然停电,而且是半夜停电,可想而知,服务器们又是突然就挂掉,因为那些UPS甚至无法支撑到天亮就全部耗尽了。停电的那一天,我第一走进机房,看到那些UPS蓄电池的放置场所我的第一个反应是为什么就只放半人高呢,又是周二,我才被告知,那个地板的承受能力也就只能在那个面积上面堆这么多蓄电池了。我感觉那堆蓄电池的占地大概几个平方。虽然堆起来密度已经不小了,但是它们却仅仅能支撑十几米一堵墙那么多服务器两个小时的电量,可能除了那些服务器以外,还包括空调。在改造之前,据说以前的UPS只能支撑20分钟。20分钟,我即便收到信息马上赶过来都赶不上,但2个小时,如果发生在半夜,同样无解。为什么要搞UPS呢?就是为了停电的时候还有个后路,但2个小时的设计等于没有路。既然升级机房的时候你要选择华为分布式的服务器,华为怎么可能不告诉你我至少得有多少UPS蓄电池支持才能持续运行多长时间。
UPS不能保证你一直没有问题,但起码得支撑到管理员到达现场处理或者远程处理。让我觉得非常不可理解的是为什么他们既然知道UPS在启动了、UPS的电量不足了,但是服务器却没有一个逐步保存关闭的程序。突然断电服务器肯定受损,而且那种受损是你无法预知到底损在了哪里。知道没有电,就进行逐步自动关闭,等于是模仿人工应急的操作,能把损害降到最低,为什么就没有这个自动自我关闭的设定呢?是华为自己没有这个设定,还是浪潮根本就没往这方面想?为什么其它的机房不会有这种问题,人家的UPS蓄电池到底用多久?别人的电路到底有多少条?为什么别人能保证当这一条电路不行的时候能切换到另外一条?哪怕都不行了以后,依然能保证服务器里面的东西安全。

周日的停电,除了让我们的生活非常痛苦以外,现在的后遗症很明显,就是浪潮的应用跟数据库出岔子了。整套智能化系统基本属于瘫痪的状态。突然停电算是意外的天灾,但是一次又一次在同一个问题上摔跤,依然没有一个确切的解决方案,这就是人祸。

半夜“机”叫

秋天还是不期而至了,原来暖暖的阳光,现在也都暗淡了。对于一个旅游城市来说已经过了旅游旺季,时隔许久在此来到石老人的沙滩,已经看不到太多的游客。每次来到海边,心情总是能放松那么一些,坐在沙滩上,哪怕什么都不干,就这么静静的呆坐着,都感觉时间安静了许多。

路上遇到一家人,迎面走来,一个小女孩蹦蹦跳跳的,大约四五岁的样子,蹦到跟前的时候说了一句:“大美女”。

跟他们擦肩而过之后,她妈妈问:“漂亮吧”。

所以,现在的 e 人真的这么奔放的吗?让我这 i 人大气都不敢出。

毕竟,上班时间找机会溜出来的,该回去公司还是要回公司的。正好,快递给送到菜鸟驿站了,顺路可以去取快递。

家里厨房的推拉门,好久之前就变得非常难用了,拉起来非常费力。上周把门拆下来看了一下,原来是底部的轮子裂掉了。

直接在淘宝,以图搜图,很容易就找到了同样外观的轮子。终于昨天下午送到了,不过在晚上安装的时候,拆开快递发现,寄过来有一个就是裂开的。

这就很尴尬了,联系卖家之后,答应给补发一个。就先酱紫吧,倒是也不是什么大问题。

其他的轮子更换还是比较顺利的,更换之后推拉起来就轻快多了,焕然一新。

这不到十年的房子,已经很多的东西开始慢慢的老化,坏掉了。进入了修补期,不过这个也确实没什么别的好办法。只能哪里出问题修补哪里,好在各种配件倒是还容易买到。

夜里正睡的迷迷糊糊的,被小姐姐给喊了起来,“你看看是什么东西发出的声音,响了挺长一会儿了”

刚想说没听到什么声音,就在这是,传来一阵有节奏的声音,“滴……滴……滴……”声音虽然不是很大,但是节奏比较稳定,感觉像是什么东西发出来的提示音。

其实,半夜能发出声音的,肯定就是某些点子产品或者某个设备。小姐姐也说声音是从机柜里传出来的。

打开机柜,看到最下面的 UPS 的显示屏是亮着的,猜测应该就是它了,但是正常情况下它没什么声音啊。点几了几下屏幕,数据来回切换的过程中,看到一个 78% 的字样,感觉应该是剩余电量的问题。但是现在家里是有电的,怎么会进入 ups 供电呢?客厅空调的显示面板还显示着当前温度 23 度,卫生间的灯也亮着。这一下忽然变得扑朔迷离起来,仔细看了下机柜里面,貌似也没什么问题。

再后来想到,是不是插座的开关跳闸了,往门口的配电箱走的时候,发现扫地的地宝也跑了出来,停在客厅的地毯上,拉开配电箱的门,果然,房间插座那个空开跳闸了。重新给推上去,所有的设备重新上电,房间里感觉亮度都提升了很多。这时候鱼缸的水泵也启动了,传来了哗啦啦的水声,怪不得,刚才总感觉挺奇怪的,那么安静。

回到床上,躺下正要入睡,耳中突然传来“啪”的一声,随之而来的是房间里各种声音又没了,又陷入了安静之中,之后就又传来了“滴……滴……滴……”的声音。看来是空开又跳闸了,回到配电箱那里,却发现怎么推也退不上去了,连续尝试两次之后,就得去找漏电的根源了。

房间里晚上的用电大户应该就是机柜了,先把机柜的电源断开,依然推不上去;随后是洗手间;鱼缸的水泵;都拔下来之后发现依然推不上去。这就奇怪了,不得不想是不是电视柜后面的问题了。把电视柜拉开,发现问题的关键了,不知道什么原因,鱼缸可能是堵了某些东西,水顺着进气口排了出来,下面插电的地方已经成了一篇汪洋,插排都泡在了水里。

把插排拿出来之后,竟然直接有水流了出来,滴滴答答。只好把鱼缸搬到了卫生间,把电视柜后面清理干净。此时重新送电一切就都 OK 了。

这看来的确不能把鱼缸随便放了,这鸡叫,比周扒皮的还坑爹,好在有各种漏电保护,不然这还不知道要出什么问题。

不过这一晚的睡眠,是让着“机”叫,彻底给毁了。

❌