有这么一群人,不在业务的最前线,默默身藏在各个系统背后,支持业务系统的平稳运行。 有的人“白加黑”、“五加二”,坚持7×24小时的岗位坚守,做好日常运维支持工作; 也有的人争分夺秒,高效处理系统的突发情况,并通用化,采取系统升级迭代从源头保障系统运作; 更有的人在运维中处处留心,善于挖掘问题,从细节入手改善系统,提质增效… … 守初心,站好日常运维岗 在凌晨1点,浙江省宁波市北仑区温度已降至零下,“喂,程工,在吗?”在静谧的夜里,这声突兀的电话声让一名itc华东分部的系统运维人程建林立马清醒,果断从温暖的被窝出来,快速穿戴好衣服,及时回复“在的,请问有什么事?” “海气通在司机付完款之后,出现订单待支付的问题。”运管中心的业务人员急切告知。“嗯,我知道了,这是网络延时的原因,你先安抚好客户,可让客户依据支付凭证先行离开,我这边立马处理,处理好之后会通知。”程建林边回答,边连接内网服务器在后台服务器运行脚本,在经过20分钟争分夺秒的处理,快速解决问题,并通知加注员在支付界面确认。 “目前,海气通系统经过17次版本迭代升级之后较为稳定,每周仅有1-2次业务处理,itc华东分部联合运管中心提供7×24小时全时段全天候的系统运维和业务解答,确保加注业务的顺利开展。”程建林解释道。 高效率,突发运维通用化 1月6日下午4点,正值槽车加气的高峰期,海气通系统突然出现大批加注员生成不了订单生,请求失败的问题,当时面临是全国近百名客户在加气站焦急地等待,情况非常紧急。 itc华东分部开发人员朱斌楠接到该项通知后,立马冷静分析系统出现问题的源头,根据经验,推测是系统的数据库出现了问题。他立刻登录云服务器监控管理平台确认,发现数据库cpu已经100%满负荷运行,继而登录数据库及时切断多余的查询处理进程,在第一时间让系统恢复正常,保障lng在海气通平台的销售。 临时解决这个问题后,itc华东分部一方面按照规定做好运维记录,并通知培训运维人员,将此类问题的处理形成通用化处理;另一方面,在海气通的新版本里,优化代码修复该项bug,从根源上杜绝此类问题,保障业务的开展。 多留心,细微处改善问题 itc华东分部的技术人员于宏江在浙江lng接收站进行自助提气系统的日常运维中,发现人工窗口新增加了一项核对浙江省危化品运输电子运单信息的工作,需要额外花费1分钟的时间仔细核对信息,特别是在装气的高峰期会影响司机排队进程。 作为自助提气的技术负责人,他就在脑海里思考如何自动读取并核对电子运单二维码对应的信息,以保障对运载物品名、信息的校对,提升装车效率。 经过3天的调试,他提出并实现了让司机自助通过二维码扫描器快速扫取电子运单二维码信息,后台自动校对运单信息,消减了新增的电子运单核对流程额外增加的时间,从细节提升装车效率,提高用户体验感,并不断完善优化自助提气系统在接收站的应用效果。 “运维工作,更多的是保障工作,确保系统的正常运行,维护客户的体验感,这是我们运维人的初心与使命。”itc华东分部运维室主任申屠晓东说。 |