本文来自微信公众号:经济观察报 (ID:eeo-com-cn),作者:张同,头图来自:视觉中国
半个多月前的世界互联网大会上,有人用滴滴举例:“如果滴滴的服务器宕掉了,可能你出门就叫不到车了。”没想到,一语成谶。11月27日,“滴滴崩了”相关话题上了热搜,这天深夜,上海、北京、广州多地滴滴用户反馈,滴滴出行App无法使用,地图无法加载,打不着车。直至28日下午,滴滴出行App才恢复正常。
滴滴系统故障导致的宕机时间接近12小时,赶上一个“晚高峰”和一个“早高峰”,由此也引发了不小的混乱。用户端抱怨“叫车叫到崩溃”“全勤奖被扣”;司机端也出现无法接单、计费混乱等问题。有媒体估算,滴滴系统崩溃的近12小时,损失的交易额或将过亿元,损失订单量约千万单。
滴滴出行在28日启动了复盘调查,公布了事故的起因。虽然起因是底层系统软件发生故障,并非是网传的“遭受攻击”,但无论是哪一个原因,均暴露出滴滴出行在服务器软环境的安全管理漏洞。这不是滴滴系统第一次发生服务故障。再加上近期阿里云崩溃,导致阿里巴巴旗下诸多应用宕机,这二者的叠加,引发公众对于“互联网基础设施”安全性的讨论。
对占网约车市场七成份额的滴滴出行来说,其存在的实际意义已经相当于基础设施,只不过此类基础设施并非在线下而是在线上。互联网基础设施如同日常生活中的燃气、水电等线下基础设施一样,其运营的安全性需受到同样的重视。不能总等到一个主流互联网应用程序宕机了,影响了大量用户的衣食住行了,给企业造成了不可估量的损失了,才想起做技术风险排查工作。
早在2015年也出现过同类由宕机引发的安全事故。由于员工错误操作引发断电,携程平台瘫痪近12个小时,网页版和手机App均不能正常使用,导致大量用户无法按照预定计划正常出行。这次事故促使了互联网企业硬件安全管理意识的提升。随着互联网的蓬勃发展,如今,不少互联网应用已经进入成熟发展期,硬件安全意识早已不成问题,但却在服务器软环境的安全管理上仍不免差错。
当然,对于提供服务的互联网公司来说,在安全问题上法律有明确的要求。《网络安全法》要求,建设、运营网络或者通过网络提供服务,应当依照法律、行政法规的规定和国家标准的强制性要求,采取技术措施和其他必要措施,保障网络安全、稳定运行,有效应对网络安全事件。
法律虽然有明确要求,执行上却需要企业做出更多探索。保障互联网基础设施的安全运营不仅需要管理者对运营工作的正确理解,也需要技术的支撑。技术需要大量的资金投入作为支撑,才能实现技术更迭,进而保障产品稳健运行和用户体验的上升。在互联网企业“降本增效”的背景下,如何不影响系统运行的稳定性,是每个互联网企业都需要面对和解决的问题。
互联网企业还是要补上“安全意识”这块短板,对于那些在实际意义上已经成为互联网基础设施的应用程序来说,绝不能再让“系统宕机”影响用户体验了。面对公众的疑虑,各个互联网企业需要对企业安全管理更加重视,也需要企业内部组织管理架构适配当下的互联网企业运营方式。
无论如何,此次滴滴宕机事件应该引发其他互联网公司以及通讯服务企业的警觉,要评估服务器软环境运行的安全性,及时开展技术风险排查工作,全面保障服务的稳定性,并且要准备相应的应急处理方式,尽最大努力避免类似的事故再次发生。
本文来自微信公众号:经济观察报 (ID:eeo-com-cn),作者:张同