01
此次事件波及多个国家和地区,涉及航空、银行、学校、政府机关以及个人用户。根据FlightAware的数据,本次事故造成了Frontier取消了131个航班、延误223个航班,占其总航班数量的近30%;西日本旅客铁道公司列车行驶信息无法获取,澳大利亚航空公司、政府服务、银行企业、超市自动收银等业务均收到影响,事故范围覆盖全球各个国家。
02
国内公共服务在这次“微软蓝屏”故障中未受影响,航班、高铁、银行服务等依旧如常。据央视新闻报道,事件发生后,国航、东航、南航等多家航空公司表示,航班未受到大范围系统技术故障影响,航班运行正常,北京首都机场和大兴机场出发的国际航班也正常运行。
此次影响全球的windows蓝屏事件,为何国内少有波及,笔者认为
一方面:CrowdStrike是个典型的B2B企业,主要面向企业客户,所以本次个人家庭电脑不受影响,国内受到波及的主要是少数使用CrowdStrike软件的外企。
03
回顾整个事件,最直接的原因是CrowdStrike未经充分测试就将错误的配置推送给了用户,但是对于整个软件系统来说,其健壮性不能依赖某个组件不出问题。
在保证系统健壮性方面,国内操作系统厂商已早有成熟方案。以统信UOS为例:
首先,统信UOS的更新升级执行灰度升级策略,每次小版本更新时,均会设计试验局点,进行充分的环境测试。在对外推送更新时,会配置灰度策略,调查收集各批次用户升级成功率与升级中的问题,避免致命问题爆发式扩散。
其次,对于企业内部用户,统信UOS也提供了内网升级平台与域管平台,前者支持灰度升级管控,方便内网客户对其自身设备进行分批次升级管理。后者可配置安全管控策略,对软件的升级行为进行管控,支持企业管理员通过配置与下发网络与更新策略,来限制软件的更新行为,从而保障终端软件在企业内部可管控的基线一致性和系统稳定性。
此外,即使在更新中发生了问题,统信UOS也提供了健壮的A/B分区恢复方案,实现了从操作系统内核至上层软件的全面回滚机制。这样,在新系统出现故障时,用户可以在数十秒内回滚系统,立即恢复业务。
最后,统信UOS也通过UAPP计划与各安全厂商持续协商建立安全接口机制,划分操作系统和安全软件边界,以便安全伙伴基于统信UOS提供的USPI等安全接口进行安全功能开发,为用户提供更稳定、更兼容的安全解决方案,共同建设产业的安全生态。
操作系统的更新,尤其是规模化的端侧系统升级,需要操作系统厂商、生态伙伴与用户单位预先部署、协同规划、细致实施,这样才可以达到可靠、安全、健壮的升级目标,以本次事件为鉴,让我们大家一起努力,共同打造中国的操作系统创新生态。
华芯创辉从硬件到系统全面支持国产化,携手共创中国自己的操作系统生态