根据 Splunk 报告,停机每年给大型公司造成 4000 亿美元的损失

一份新报告发现,意外停机每年给全球最大的公司造成 4000 亿美元的损失,约占其利润的 9%。这相当于每分钟系统故障或服务质量下降都会造成约 9,000 美元的损失。

数据管理平台 Splunk 发布的这份报告还显示,福布斯全球 2000 强企业的收入需要 75 天才能恢复到事件发生前的财务状况。

停机直接导致经济损失,包括收入损失、监管罚款和纠正问题员工的加班工资。报告还揭示了需要更长时间才能产生影响的隐性成本,例如股东价值下降、开发人员生产力停滞和声誉受损。

《停机隐性成本》报告调查了 53 个国家/地区和各个行业的全球 2000 强企业中的 2,000 名高管,包括首席财务官、首席营销官、工程师以及 IT 和安全专业人员。他们深入了解了停机的根源、停机如何影响他们的业务以及如何减少停机。

停机原因包括与网络安全相关的人为错误

大型公司遇到的停机事件可以分为两类:安全事件(例如网络钓鱼攻击)或应用程序或基础设施问题(例如软件故障)。报告称,全球 2000 强公司平均遭遇 466 小时的网络安全相关停机时间和 456 小时的应用程序或基础设施相关停机时间。

作者写道:“虽然大多数系统的可用性为 9 的多个数,但数百个(甚至数千个)系统的停机时间加起来也是相当可观的。”

受访者指出,停机事件的最大原因是与网络安全相关的人为错误,例如点击网络钓鱼链接。其次是与 ITOps 相关的人为错误(例如基础设施配置错误、容量问题和应用程序代码错误)。平均需要 18 小时才能检测到因延迟等人为错误导致的停机或服务降级,然后再花 67 到 76 小时才能恢复。

查看:如何使用多因素身份验证来预防网络钓鱼攻击

软件故障是造成停机的第三大原因,随着企业采用更复杂的开发和部署实践,软件故障的风险也随之增大。第四大原因则是恶意软件攻击。

报告显示,超过一半的高管知道其组织停机的根本原因,但选择不去解决。这可能是因为他们不想增加遗留系统的技术债务,或者有计划停用有问题的应用程序。此外,只有 42% 的技术高管选择在停机事件发生后进行事后分析以找出并缓解原因,因为这可能很困难且耗时。

全球 2000 强企业列出的常见停机原因。图片来源:Splunk

停机的直接成本

收入损失是停机事件造成的最大损失,全球 2000 强企业平均每年损失 4900 万美元。第二大损失是监管罚款,高达 2200 万美元,因为许多地方对停机时间都有严格的规定,例如欧盟金融部门的《数字运营弹性法案》。

其他重大成本损失包括修复品牌声誉。据首席营销官称,开展必要的品牌信任活动平均花费 1400 万美元,修复公众、投资者和政府关系又花费 1300 万美元。完全恢复品牌健康大约需要 60 天。

尽管网络专家提出了建议,但 67% 的首席财务官仍建议董事会支付赎金以摆脱勒索软件攻击,无论是直接向犯罪者支付,还是通过保险、第三方或三者同时支付。全球 2000 强公司每年支付的赎金总额高达 1900 万美元。

信息图显示了停机的直接成本以及每年给全球 2000 强公司造成的损失。
停机的直接成本以及每年给全球 2000 强企业造成的损失。图片来源:Splunk

停机的隐性成本

除了停机造成的直接经济损失外,受访者还提到了其他一些代价高昂的连锁反应。例如,28% 的受访者表示停机事件降低了股东价值,平均股价下跌 2.5%。大型公司的股价平均需要 79 天才能恢复到之前的水平。

停机事件的其他隐性成本包括产品上市时间延迟和开发人员创新停滞,分别有 74% 和 64% 的受访者提到了这一点。后者是由于技术团队从高价值工作转向应用补丁和参与事后分析。同样,在营销部门,停机会导致团队和预算转向危机管理,因此其他领域的生产力会下降。

40% 的受访者表示,客户终身价值也会受到停机的影响,因为停机会对客户体验产生负面影响,从而影响他们对组织的忠诚度。事实上,29% 的受访公司表示,他们知道事故会导致他们失去客户。

查看:AT&T 中断事件对组织在客户沟通和 IT 最佳实践方面有何启示

企业如何避免停机

韧性领袖的建议

Splunk 报告揭示了公司可以避免停机的多种方法,要么是因为受访者认为这些方法很有帮助,要么是因为排名前 10% 的公司展示了应对停机的能力。

后一类公司,即所谓的“韧性领导者”,可多保留 1700 万美元的收入,少支付 1000 万美元的罚款,节省 700 万美元的勒索软件支出。它们从网络安全和应用程序或基础设施相关停机中恢复的速度分别比平均水平快 23% 和 28%。因此,糟糕的客户体验等隐性成本的影响较小。

与其他接受调查的组织相比,复原力领导者在某些领域的投资更多,这些领域包括:

  • 安全工具: 再多 1200 万美元。
  • 可观察性工具: 再增加 240 万美元。
  • 额外的基础设施容量: 再多 800 万美元。
  • 网络保险费: 再多 1100 万美元。
  • 备份: 再多 1000 万美元。

生成式人工智能还可用于减少停机时间,因为它可以为团队提供快速恢复在线所需的信息。报告发现,弹性领导者扩大人工智能功能的使用速度是其他受访者的四倍。此外,74% 使用独立人工智能工具的公司和 64% 将人工智能嵌入现有工具以解决停机问题的公司认为人工智能大有裨益。

Splunk 提供的提示

报告的作者还根据他们的专业知识提供了避免停机的提示。

  • 制定停机计划。 检测每个应用程序,按照运行手册检查中断情况并确定责任工程师。进行桌面练习和演练。
  • 进行事后分析。 可观察性工具可以更轻松地隔离根本原因并实施修复。
  • 建立明确的数据治理政策。 有关知识产权的规则,特别是将其输入大型语言模型时的规则,将保护组织免受数据泄露。
  • 连接团队和工具。 共享工具、数据和背景的团队将能够更轻松地协作、解决问题并找出停机的根本原因。
  • 采用预测分析。 人工智能和机器学习驱动的解决方案可以识别模式并在可能发生停机时向团队发出警报。

思科市场营销总裁兼 Splunk 总经理 Gary Steele 在新闻稿中表示:“业务中断是不可避免的。当数字系统意外出现故障时,公司不仅会损失大量收入并面临监管罚款的风险,还会失去客户信任和声誉。”

“一家企业如何应对、适应和发展颠覆性变革,是其作为领导者脱颖而出的关键。弹性企业的基础构建模块是统一的安全性和可观察性方法,以便快速检测和修复其整个数字足迹中的问题。”

1718180551
#根据 #Splunk #报告停机每年给大型公司造成 #亿美元的损失
2024-06-12 00:45:57

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​