戻る

数分で自動化: 停止を防ぐためのトップ 10 の評価

by ヴァレリー・ディマルティーノ 2024 年 4 月 11 日

ダウンタイムには費用がかかります。 54 年の Uptime Institute データセンター調査の回答者の半数以上 (2023%) は、最近の重大な、深刻な、または重大な障害のコストが 100,000 万ドルを超えたと回答し、16% が最近の障害のコストが 1 万ドルを超えたと回答しています。 

映画『アポロ 13 号』のフレーズ「失敗は選択肢ではない」は、史上最も有名な映画のキャッチフレーズの XNUMX つです。

NetBrain 登録ページの停止防止

ネットワーク運用でも、これは同じ考え方です。お金と評判がかかっています。失敗は許されません。

Uptime Institute のデータによると、世界中で平均して 10 ~ 20 件の大規模な IT 停止やデータセンターのイベントが発生し、深刻な経済的損失、ビジネスと顧客の混乱、評判の低下、そして極端な場合には企業の損失を引き起こします。人生。

では、冗長ネットワークがすべて組み込まれているにもかかわらず、なぜ私たちは依然としてこれほど脆弱なのだろうか?なぜ私たちは手動プロセスと事後対応のトラブルシューティングにこれほど依存し続けるのでしょうか?ネットワーク エンジニアは、サービス提供の基盤を整備するために数え切れないほどの時間を費やしていますが、定期的な施行はほとんど、あるいはまったく行われていません。問題が報告された場合にのみ、トラブルシューティングの車輪が (ゆっくりと) 動き始めます。

答えは次のとおりです。 積極的な 十分。これは、ネットワーク自動化業界に焦点が当てられていないことが原因です。解決方法を知っているにもかかわらず、同じ問題が何度も発生し続けるのは、この知識を活用してハイブリッド ネットワーク全体に自動的に適用するメカニズムが欠如しているためです。

大規模な障害によりサウジテレコム(stc)の変化が加速

2021 年、stc の重要なアプリケーションで大規模なサービス障害が発生しました。原因を特定してサービスを復元するまでに、ネットワーク運用、サーバー、アプリケーション、セキュリティ チームにわたるトラブルシューティングに XNUMX か月近くかかりました。この多大な費用のかかる停止により、インシデント管理に対する可視性の向上とより戦略的なアプローチの必要性が浮き彫りになりました。その結果、stc のグループ CTO は、エンドツーエンドの可視性を提供し、インフラストラクチャとアプリケーション全体にわたるインシデント管理を自動化する組織全体のソリューションを推進しました。

エンジニアの専門知識を取得し、それをコーディングせずにネットワーク全体にプロアクティブに適用できることを想像してみてください。 ネットワークの自動化は、ネットワーク運用の迅速な対応に役立ちますが、その知識を簡単な方法でネットワーク全体にプロアクティブに適用できるほどには進んでいません (ネタバレ注意: 今日まで)。ネットワーク エンジニアの膨大な知識を活用し、自動化プラットフォームで使用できるように保存できたらどうなるでしょうか?

毎日、ネットワーク運用チームは 評価する ネットワークのドリフト、コンプライアンス、健全性、および手動での変更を監視します。エンジニアが自動化の助けを借りてこれらの評価を定期的に実行できたらどうなるでしょうか?

関連記事