初年度の節約額
- MTTR 優先度の高い事案への対応時間が60時間から数分に短縮
- 34,576件のチケットを分析。手動による初回対応なしで月間1,468件を処理。
by オリビア・ワン 2026 年 4 月 30 日
2024年のIT障害により、ある米国の航空会社は5億ドル以上の損失を被った。その2年前には、別の航空会社で運用上の問題が発生し、7億5000万ドル以上の損失が発生した。米国会計検査院は、3年間で米国の航空会社12社のうち11社で34件のIT障害が発生したことを記録している。これらは孤立した事象ではなく、同じ運用パターンに従っている。構成がずれる。完全な検証なしに変更が適用される。アラートが発報され、NOCは事前のコンテキストなしにチケットを発行する。上級エンジニアが呼び出される。数時間が経過する。
航空業界は、フライトの運航停止により年間34億ドルの損失を被っています。これらの運航停止の大部分は予防可能です。この記事では、その根本原因、航空会社と空港におけるリスクの違い、そして継続的なネットワーク自動化が実際に何を変えるのかを検証します。
直接的なコストは、取締役会レベルの予算規模にまで及ぶほど大きく、大手航空会社では単一の事故で数億ドルに達することもある。しかし、航空運航責任者が日々プレッシャーを感じているのは、間接的なコストの方だ。
運航の中断は、運輸省(DOT)の欠航実績指標に基づきペナルティの対象となります。運航不規則(IROPS)からの復旧、すなわち乗客の再予約、乗務員の再配置、航空機のルート変更には、ネットワークに依存する連携システムが必要です。ネットワークが不安定な場合、単一の気象事象や機器の不具合によるコストは増大します。アマデウス2024のデータによると、フルサービスキャリアの50%が現在、ネットワーク管理の近代化を優先しています。これは技術的な好みからではなく、事後対応型の運航によって維持不可能になった運用コストへの対応策としてです。
空港当局にとって、財政構造は異なります。ターミナルがダウンすると、着陸料、売店収入、駐車場収入が途絶えます。コンコースの障害は地域ニュースですが、ターミナル全体の障害は全国的なニュースになります。空港当局の理事会は委員や一般市民に対して責任を負っており、重大な事故発生後に求められる監査要件自体がコストを生み出します。ネットワーク障害そのものにかかる費用は、その後の運用対応や評判の低下にかかる費用よりも少ない場合が多いのです。
航空業界のIT障害のほとんどには、設定のずれ、変更ミス、そしてインシデントが発生するたびに最初から対応をやり直すネットワークオペレーションセンター(NOC)という3つの根本原因が共通している。
構成ドリフト
ネットワーク機器は、本来の性能を発揮する状態から徐々に逸脱していく。ネットワークの動作を定義する検証済みの基準となる「ゴールデンコンフィギュレーション」は、パッチの適用、機器の追加、そして一時的な変更の蓄積によって、時間とともに劣化していく。継続的な評価を行わなければ、こうした逸脱は障害が発生するまで見過ごされてしまう。
変更エラー
変更エラーは、あらゆる業界において生産上のインシデントのかなりの割合を占めています。航空ネットワークは特に影響を受けやすく、メンテナンス期間が短く、その期間中にロールバックが発生すると、チェックインシステムや手荷物システムに影響が即座に及ぶためです。変更前の検証は、多くの場合、手作業で行われ、不完全であったり、時間的制約のために省略されたりします。
画面が真っ暗な場合のトリアージ
アラートが発報され、NOCに事前のコンテキスト(現在のマップ、パス分析、最近の変更記録など)がない場合、診断に時間がかかります。米国の大手通信事業者は34,000件以上のチケットを分析し、 MTTR 自動化以前は、優先度の高いインシデントへの対応に60時間もかかっていた。重大度1のインシデントを担当する上級エンジニアは、アラート自体以外の情報がほとんどない状態で業務を開始することが多かった。
これら3つのパターンは、航空会社や空港当局を問わず一貫して見られる。ネットワークの複雑さ、テナントモデル、規制上の責任の所在はそれぞれ異なるが、障害発生の順序は同じである。
IT関連の議論では、航空会社と空港はしばしば単一の航空関連カテゴリーとして扱われる。両者は同様に広範なリスクにさらされているが、ネットワーク環境は十分に異なっており、運用上の優先事項も異なる。
航空会社
航空会社は、収益に直結するプライベートネットワークを運用しています。予約、チェックイン、手荷物、乗務員のスケジュール管理、および運航管理システムはすべて、ハブとスポークに分散された同じインフラストラクチャを共有しています。主な評価指標は、運航停止時の運航状況と運航中断(IROPS)からの復旧コストです。ネットワークの信頼性は、運航中断が数日間にわたる復旧作業に発展するか、あるいは1シフト以内に収まるかを直接左右します。
空港
空港は、航空会社が顧客ではなくテナントとなる公共ネットワークを運営しています。このネットワークは、ITシステムだけでなく、手荷物コンベア、アクセス制御、搭乗橋、空調設備、フライト情報表示システム(FIDS)、共通旅客処理システム(CUPPS)、ビデオ監視、POS、売店ネットワークといった運用技術の基盤となっています。空港当局のネットワークに問題が発生すると、数十もの航空会社テナントに同時に影響が及ぶ可能性があります。ITチームは、システムの稼働時間だけでなく、当局の理事会、そして多くの場合、連邦規制当局に対する監査対応についても責任を負っています。
どちらの環境も、継続的なネットワーク評価、自動化されたインシデント対応、および統制された変更管理を必要とします。具体的なアプリケーションは異なり、Cisco ACIファブリックの可視化とServiceNowトリガーによるテナント管理が用いられます。 runbook空港向けのサービス、航空会社向けのIROPS指向の経路分析とDOTコンプライアンス監査など、運用基盤は同じです。
航空ネットワーク運用における課題は、監視範囲の不足ではない。ほとんどの航空会社や空港当局は既にSolarWinds、ThousandEyes、または同等の可視化ツールを導入している。課題は、アラート発生後の対応にある。
継続的なネットワーク自動化は、3つの根本原因それぞれに直接対処します。
これらの結果は、既存のツールを置き換える必要がないことを示しています。 NetBrain 既存のITSMおよび監視スタック上に継続的な自動化レイヤーとして動作します。ServiceNow、Splunk、SolarWinds、ThousandEyesはすべて双方向で統合され、アラートがトリガーされます。 NetBrain 診断情報と診断結果は、チケットに自動的に添付されます。
パターンは破れる可能性がある
航空ネットワーク運用は、事後対応型の管理では限界がある。ドリフト、変更エラー、画面が真っ白なトリアージという3つの障害モードは時間とともに悪化し、監視ツールだけではどれも対処できない。この状況を変えるのは、逸脱が深刻化する前に検知する継続的な評価、画面が真っ白なトリアージを排除する自動化された初期対応、そして厳しいメンテナンス期間を乗り切るための変更検証である。
既にこのシステムを実運用している航空会社や空港は、その効果を実感している。一方、未だに事後対応に終始している組織は、導入しなかったことによるコストを痛感している。
NetBrainの重大発表はあまりにも大きかったため、Sphere を占拠するほどでした。しかし、ここは Cisco Live なので、Cisco が何を言ったのかについても話しましょう。基調講演で Jeetu は…
NERC CIP準拠自動化とは、NERCの重要インフラ保護基準およびFERCの2023年内部ネットワークセキュリティ監視規則の要件を満たすために、ネットワーク自動化を継続的に使用することです。
ネットワークおよびツールチームのための実践的な統合ガイド ほとんどのエンタープライズネットワーク運用チームは、多数のツールを活用しています。監視ツールは異常を検知し、ITSMはチケットキューを管理し、IPAMはアドレスデータを保持します。
当社は、ユーザーエクスペリエンスを向上させるために、コンテンツをカスタマイズし、ウェブサイトの使用状況を把握するためにクッキーを使用します。当社のウェブサイトを使用することにより、お客様は当社のプライバシーポリシーに従ってすべてのクッキーに同意するものとします。