を14日間無料で試してみる
700以上ものツールと連携。システム障害を自動的に検出・診断するだけでなく、適切な障害対応メンバーをアサインし、デジタル業務全体の修復ワークフローを自動化します。
重大なインシデントに素早く対応するには、発生したインシデントに対して、適切な優先度を設定することが重要です。
しかし、明確な判断基準がなければ、優先度の設定が適切でなかったり、担当者間で判断のバラつきが生じてしまったりして対応の遅れを招くこともあるでしょう。
インシデントの優先度設定において、フォーチュン500に選ばれる多くのグローバル企業が実践しているのが、ITIL(※1)が体系化した「インシデント優先度マトリクス」です。
※1:「Information Technology Infrastructure Library」の略称であり、ITサービスマネジメントに関するフレームワーク
本記事では、インシデント優先度マトリクスを活用するメリットと、マトリクスを構成する影響度や緊急度の考え方について解説します。
目次
ITILに基づくインシデント管理では、インシデントを受け付けしたあとに「インシデント分類」のプロセスを取ります。
このプロセスでは、インシデント内容からインシデントの種類や影響範囲、緊急度、難易度などを分類して優先度を設定します。
ITILインシデント分類に定義されているインシデント優先度マトリクスは、どのインシデントを優先して対応すべきかを明確にするためのフレームワークです。
インシデント管理における重要な基礎的情報を提供し、IT環境への潜在的な影響度を定義して、優先度設定のための緊急度のランク付けを段階的に示します。
ITILの緊急度・影響度・優先度に関する推奨事項に従うことで、企業はインシデント発生時に効果的な対応を実施できます。
インシデントの解消までに時間がかかるほど、ビジネスへの損失も拡大します。だからこそ、緊急度・影響度に基づいた優先度マトリクスの構築が重要になります。
インシデント管理にインシデント優先度マトリクスを用いると、以下のようなメリットが得られます。
インシデントは単独で発生するとは限りません。
インシデント優先度マトリクスを用いれば、複数のインシデントが発生した際に、どのインシデントを優先して対応したら良いかが明確になり、サービスやビジネスへの影響を最小限に抑えられます。
また、インシデント優先度マトリクスは、チームにとって実用的なインサイトと明確なガイドラインとなり、スムーズな優先度設定に役立つでしょう。
ITILは、実証されたベストプラクティスをもとに作成されています。インシデント優先度マトリクスをできる限り忠実に取り入れることで、チームはベストプラクティスを実行できます。
ベストプラクティスの一例としては、ビジネスを取り巻く環境やビジネスそのものに対するインシデントの影響を分析しながら、緊急度の高い問題の種類を定義することが挙げられます。
アラートが多すぎると、担当者を疲弊させる原因になります。
インシデント優先度マトリクスをもとにアラートノイズをフィルタリングすれば、担当者の負担を減らせます。その結果、効率的なインシデント対応が行なえるようになるでしょう。
インシデント優先度マトリクスは、SLA違反防止に役立てることも可能です。
サービスレベル要件を指針として優先度を設定すれば、適切に対応できます。
インシデント優先度マトリクスの構成要素である影響度と緊急度について、一般的なガイドラインを解説します。
ぜひ、自社の状況に沿ってカスタマイズしてください。
インシデント管理では、問題の発生順序よりも影響度に注目する方が効果的です。
影響度のレベルは、以下のような事項を考慮して分類します。
【影響度高】
【影響度低】
緊急度は、インシデントが事業に顕著な影響をおよぼすようになるまでに残された時間によって、決定されるものです。
緊急度を定義する際には、ビジネスの要求に沿って問題対応の優先順位を構築しましょう。例えば、他の問題への対応よりも、顧客サービスの復旧を優先させるなどです。
多くのIT部門が、以下のガイドラインに沿ってインシデントの緊急度を設定しています。
【緊急度高】
【緊急度低】
緊急度に基づいてインシデントを事前に分類することで、自動的にノイズにフィルターをかけられます。
これにより、今すぐ対応を必要としている問題と、多少は時間に余裕がある問題とを区別することが可能です。
優先度設定時には、タイムライン設定も同様に大切です。
SLAを満たすことを前提にしながら、迅速な対応が求められる優先度1または優先度2に分類される問題の対応期限と担当者を、チームに周知する必要があります。
設定した期限内に解決しない場合には、インシデントをエスカレーションし、どのステークホルダーに通知するべきか(または通知するべきでないか)を検討します。
「PagerDuty」は、実用的なリアルタイムデータを提供することで、チームがインシデントに適切に対処できるよう支援しています。
定義されたインシデント優先度マトリクスに従って、優先度の設定や通知のカスタマイズなども可能です。これにより、担当者のアラート疲れを軽減し、ダウンタイムやインシデントの影響を抑制できます。
「PagerDuty」の優先度マトリクスを自社のSLAの達成に活かし、サービスの質を最大限に高めましょう。
「PagerDuty」に関する資料や導入事例は、以下のページからダウンロードいただけます。
https://www.pagerduty.co.jp/resources/
また、14日間の無料トライアルは、以下のページからご利用いただけます。
https://ja.pagerduty.com/sign-up/
700以上ものツールと連携。システム障害を自動的に検出・診断するだけでなく、適切な障害対応メンバーをアサインし、デジタル業務全体の修復ワークフローを自動化します。
目次