インシデント対応の反復作業を自動化!
PagerDuty「Incident Workflow」

高品質で安定的なITサービスの提供において、システム障害をもたらしうるインシデント管理は欠かせない重要な要素です。「サービスの中断」や「セキュリティ上の問題」といった企業にとって大きなトラブルにつながりかねないインシデントでも、適切な対応をすることで被害を最小限に抑え信頼性と顧客満足度を高めることが可能です。

しかし一方で、円滑なインシデント管理を実施するために避けては通れない作業がいくつか存在します。「社内におけるスムーズな情報共有」や「リソースの適切な割り当て」、そして「多くの手作業」などがその代表例と言えます。特に「インシデント対応に関連する会議の設定」や「関係者への適切な連絡」といった作業は、軽微な作業であるとと同時に必要不可欠な作業になります。そのためそうした毎回発生する業務を手作業で実施しているという企業も多いかもしれません。しかし、企業に致命的なダメージを与えうるインシデントに適切に対応するにあたって、常にいくつもの手作業を抱えることは、担当者の集中を削ぎ、非効率でミスの発生につながるリスクを抱えることにも繋がります。

そこで、インシデント対応における手作業や反復作業を自動化することができれば、インシデント発生原因の特定と解決にかかる時間を短縮でき、その分早く技術チームは新製品やサービスの開発に着手することが可能になるともいえます。こうした「反復作業の自動化」を実現するのが、インシデント対応時の手作業を自動化するPagerDutyの機能「Incident Workflow」です。今回の記事では、このPagerDutyをご利用中の方であればいますぐに利用が可能な「Incident Workflow」の機能についてご紹介します。

インシデント対応に必要となる手作業を自動化するメリット

インシデント対応のプロセスには、どれだけの手作業が必要になるでしょうか?「その分野に精通したメンバーへの連絡」「Web会議のセッティング」「Slackチャンネルの作成」「関係者へのステータスアップデートの共有」など、エンジニアが対応すべきことは多数にのぼります。こうした手作業による反復作業こそが自動化に最も向いた作業といえます。

反復して発生する手作業が自動化されるメリットは小さくはありません。作業の一つひとつは必要不可欠であるものの単純で簡単なものです。一方で、インシデントの度に発生するこうした手作業は、漏れなく行う必要があるうえに現場では正確に実行する必要性に伴って緊張がともないます。繰り返される手作業の自動化は、単に効率化につながるだけではなくミスの予防にもつながります。さらに、多くの手作業が自動化されることで、チームは貴重な時間と専門知識を複雑な問題解決や意思決定など、人間の介入が不可欠な重要なタスクに集中できます。チームの集中はインシデント対応の効率性を高めるだけでなく、より的確な判断とスピーディーで確実な対応につながります。

PagerDuty「Incident Workflow」機能、5つの特長

「Incident Workflow」とは、インシデントの種類に応じてこれまで対応してきた既知のアクションを踏まえてインシデント対応の作業を自動的に標準化する機能です。この機能は、以前の「Response Plays」をアップグレードしたもので、ノーコードもしくはローコードビルダーを使用してカスタマイズ可能なインシデント対応のワークフローを作成します。これにより、どのケースにも必要とされる「エスカレーション」「チームの動員」「インシデント対応の調整」といったこれまで反復して発生していた手作業を削減することが可能となります。また、「_If-This-Then-That_(_もしAであればBを行う_)」というロジックを使うことで、「対応者の追加」「サブスクライバーの追加」「カンファレンスブリッジの起動」といった頻発するインシデント対応のアクションを自動的に行うことも可能です。

特長1:「Conditional Trigger(条件によるトリガー)

インシデントの種類が変われば、対応方法も変わります。「Conditional Trigger(条件によるトリガー)」は、「優先順位」「緊急性」「ステータス」といったインシデントフィールドで別のカテゴリの対応基準が満たされると、適切なワークフローを自動的に起動します。例えば、Priority 1とPriority 2のすべてのインシデントに対して「重大なインシデント向けワークフロー」が自動的に起動するように設定したとします。ユーザーがその自動化を「他のカテゴリ(Priority 3以下)のインシデント」にも適用したい場合は、「イベントオーケストレーション」で優先順位を変更するだけで「Incident Workflow」がその変更に従って重大なインシデント向けワークフローを起動します。

また、「Manual Trigger (手動トリガー)」を設定すれば、対応者はインシデントの詳細ページから直接、他のワークフローをいつでも起動できます。「Incident Workflow」は、以下のアプリケーションから起動できます。

  • PagerDutyのWebアプリ
  • PagerDutyのモバイルアプリ
  • Slack
  • Microsoft Teams
  • API経由

特長2: CollabOpsを強化し、チーム連携をさらに効率的に!

ワークフローでは、アクションとしてコラボレーションツールの起動や操作を設定できます。例えば、「Zoom会議の起動」や「インシデントごとの専用Slackチャンネルの作成」などの設定が可能です。この専用Slackチャンネルには、すべてのインシデント対応者とインシデントの更新内容を含みます。このようにワークフローにコラボレーションツールを取り込むことで、各ツールの設定時間を短縮できチームの連携がより効率的になります。

特長3: タイムリーなコミュニケーションがより簡単に!

効果的なインシデント対応に欠かせないのが、組織内外のステークホルダーとの透明性の高いタイムリーなコミュニケーションです。インシデント発生時のビジネス面での対応計画を万全に用意しておけば、組織内のチームワークが改善され、顧客に対応する従業員も先を見越したコミュニケーションを取れるため顧客の信頼維持につながります。これを実現するのが「Incident Workflow」です。ワークフローに従業員向けの対応を追加し、ステータスアップデートの送信を自動化すれば、インシデントの状況を関係者へリアルタイムに伝えることが可能です。

特長4: どこでもインシデント対応が可能に!

「Incident Workflow」は、iOSとAndroidで入手可能なアプリ「PagerDuty Mobile」でも利用できます。「PagerDuty Mobile」があれば、席を外している時でも、犬の散歩中でも、アクションが必要なオープンインシデントの通知を受けることが可能です。どのモバイルデバイスからでも、インシデントの詳細ページから事前に設定されたワークフローを起動するだけで、適切なチームメンバーでインシデント対応を始められます。「PagerDuty Mobile」アプリで「Incident Workflow」を起動する方法の詳細については、こちらのナレッジベース情報をご覧ください。

特長5: 統合されたプラットフォームがエンドツーエンドの自動化を実現!

「Incident Workflow」をPagerDutyプラットフォームの他の自動化機能と組み合わせることで、さらに解決の迅速化と収益への影響の最小化を可能にします。例えば、「イベントオーケストレーション」でインシデント対応の優先順位を変更すると、それに従って自動的に「Incident Workflow」が起動し、同時に「Automation Actions」経由で自動診断機能が起動します。つまり、インシデントの対応者が連絡を受け、「Incident Workflow」が起動したインシデント個別のSlackチャンネルを開く間に自動診断が実行されるのです。「イベントオーケストレーション」機能のついては、こちらのBlog記事「インシデント初動対応を効率化する『イベントオーケストレーション』とは?」をご覧ください。

「Incident Workflow」でインシデント対応を標準化し、反復する単純作業から開放されましょう!

インシデント対応中、対応者は最も重要な任務、つまりインシデントの解決に集中する必要があります。しかし同時に、インシデント対応者は「Web会議の設定」や「関係者への連絡」など、解決に関連するさまざまな単純作業も行わなくてはいけません。「Incident Workflow」は、そのようなインシデント対応に必要となる単純作業を反復可能なものとして自動化することで、そうした業務からインシデント対応者を解放します。それだけでなく、インシデント対応プロセスが標準化されることで、各チームが適切なアクションを確実に行えるようになり、インシデントの解決時間が短縮されます。「Incident Workflow」をさらに詳しく知りたい場合は、こちらのナレッジベースをご覧いただくとともに、実際にPagerDutyの利用を通じて機能をお試しください。
エンドツーエンドのインシデント対応を1箇所で完結して解決できる時代を私たちは迎えています。もう別々の機能をつなぎ合わせる必要はありません。インシデント対応のさらなる効率化をお考えの方はぜひPagerDutyそして「Incident Workflow」機能をお試しください!

PagerDuty公式資料
「デジタルオペレーションの現状」独自調査レポート

エンジニアの燃え尽きを防ぐ秘訣とは?
一段と信頼性の高いシステムを顧客が求めるようになり、勤務時間外や夜間の対応など、技術チームへの要求も増しています。本レポートでは、19,000 社以上、100 万人を超えるユーザーで構成されるPagerDutyプラットフォームから収集したデータを基にしたシステム運用の”今”を解説!→ PagerDutyの資料をみる(無料)

「デジタルオペレーションの現状」独自調査レポート

この記事が気になったら

  • Facebook
  • LinkedIn
  • twitter
  • はてなブックマーク

PageDuty公式アカウントをフォロー

  • Facebook
  • LinkedIn
  • twitter

関連ブログ記事関連ブログ記事

検索検索
タグタグ
インシデントをより早く・少ないリソースで解決
閉じる