製品・アドオン
PagerDutyの優位性
おすすめコンテンツ
PagerDuty Advance
PagerDuty Advance
重要なデジタルオペレーション業務における生成AI機能

Event Orchestrationでインシデント管理を改善する4つの新しい方法

2025.12.09更新

    効率性とスマートなテクノロジー統合が重要視される時代において、71%のテクニカルリーダーが今年、AI(人工知能)やML(機械学習)への投資を拡大していると報告しています。企業に流入するデータ量の膨大さと、タイムリーな対応の必要性を考えると、すべてのアラートを24時間体制で監視し続けるのは現実的ではありませんし、人間の注意力だけでは精度に限界があります。むしろ、システムの過去の動作履歴に基づいたデータドリブンな予測を活用することで、インシデントの管理と対応をより効果的に行えるようになります。ここで活躍するのが、PagerDutyのEvent Orchestrationです。

    Event Orchestrationは、エンドツーエンドのイベントドリブンなオートメーションを実現することで、組織を支援します。この機能により、インシデントの検知精度が向上し、根本原因の特定が迅速化され、テクニカルチーム全体で運用成熟度を高めることができます。その結果、チームはより一体感を持って効果的に働けるようになります。

    Event Orchestrationの変数機能を使えば、他のツールやプロセスとシームレスに統合されたインテリジェントなオートメーションを構築でき、組織全体で標準化された、より的確なインシデントレスポンスが可能になります。この新しいEvent Orchestration機能は、過去のインシデントから学び、再発を防止するのに役立ちます。その結果、よりプロアクティブなオペレーション体制が実現し、テクノロジーエコシステム全体に恩恵をもたらす、スケーラブルで再現可能な成果が得られるのです。

    この新機能の4つの活用方法をご紹介します。

    1. メジャーインシデント管理のオートメーション

    多くの組織では、メジャーインシデントと優先度の低いインシデントでは対応方法が異なります。メジャーインシデントでは、異なるエスカレーションパス、ワークフロー、社内プロセスが必要になることがあります。そのため、メジャーインシデント時のオートメーションは、より個別対応的なものになりがちです。

    Event Orchestrationの変数機能を使えば、メジャーインシデントを予測し、オートメーションを通じてインシデントの管理方法を調整できるようになります。例えば、メジャーインシデントの兆候として認識している条件にイベントが合致した場合、適切なメジャーインシデントプロセスを開始するイベント数のしきい値を定義できます。Event Orchestrationは、各イベントを個別の独立したインスタンスとして扱いません。代わりに、イベントを履歴データとして活用し、時間の経過に伴うシステムの状態について情報に基づいた判断を行います。

    このアプローチは、オートメーションでメジャーインシデントを開始する従来の方法とは異なります。単一のイベントをメジャーインシデントのシグナルとして見るのではなく、最近何が起きたか、そして状況が過去のメジャーインシデントとどれだけ正確に一致しているかを把握することで、システムの状態をより精密に評価できます。

    2. リアクティブオートメーション

    多くの組織では、レスポンダーに先手を打たせるために、自動診断や自動修復に頼っています。しかし、オートメーションは自己認識能力を持ちません。最近システムに入ってきた他のイベントに対して、すでに何が実行されたかを把握していないのです。その結果、オートメーションは類似のイベントに対して何度も実行を試みることがあり、実際には問題に対する有益な洞察や解決をもたらさないことがあります。

    今では、診断が実行されたかどうかを追跡し、その結果に基づいてオートメーションのパスを変更するオートメーションを構築できます。例えば、あるEvent Orchestrationで最近診断が実行されていた場合、オートメーションは診断を再度実行する必要がないことを理解します。そして、自動修復などの追加のオートメーションシーケンスを開始します。

    このリアクティブオートメーション(オートメーションがインテリジェントにさらなるオートメーションをトリガーする仕組み)により、組織はオートメーションがいつ実行されるか、そしてそのシーケンスからのフィードバックをどう扱うかについて、より柔軟性とコントロールを得られます。

    3. ダイナミックオートメーション

    組織は、障害が発生した正確なアプリケーションやインフラストラクチャをターゲットにして、情報に基づいた形でオートメーションを実行したいと考えています。しかし、単一のイベントにしかアクセスできない場合、スタックのどの部分に障害が発生したかを把握し、それに応じてオートメーションを実行するのは困難です。

    Event Orchestrationを使えば、スタックのどの部分に問題があったかに関する情報を抽出して保存し、より精密なターゲティングのために将来のオートメーションにその情報を付加することができます。

    例えば、ペイロードからデータを抽出する変数を設定できます。イベントペイロードが特定の条件(Kubernetesイベントなど)に一致した場合、ノード情報を取り込むことができます。そして、その障害が発生した正確なノードを特定し、動的に再起動するオートメーションシーケンスを作成できます。

    4. セルフコンフィギュリングオートメーション

    何かに障害が発生したとき、何が問題だったかを大雑把に推測するだけでは不十分です。レスポンダーは根本原因を特定し、解決をすぐに開始するために、適切なトリアージ情報を即座に得る必要があります。

    このような状況では、変数機能を活用することで、組織は適切なトリアージ情報を即座に取得し、レスポンスプロセス全体を通じて自己設定するするオートメーションでシステムの障害箇所を特定できます。

    例えば、イベントが現在問題が発生しているインフラに関連している場合、オートメーションがルールを設定し、ノートなどの重要なコンテキストを追加します。

    まとめ

    この新機能により、PagerDuty内のオートメーションがよりスケーラブルになり、情報を可能な限り迅速に表面化できるようになります。インシデントの解決に要する時間だけでなく、複雑なテクニカルエコシステム全体でオートメーションを作成・デプロイするのに必要な時間も削減されます。

    このようなオートメーションの作成に興味があるPagerDuty AIOpsのお客様は、Principal Product ManagerのFrank EmeryによるHow-to TourまたはTwitchデモをご覧ください。

    まだPagerDuty AIOpsをお使いでない方は、ぜひ今日からお試しください。トイルを削減し、組織全体の効率を向上させるイベントドリブンオートメーションを構築しましょう。

    PagerDutyを14日間無料で試してみる

    700以上ものツールと連携。システム障害を自動的に検出・診断するだけでなく、適切な障害対応メンバーをアサインし、デジタル業務全体の修復ワークフローを自動化します。

    PagerDutyイメージ

    この記事が気になったら

    • Facebook
    • LinkedIn
    • twitter
    • はてなブックマーク

    PageDuty公式アカウントをフォロー

    • Facebook
    • LinkedIn
    • twitter

    関連ブログ記事関連ブログ記事

    検索検索
    タグタグ
    インシデントをより早く・少ないリソースで解決
    閉じる