生成AIと自動化でオペレーショナル・レジリエンスを構築
〜PagerDuty Operations Cloud機能強化を発表〜

生成AIと自動化で オペレーショナル・レジリエンスを構築

今日の企業が目指す、ビジネス改革や効率化、障害に関するのリスク軽減の成否を大きく左右するのがオペレーショナル・レジリエンスです。しかし、より複雑化したシステムやシステムのノイズ、インフラのサイロ化が、ITオペレーションを脆弱化させ、オペレーショナル・レジリエンスの確立をより難しくしています。その負荷は、揺るぎない顧客体験を迅速に実現する上で必要な、企業のモダナイゼーションとトランスフォーメーション実現の指揮を取るCIOの肩に重くのしかかります。これほど多くの課題や制限がある中で、企業は目標実現に向けてどう歩みを進めていけばよいでしょうか?

このような企業のトランスフォーメーション実現の鍵と言えるのが、システム運用におけるAIと自動化の導入です。これまでにも緊急を要する重要な業務のサポートの期待に応えてきたPagerDutyは、システム運用の効率性や拡張性、レジリエンスの向上を目指してAIと自動化機能への投資を続けてきました。PagerDutyは今週、システム運用におけるトランスフォーメーションを実現し、イノベーションの迅速化をサポートするPagerDuty Operations Cloudの機能強化を発表しました。

インシデントへの場当たり的な対応やトイルを削減

この度PagerDutyは、PagerDuty Operations Cloudに生成AIの機能を加えるPagerDuty Copilotを発表しました。PagerDuty Copilotは、PagerDutyユーザーの信頼できるパートナーとして、より効率的な意思決定のための分析結果の提供、自動化のオーサリングと実行、迅速なステータスレポート作成、ポストモーテムのドラフト作成などを提供します。

PagerDuty Copilotは、チームの業務遂行をサポートするだけではなく、繰り返し発生し手間のかかるオペレーション業務を削減し、専門知識のないスタッフでも対応業務を行えるようサポートすることで企業の時間と経費削減を実現します。以下の動画ではPagerDuty Copilotが作動しているイメージをご覧いただけます。

今回発表された機能の中でも最新のイノベーションと言えるのが、チームのインシデント管理をイベント発生から解決までサポートするAIアシスタントです。Slack ベースの生成AIによるチャットボットが、インシデントライフサイクルのあらゆる段階で対応者に実用的なインサイトを提供します。診断に関する一般的な質問を予測し、トラブルシューティングの方法をステップごとにユーザーへ提供します。「何が起きているのか?(What happened?))」「何が変更されたのか?(What changed?)」「顧客へのインパクトは?(What’s the customer impact?)」といった質問への回答を得られることで、対応者はインシデント解決をより効率的かつ迅速に行うことができます。Automation Co-Author、生成AIによるステータスアップデート、生成AIによるポストモーテムの機能に加え、AIアシスタントが追加されたPagerDuty Copilotの生成AI機能は、今ならベータ版に参加いただけます。

企業のサイロ化を打破して大型インシデント管理を改善

既存のAIOpsソリューションの多くは、検証する間もなく、導入当初のアプリケーションのままアップデートもなくメンテナンスとトレーニングを続けているテクノロジーに依存しています。運用の最新化には、AIOpsの価値をあらゆるチーム、アプリケーション、ビジネスをもたらすサービスに、ワークフローやプログラムの種類を超えて拡大させる新たなアプローチが必要です。PagerDutyが、ITチームを集中型と分散型両方でサポートするAIOpsの新しいアプローチを開発したのはまさにそのためです。

PagerDutyのAIOpsソリューションは、NOCの最新化から、L0業務の自動化、大型インシデント管理の改善に至る広い範囲で実行から数日のうちにその効果を発揮します。ワンクリックで実行できる機械学習によるノイズ削減からイベント駆動型の自動化まで、PagerDutyはサービスレベルを満たし、かつサービス間の垣根を超えたグローバルな機能を提供し、インシデントとワークフローのトイル削減を実現します。PagerDutyがForrester Waveで「プロセス中心のAIOpsのリーダー」と称される理由はここにあります。

PagerDutyが今年前半に導入したGlobal Event Orchestrationにより、1人のSRE(サイト信頼性エンジニアリング)担当者でリッチメントやイベントのルーティングの管理、PagerDutyの1つまたはすべてのサービスのイベント状況に応じたセルフヒーリングの起動を行なえます。また、「同様の柔軟性をノイズ軽減機能にも」というユーザーからの声にお応えし、この度Global Alert Groupingをすべてのユーザーが使えるようになりました。このコンテンツベースのAlert GroupingのFlexible Time Windowでは、サービスの数に関わらずノイズ削減の設定が可能です。この新たなAIOps機能によりインシデントを軽減し、ノイズからシグナルを抽出することで平均修復時間(MTTR)を短縮し、インシデント領域をより正確に把握できます。詳細についてはこちらをご覧ください。

ご参考: Global Alert Groupingの設定ページ

よりプロアクティブな運用ポスチャーへの転換

インシデント発生中、対応者はツールとサービス実施状況の監視の両方に気を配り、過去のインシデントの記録を調べて問題の原因を探り対応方法を修正しなくてはなりません。このように、過去の大量のデータを調べるというアクションは、インシデント解決の迅速化には欠かせません。自動化によりデータの量とインシデント件数を削減したいと考える企業がありますが、自動化に必要な過去の情報がなければ、削減できるのはコンテキストを持たない、現在発生しているインシデントだけに限定されてしまいます。このような状況は、平均修復時間(MTTR)の冗長を招き顧客に影響を及ぼします。

Event Orchestration Variablesでインテリジェントオートメーションを構築すれば、迅速かつ的を絞ったインシデント対応を可能にする新たなツールやプロセスを通知できるため、チーム間のよりスムーズなコラボレーションを実現するツールとして汎用性も高まります。さらに、過去のコンテキストに基づいて正確に起動する「イベント駆動型の自動化」を構築すれば、過去事例の学習をもとに同じ問題の発生を防ぐことができ、よりプロアクティブな運用ポスチャーの実現につながります。さらに予想と反復が可能な成果が蓄積すれば、組織内での運用の成熟度が高まり、テクノロジーのエコシステム実現につながります。

この機能はPagerDuty AIOpsを強化するだけでなく、インシデントワークフローの実行、カスタムフィールドの追加、エンドツーエンドの駆動型自動化を強化するAutomation Actionsの設定といった、PagerDuty Operations Cloudのすべての機能をつなぐ役割を果たします。

ご参考:Orchestration Variables設定サブメニューを表示したGlobal Orchestration設定画面

まとめ

アプリケーションとデジタルサービスこそが収益実現の鍵を握る業界では、デジタルエコシステムが中断した際にチームがどう対応できるかでその企業の成長と価値が決まります。失敗を速やかに乗り越えられる能力、つまり高いレジリエンスこそが現代の企業には欠かせない能力です。PagerDutyは、AIと自動化を大規模に展開し、効率化と運用コストの削減に向けてチームをバックアップするエンドツーエンドのプラットフォームです。

PagerDutyソリューション解説動画
現代のシステム運用を取り巻く課題 / 現場エンジニアを救う処方箋とは?

システムが複雑化し、その変化も加速する中、システム運用を担う現場エンジニアの負荷は日々高まっています。
「インシデント対応」を例に、具体的に現場でどのような課題があるのかをご紹介。
そして、それらの課題をPageDutyがどのように解決できるのか、デモを交えて解説します。→ PagerDutyの資料をみる(無料)

PagerDury ソリューション解説動画

この記事が気になったら

  • Facebook
  • LinkedIn
  • twitter
  • はてなブックマーク

PageDuty公式アカウントをフォロー

  • Facebook
  • LinkedIn
  • twitter

関連ブログ記事関連ブログ記事

検索検索
タグタグ
インシデントをより早く・少ないリソースで解決
閉じる