DevOpsを推進する
生成AIによる 3つのPagerDuty新機能

DevOpsを推進する 生成AIによる 3つのPagerDuty新機能

世の中では、生成AIの利用が活発になっています。しかし、システム運用で最も重要なのは「信頼性」であり、ミッションクリティカルなシステムを前にして、生成AIによる誤ったアウトプットや判断は許されません。一方で、生成AIには計り知れない可能性があるのも確かです。

そこでPagerDutyでは、このたびPagerDuty Operations Cloud™︎に3つの新機能を追加しました。PagerDuty Operations Cloud™︎は、予期せぬ重大な事態において、問題の検出、分析、対策を自動化するプラットフォームです。エンジニアやIT運用チームが、予期せぬ事態を迅速に解決するために必要な機能がそろっています。このPagerDuty Operations Cloud™︎で新しく提供される機能は、「信頼性」を保つ形で生成AIの能力を活かし、皆様に新しい価値を提供します。

この記事では、AIOpsソリューションの業界大手であるPagerDutyの生成AI活用への取り組みと、PagerDuty Operations Cloud™︎に追加された生成AIを活用した3つの新機能を紹介します。

生成AIによる自動化の実現、DevOpsの重要性の高まり

生成AIとは

「従来のAI」は、自動化を目的とし、おもに構造化されたデータを学習して結果を出力するものでした。一方の「生成AI: Generative AI」は、構造化されていないデータセットを用いて情報のパターンや関係を学習し、文章や画像、音楽といった幅広いコンテンツを生成します。昨今、生成AIの精度が向上し、コンテンツ生成の速さや使いやすさなどからその活用が急速に広まっています。

生成AIによる自動化の実現性の向上

コード生成からインシデント対応のアシスタントまで、生成AIの可能性は計り知れません。生成AIは、私たちが日常で使う自然言語を用いるため非常に直感的でわかりやすく簡単に使えます。そのため生成AIを使うことは、自動化の可能性を最大限に引き出し、飛躍的に進化させる機会につながります。自動化は、時間とコストを削減して生産性と生産能力を向上させます。しかし、生成AIが登場する以前の自動化の実装では、抽象的な概念の要望が機械にとって難解で処理できず、実現が難しいこともありました。
ところが生成AIの登場により、これまで専門的な企業が請け負っていたような高度なレベルの自動化を、専門外の人でも実施できるようになり自動化の実現性が格段に高まりました。

DevOpsの重要性の高まり

一方で、今後開発スピードが加速してソフトウェアの数が増大すれば、システム全体の複雑性も高まります。複雑なシステムを運用して信頼性の高いサービス提供を実現するためにも「開発チームと運用チームが一体となり、システムの開発および運用を円滑に進めるDevOpsの実現」が今まで以上に重要となるのです。

DevOpsを推進するPagerDuty Operations Cloud™︎の生成AIを活用した3つの新機能

DXが加速し、すべてのビジネスがデジタル化した今日では、優先順位をつけて影響の大きい作業や緊急性の高い仕事に集中して取り組み、正確なシステム運用を行うことがビジネスの継続において重要です。そういった中、一刻を争うミッションクリティカルな危機対応に最も重要なのが「信頼性」です。システム障害・システムダウンが許されない状況では、生成AIによる誤ったアウトプットや判断も許されません。

それに対し、長年にわたってAIおよび機械学習に取り組んできたPagerDutyは、AIOpsソリューションの業界大手ならではの視点として、生成AIそのものではなく生成AIを使って がPagerDutyが提供するサービスPagerDuty Operations Cloud™︎の価値をどう高められるか、という視点で生成AIを開発に組み入れています。その結果、PagerDuty Operations Cloud™︎に追加された生成AIを使った次の3つの新機能は、DevOpsの推進に欠かせないシームレスな情報連携と作業の効率化、そして高度な自動化の実現をもたらすようになりました。

・機能1:ステータスアップデート情報の作成
・機能2:インシデント事後分析レポートのドラフト作成
・機能3:高度なプロセスオートメーション

機能1:ステータスアップデート情報の作成

インシデント対応は事前に計画できない業務であるため、解決においては、チーム間でどれほどコミュニケーションと連携がとれているかが重要になります。インシデント対応で奨励されているベストプラクティスは、ステークホルダーとリーダーに少なくとも30分ごとのステータスアップデートを行い、全員が同じ理解を持って解決にあたるという方法です。ただし、情報のアップデートを高い頻度で行うとフル稼働しているチームにより高い認知負荷を与えます。PagerDutyのユーザーのなかには、大型のインシデント発生時に、ステータスアップデートのためだけに専任スタッフを3名配置している例もあるとのことです。

このような状況は、生成AIを使った新機能で解決できます。生成AIを組み込んだPagerDutyの「ステータスアップデート」機能では、チームの誰に何を伝えているかという情報のサイクルを保存し、わずか数クリックで担当者ベースのステータスアップデート用のドラフトを生成できます。この生成AIを使った新機能は、発生中のインシデントデータをすべて処理してサマリーを自動生成するだけでなく、イベント、進捗、課題についての主だったインサイトも提供します。生成AIを用いたステータスアップデート情報の生成により、チームは時間を節約でき、課題解決の実務に集中できるだけでなく、インシデントマネジメントのワークフローの強化とコミュニケーションの合理化が可能になります。

機能2:インシデント事後分析レポート(ポストモーテム)のドラフト作成

インシデントの事後分析は優れた運用の基本であり、サイト信頼性エンジニアリング(SRE)で推奨されるベストプラクティスです。失敗点や改善点に加え、最も重要なこととして、同じミスの繰り返しを回避する方法を学べます。しかし、事後分析の文書化は時間をかければ可能ですが、とても大変な作業です。なぜなら、グループレビューに必要な関連するデータポイントをすべて集めるなど、長時間にわたる(場合によっては心理的にもつらい)手作業だからです。

では、バーチャルのチームメンバーがインシデントを最初から最後まで追跡し、実際のチームは客観的な事後分析レポートをタイムリーに作成するだけでよい、と言われたらどうでしょう。PagerDutyなら、それが可能です。生成AIを使って、包括的な事後分析レポートのドラフトを自動で生成します。生成AIを用いた新機能では、インシデントが解決するとユーザーは事後分析レビューの生成を実行できます。通常であれば時間のかかるインシデント関連のデータ(ログ、メトリック、SlackやMicrosoft Teamsでの会話など)の収集をリアルタイムに行い、「重要な発見」「根本原因」「改善範囲」をハイライトした詳細なレポートを作成します。さらに、同様の問題発生を防ぐための推奨アクションリストも作成します。

この機能は時間を節約するだけでなく、重要な学びを得るための出発点を提供します。そして、それは継続的な改善を実行する文化の醸成につながり、チームが将来の利益のために使う時間を増やします。この流れは、ミッションクリティカルな業務に携わる上で必要とされる生成AIにおいて、「人間を中心に置く」アプローチが重要であるという考えに立ち返らせてくれます。インシデントの自動事後分析では、ステークホルダー全員にシェアする前に、専門的な見解や判断力、監視能力を備えた人間がレポートを検証して修正する必要があります。

機能3:高度なプロセスオートメーション

PagerDuty Operations Cloud™︎では、予期せず発生した問題をより迅速に処理・解決するための自動化機能として、ワークフローの自動化用スクリプトとプラグインを提供しています。このプラットフォームは、クラウドかオンプレミスかにかかわらず、AnsibleやTerraform、Power Automateの実行、インフラの自動化に日々使用されています。ただし、スクリプトやツールが手に入らない場合には、わざわざスクリプトを作成する必要がありました。

しかし、もうその必要はありません。生成AIを組み込んだPagerDutyが、ユーザーのニーズに応じた自動化を実現する共同開発者になります。まるで、チームに開発者がもう1人増えたかのように、ユーザーの目的を実現する手段を研究し、自動化を進めてくれます。スクリプト言語の指定や、ほかの言語への変更も可能です。さらに、かつてはスクラッチでしか開発できなかったものを、機能や柔軟性を損なうことなくローコードで実現できるようになりました。例えば、ユーザーが「特定のユーザーを、Oktaのグループに加える自動ワークフローを作成して。実行時にユーザーをEメールとグループで特定できるようにして」と指示して生成ボタンを押せば、あとは設定が完了するのを待つだけです。

PagerDuty新機能ベータプログラムのウェイトリストに登録して進化を体験ください

生成AIの学習スピードが上がり、手作業を自動化することで生産性が向上した結果、私たち人間の創造性を高める、そうした生成AIの旅はまだ始まったばかりです。新しいテクノロジーにリスクはつきものですが、私たちPagerDutyのDNAにはそのリスクにうまく対応する能力が備わっています。それは、PagerDutyのプラットフォームにAIや機械学習、自動化といった機能が導入されたこの数年間を見れば明らかです。だからこそ、「人間を中心に置く」ことはAI関連業務の中核的な考え方であり、インシデント対応がどれだけ迅速になっても、「忠実性」「安全性」「正確性」が重要であり続けるのです。

PagerDutyは、生成AIに関連する機能を開発するにあたり、より良いサービス実現のためにフィードバックやご意見をお待ちしております。生成AIを活用した効率的なインシデント対応をお考えの方は、ぜひ本機能を先行して使えるベータプログラムのウェイトリストにご登録下さい。

PagerDutyを14日間無料で試してみる

700以上ものツールと連携。システム障害を自動的に検出・診断するだけでなく、適切な障害対応メンバーをアサインし、デジタル業務全体の修復ワークフローを自動化します。

PagerDutyイメージ

この記事が気になったら

  • Facebook
  • LinkedIn
  • twitter
  • はてなブックマーク

PageDuty公式アカウントをフォロー

  • Facebook
  • LinkedIn
  • twitter

関連ブログ記事関連ブログ記事

検索検索
タグタグ
インシデントをより早く・少ないリソースで解決
閉じる