IBM Cloud様事例

PagerDuty、IBM Cloud用のServiceNow統合インシデント管理を支援
IBM Cloud
従業員数
38万人以上
事業内容
クラウドコンピューティング、AI、機械学習
所在地
170カ国以上
取引期間
2016年以来
  • 5001名〜
  • ヒューマンエラー削減
  • インシデントへの迅速な対応
  • テクノロジー
  • 自動化
PagerDuty導入前の課題
  • 組織全体で標準化されていないシステム運用
  • 手動のエスカレーション
  • インシデント管理プロセスの自動化
PagerDuty導入効果
  • インシデント自動修復比率の向上
  • PagerDuty・ServiceNow間におけるインシデントデータの自動同期
[ez-toc]

かつて最も成功したテクノロジー企業の1つであるIBM社。しかし、この企業が過去の栄光に胡坐をかいていたら、今日の地位を築くことはできなかったでしょう。同社は、その競争力を維持するために、絶えず自己改革に努め、競争を勝ち抜く新たな方法を模索する必要がありました。IBM Cloudと同社のWatson質問応答システムは共に、その良い例です。しかし、これらの製品はカスタマーエクスペリエンスを脅かすインフラインシデントにどう対処しているでしょうか。PagerDutyがServiceNowとの間で新たに実現した、画期的インテグレーションをのぞいてみましょう。

変革すべきとき

 IBM Cloud部門は2016年後期、インシデント管理、エスカレーション、根本原因分析(RCA)および関連する手順を処理するための標準化されたツーリングシステムが必要であると判断しました。IBM Cloud組織全体の運用ツールセットを所管するこの部門は、既存のインシデント管理(IM)システムが満足のいくものではないことに気付いていました。分散されたフレームワークは担当窓口やエスカレーション手順を寸断し、手動のエスカレーションは多大な時間を無駄にしていたのです。また、断片化された知識は、古くて一貫性に欠けることがしばしばでした。
 IBM Cloudチームは、インシデントチケットを発行、追跡、文書化する記録システムServiceNowの採用をさらに進めながら、IMプロセスを自動化したいと考えていました。同時に、自己修復ワークフローの自動化およびリアルタイムのインシデント対応の改善にも役立つソリューションを求めていました。これを実現するためには、インシデント対応エコシステムの稼働部分すべてを連携させることが必要でした。

PagerDutyとServiceNowが柔軟性と自立性を実現

 IBM Cloudは、既存のServiceNowの実装を強化するベンダーを選定するにあたり、この要件を満たすのはPagerDutyだけであることに気付きました。なぜでしょうか。IBM Cloudのクラウド・サービス・マネージメントでプグラムディレクターを務めるTravis Warner氏は次のように説明します。「まず何よりも、ユーザー設定の機能です。『ユーザーAのために、このグループを編集するか、このスケジュールを作成せよ』などと指示を出す管理者チームを置く必要がありません。皆自分でできてしまうのです」 ツーリングに関しては、自分はそれに一切手を出さず、マネジャーたちにチームや業務の処理を任せておけばよい、とWarner氏は指摘しています。このインテグレーションの結果、PagerDutyとServiceNowは今や、IBM Cloudのような既存のServiceNowのお客様に対して、インシデント管理機能のすべてを提供しています。さらに、オンボーディングや実装が迅速化されたことに加え、両方の製品を使用しているお客様は両製品をスピーディーかつ容易に統合できるようになりました。

「約18カ月前、自動自己修復の比率は1桁でした。それが2017年末には65%近くまで増え、今年は80%を目指しています」
- Travis Warner氏 IBM Cloudクラウドサービス管理担当プログラムディレクター

リアルタイムサポートがワークフローを自動化し、冷静な対応を可能にする

 IBMCloudの場合、PagerDutyとServiceNowのインテグレーションにより、PagerDutyを用いたインシデントへのリアルタイム対応と、ServiceNowを用いたインシデントの文書化とが可能になっています。IBMCloudの監視ツールからインシデントアラートを受信するPagerDutyは、自動化されたワークフローおよびインシデント分析をサポートします。アラート内のコンテンツに基づき、自動自己修復をトリガーするか、またはインシデントを適切なチームおよびプロセスにエスカレートします。その結果、誰が何をすべきか、慌てて考える必要がなくなりました。
 Warner氏は次のように説明します。「PagerDutyは、その本来の機能を見事に果たしてくれます。何をすべきか、我々に示してくれるのです。PagerDutyは我々のIMプロセスを自動化するのに実に役立っています。スタッフへの通知の回数が減り、お客様に影響が及ばないうちに問題を食い止めるので、皆とても喜んでいます。仮に自動化が失敗しても、PagerDutyが適切な担当者にインシデントの履歴やその他の詳細を通知してくれるお陰で、問題に素早く対応できるようになりました」
 さらに良いことに、IBMCloudのインシデントデータがすべて、PagerDutyとServiceNowの間で自動同期されます。いろいろ利点がありますが、この双方向の情報の流れは特に、従業員の柔軟な働き方を実現するのにとても貢献しています。Warner氏が指摘するように、PagerDutyの「あらゆるデバイスにいつでもどこでも対応というコンセプトこそがまさに重要」なのです。

IBMCloudで威力を発揮する自己修復

 2016年11月の導入以来、IBMCloudでは現在、4千人近くのスタッフがPagerDutyを活用しています。導入がさらに進むなか、IBMCloudチームはインシデント管理の劇的な改善を目の当たりにしています。PagerDutyの簡素化されたフレームワークは、解決時間を短縮し、一元的な可視性を実現し、適切なリソースの採用を自動化し、従業員のワークライフバランスを改善します。
 PagerDutyとServiceNowのインテグレーションはまた、IBMCloud部門が自己修復を自動化することを容易にしました。導入前は自己修復されるインシデントは5~10%程度でしたが、2017年末には65%に増加しました。それだけではありません。IBMCloudでは、自己修復の比率を2018年までに80%にすることを目指しています。

一気に進む導入

IBMCloudではDevOpsが組織全体に広く展開されており、同グループでのPagerDutyの採用はその一例にすぎません。同部門では既に、3,000近くの業務活動がPagerDutyとServiceNowを活用して構成されています。