ブログ:PagerDuty の記事

ベンダーインシデントの管理—自社の責任ではない顧客への影響
クラウドコンピューティングの基本理念と現実 クラウドコンピューティングの最初の重要な原則の一つは「you own your own availability(可用性は自社の責任)」という考え方…
2025年10月3日

AIエージェントでインシデントライフサイクルを変革する
私たちは今、組織の運用方法が根本的に変わる変化の真っ只中にいます。すでに51%の企業がAIエージェントを導入済みです。これまで後手に回りがちで手作業に依存していた運用が、インテリジェントで自動化され…

中央集権と自律性のバランス:大規模自動化の鍵
企業が成長し、自動化戦略を拡大する際、避けて通れない課題があります。それは、中央集権的な管理と各チームの自律性のバランスをどう取るかという問題です。 本記事では、ITおよびソフトウェア開発環境…

Opsgenieの次を考えるー 業界リーダーがJira Service Management(JSM)よりもPagerDutyを選ぶ3つの理由
近年、デジタルサービスの重要性が高まる中、システム障害への迅速な対応がビジネスの成否を左右するようになりました。深夜にシステムトラブルが発生した場合でも、適切なインシデント管理体制があれば、影響を最…
2025年6月30日

大規模インシデントから学ぶ:見過ごされがちな成長の機会
システム障害やインシデントは、確かに予期せぬタイミングで発生し、組織内のコミュニケーション課題を浮き彫りにする厄介な出来事です。しかし、適切に活用すれば、組織にとって強力な学習と成長の機会になること…

卓越した業務の効率化“オペレーショナルエクセレンス”を実現するPagerDutyの「オペレーショナル・マチュリティ・モデル」とは
現代の「デジタルファースト」世界において、テック企業が優位性を獲得するためには、現場のオペレーションを改革し、オペレーショナルエクセレンスを実現させることが必須課題といえます。
オペレーショナ…
オペレーショナ…
2025年6月5日

オブザーバビリティとは?インシデントの予防や迅速な復旧を可能に
現代のシステム開発においては、複雑化するシステムの全体像を把握し、問題の根本原因を迅速に特定することが大きな課題となっています。多くの企業が、システムの状態をリアルタイムで監視し、異常を素早く検出す…

死活監視とは?必要性や効果的な実施方法
障害によってIT関連のシステムやサービスの提供が急に停止してしまうと、その影響は広範囲におよびます。したがって、その正常な稼働をチェックする死活監視は、IT関連のシステム運用やサービス提供において、…
2025年5月21日

システムのダウンタイムを削減するMTTR(平均修復時間)とは?~インシデントからの素早い復旧を実現する管理方法~
システムの安定性と信頼性の確保は、多くの企業にとって課題となっています。しかし、システムのダウンタイムが長引き、ビジネスに深刻な影響を与えるケースは少なくありません。ダウンタイムの影響を最小限に抑え…
2025年5月20日

インシデント優先度マトリクスとは?メリットや影響度・緊急度の設定方法
重大なインシデントに素早く対応するには、発生したインシデントに対して、適切な優先度を設定することが重要です。
しかし、明確な判断基準がなければ、優先度の設定が適切でなかったり、担当者間で判断の…
しかし、明確な判断基準がなければ、優先度の設定が適切でなかったり、担当者間で判断の…
2025年5月19日