製品・アドオン
PagerDutyの優位性
おすすめコンテンツ
PagerDuty Advance
PagerDuty Advance
重要なデジタルオペレーション業務における生成AI機能

あのOps Guidesインシデント対応ガイドが、ついに公式日本語化!

2025.04.25更新

    皆さんは、PagerDutyが提供しているOps Guidesというガイドはご存じでしょうか?

    これは、PagerDutyが実際の運用で利用しているガイドを編集して一般公開しているものです。

    PagerDutyは皆さんのシステムの安定性を守る最後の砦であり、これ自体に高い信頼性が求められるものです。いざ障害が起きたときにPagerDutyにも障害が起きていて通知が来なかった!となってしまっては大変です。そのため、しっかりした運用体制で抜群の安定性を保っているのですが、そこから得られた運用ノウハウが詰まった、まさに集大成です。

    その中でも、Incident Responseのガイドはさまざまな記事、媒体から参照される、非常に人気の高いコンテンツです。


    日本においても、有志による日本語版が提供されています。この日本語版が存在することは大変有り難いことで、自分も幾度となくお世話になりました。

    このたび、PagerDuty公式サイトでもIncident Responseガイド日本語版を公開いたしました。

    PagerDuty | Incident Response ガイド

    Ops Guidesが提供するもの

    Ops GuidesにはIncident Responseだけでなく、たくさんのカテゴリのガイドがあります。

    1. The Howie Guide
      • インシデント後のレビューに関するJeliのHowieガイドです。インシデントからの学習を改善するためのステップバイステップのマニュアルです。
    2. Full Service Ownership Guide
      • コードが本番環境でどのように機能するかをより深く理解することで、システムとサービスの信頼性を確保します。
    3. Incident Response
      • PagerDutyとそのユーザーが実践する、インシデント対応プロセスの詳細な概要です。
    4. Customer Service Operations
      • カスタマーサービスチームは、とくにインシデント発生時に、顧客体験の重要な要素です。その流れについて解説します
    5. DevSecOps
      • DevSecOpsがはじめての方、または何であるか、どのように実装するか疑問がある方向けです。このガイドで始めるのに役立ちます。
    6. Best Practices for On Call Teams
      • チームとマネージャーのためのオンコール対応に関する完全なリソースです。
    7. Autoremediation
      • インシデント対応プロセスで自動化を活用するのに役立つガイドです。
    8. Postmortems
      • 効果的なポストモーテムの実施方法に関する包括的なガイドです。非難のない文化を構築する方法を学びます。
    9. Operational Reviews
      • データ駆動の定期的なレビューを使用してインシデントの影響を測定し、リアルタイム運用の隠れたコストをより適切に管理します。
    10. Retrospectives
      • 作業プロセスと行動から反復的に学び、継続的な改善の文化を育成します。
    11. Security Training
      • PagerDutyで使用されているオープンソースのセキュリティトレーニングで、技術系・非技術系チーム向けに適応可能です。
    12. Internal Stakeholder Communications
      • 重大なインシデント発生時に、内部ステークホルダーに対する効果的なコミュニケーション戦略を構築します。
    13. Business Incident Response
      • 重大な技術的インシデントが発生した際に、ビジネスニーズと技術的ニーズをいかに調整するかを学びます。

    この貴重なノウハウを日本語化していきます

    PagerDutyの日本法人が設立されてから3年が経ちました。おかげさまで日本チームも成長し、充実した顔ぶれとなってきました。そこで、Ops Guidesを日本語化して提供すれば日本のシステム運用に関わる人たちに貢献できるのではないか、ということで、日本語化プロジェクトを立ち上げました。

    これから順次、Ops Guidesを日本語化して公開していきます。

    まずは冒頭にも解説した Incident Response を日本語化して公開しました

    誰もが悩むオンコールについてのベストプラクティスから、インシデント発生前・発生中・解決後の各フェーズにおける対応方法、インシデントコマンダーとその育成方法まで、運営体制作りに役立つ情報が盛りだくさんです。

    有志による日本語版とコンテンツが被ってしまうことにはなりますが、今でも感謝とリスペクトの気持ちを持っています。競合するのではなく、PagerDuty社員の手によって改めて翻訳された別バージョンと捉えていただければと思います。

    また、近々PostmortemsやRetrospectivesも日本語版を公開する予定です。最終的には13のガイド全てを日本語化できればなと思っています。

    PagerDutyのウェブサイトに各ガイドへのリンクがありますので、是非ご覧ください!

    PagerDutyを14日間無料で試してみる

    700以上ものツールと連携。システム障害を自動的に検出・診断するだけでなく、適切な障害対応メンバーをアサインし、デジタル業務全体の修復ワークフローを自動化します。

    PagerDutyイメージ

    この記事が気になったら

    • Facebook
    • LinkedIn
    • twitter
    • はてなブックマーク

    PageDuty公式アカウントをフォロー

    • Facebook
    • LinkedIn
    • twitter

    関連ブログ記事関連ブログ記事

    検索検索
    タグタグ
    インシデントをより早く・少ないリソースで解決
    閉じる