製品・アドオン
PagerDutyの優位性
おすすめコンテンツ
PagerDuty Advance
PagerDuty Advance
重要なデジタルオペレーション業務における生成AI機能

ベネッセコーポレーション様事例

顧客体験に直結する稼働をPagerDutyで監視 | 一次対応の完全無人化により年間約1億円を削減
株式会社ベネッセコーポレーション
従業員数
単体3,195名(2025年3月末現在)
事業内容
教育事業、生活事業
所在地
岡山県岡山市北区南方3-7-17
取引期間
2025年〜
  • 1001〜5000名
  • エンジニア負荷の軽減
  • インシデントへの迅速な対応
  • アラートの集約と精査
  • メディア
  • MTTA・MTTR
  • コスト削減
  • アラートノイズ

目次

    ベネッセグループの中核会社である株式会社ベネッセコーポレーションは、全社システムの運用監視において、増え続けるアラートに翻弄される監視チーム、設定変更権限が監視チームに集中する中央集権的な仕組み、一次対応を担う外部業者にかかる膨大な固定費という大きく3つの課題を抱えていました。これらの解決策として、通知からエスカレーション、到達まで、「重要なものだけを、確実に、速く、誰にでも運用できる形で届ける」ことを可能にするPagerDutyを導入。有人オペレーションを撤廃するというゴールを達成した上に、設定変更の民主化、コストの最適化にも成功。早くも次のゴールに向けて、インシデント対応の自動化に着手しています。

    増大する監視チームの負荷軽減に向けシステム監視基盤の刷新を検討

    ラテン語のbene 「よく」 +esse 「生きる」を組み合わせた造語、ベネッセ。教育や介護・保育、生活の領域で幅広いサービスを提供するベネッセグループでは、すべてのライフステージにおいて、人に関わる社会課題の解決に貢献することをパーパスに定め、自分らしく生きられる世界の実現を目指しています。グループの中核会社として、主に「教育」と「生活」領域で事業を展開するのが、株式会社ベネッセコーポレーションです。教育領域では、幼児向け通信教育「こどもちゃれんじ」や小中高生向け「進研ゼミ」に加え、学校向けの「進研模試」や英語4技能検定「GTEC」などの教育支援サービスを提供。生活領域では、妊娠・出産・育児メディア「たまひよ」を中心に、ECや写真スタジオなどの関連サービスを手がけています。

    こうしたサービスを支えるITインフラの構築・運用・保守を担うのが、同社インフラソリューション部です。オンプレミスとクラウドにまたがる全システムの監視、インシデント対応、変更管理、サーバー管理を標準化し、24時間365日体制で安定稼働の実現に奔走する、まさに「縁の下の力持ち」とも言える部門です。ともすると業務停止に直結しかねない重要なシステム監視業務において、同部門が抱えていた課題を上野氏はこう説明します。

    「24時間365日、電話での有人対応を続けてきたのですが、監視設定の煩雑さにより不要なアラートが増大し、夜間・休日を問わず対応するメンバーの負荷が膨らんでいました。加えて、監視設定の変更権限が監視チームに集中する中央集権的な仕組みにより、各システムの担当者が自ら調整することができず、リードタイムが長くなるだけでなく、監視チームの負荷が増大する原因にもなっていました。」

    さらに、コスト面での課題も軽視できない状況にありました。一次対応を外部業者に委託しており、年間約1億円超の固定費はもはや削減の余地がないばかりか、監視対象のシステムが増えれば、固定費もさらに膨らむ一方です。約20年の間、同じ仕組みで運用を続けてきた同社は、時代に合った新しい仕組みで監視業務を最適化していく必要があると考え、監視基盤の刷新を検討し始めました。

    有人オペレーションをなくすためにPagerDutyで運用の自律化に着手

    課題解決に向けては、通知の集約、重複するアラートの排除、システム単位のルールに基づく自動エスカレーションなどを一体的に実現し、運用の自動化とコストの最適化を両立するソリューションが必須でした。比較検討を進めるなかで、これらの要件を満たし、運用の自律化を実現するための最適な解決策として着目したのが、インシデント管理プラットフォーム「PagerDuty」でした。「コストの見通しが立ったのはもちろんですが、我々のゴールである”有人オペレーションをなくす”ところにフォーカスしたソリューションであることが一番の決め手でした」と上野氏は語ります。

    PoCを経て導入の見通しが立ったところで、同社は全800システムの監視を半年でPagerDutyに移行すべく2025年4月よりプロジェクトを開始。しかし、プロジェクト推進中に大きく3つの課題が顕在化しました。1つは、監視オペレーターが一次対応を行っているアラート362件について、PagerDutyかサーバー側での自動化が必要であること。2つ目は、基盤障害などで一度に大量のアラートが発生し、開始から4か月でアラート数が上限の7割に到達してしまい、この抑制限が必要であること。3つ目は、PagerDutyと有人監視とを並行稼働しながらの移行となったため、PagerDuty側の抜け漏れがないことを担保する必要があることです。

    まず、一次対応の撲滅に向けては、アラート362件について一次対応のナレッジを一つひとつ精査し、手動で対応していた部分は廃止、または別の手段に置き換えるなど、人手依存の作業を徹底的に排除して運用をシンプル化することにこだわりました。

    「アラートの内容によって対応方法がまったく異なるので、各システムの担当者とコンタクトを取りながら個別に調整を進めていきました。大変ではありましたが、手作業が残っていてはプロジェクトのゴールを達成できません。ここはPagerDutyを導入する上で非常に重要なポイントだったと思います。監視基盤を刷新することが決定したとき、早い段階で説明会を丁寧実施したことで、担当者がポジティブに向き合ってくれたので助かりました」と熊井氏。

    また、大量アラートの発生においては、PagerDutyが通知数課金であることがネックとなります。そこで、アラート数を常時モニタリングし、大量アラートの発生時は該当部門の担当者に連絡して抑制策を実施することで、大量アラートの抑制を図っていきました。3つ目の抜け漏れの撲滅に向けては、有人監視とPagerDutyのアラートを突き合わせ、アラートのコール先の設定ミスや、システムとアラートの紐づけ違い、エージェント側のPagerDutyへの通知漏れなど、抜け漏れが見つかった場合は、その原因を確認し約2か月をかけて改善策を実施していきました。

    また、移行チームのリーダーを務めた泉氏は、「リスクを回避するために、既存の監視システムとの並行稼働期間を設けて段階的に切り替えていきました。PagerDuty社のサポートにより、設計の迷いどころを早期につぶせたたことでスムーズに移行できました」と振り返ります。

    一次対応の完全無人化を達成し年間約1億円の固定費を削減

    こうして2025年8月上旬には全システムの移行を完了し、8月末に有人オペレーションを終了。9月末にプロジェクト終了という当初の計画より1か月も前倒しできたことで、想定していた対応コストも-17%での着地となりました。監視業務の対象となるアラートはすべてPagerDutyに集約して一元管理できるようになり、起票からエスカレーション、電話連絡まで自動化されたことで、24時間365日の監視体制に常時依存しない運用への移行を見事に達成したのです。これにより、外部業者に委託していた年間1.2億円の固定費が不要となり、計画どおり5年間で約3.3億円のコスト減を見込んでいます。監視設定が煩雑で移行の難易度が高い前提でのスタートだったものの、約半年でプロジェクトを完遂したことに加え、早期に投資対効果の道筋を示せたことで、社内からも高く評価されました。

    また、PagerDutyの導入を機に、課題だった中央集権的な体制を見直し、設定の民主化を実現。設定の標準化、マニュアル化などを通じて、各システムの担当者が設定変更や連絡先の更新などを自分たちで完結できるようになり、運用の自律度が大きく向上しています。待ち時間や部門間の調整を挟まずに動ける場面が増えたことも成果の一つです。

    「いつも依頼しなければ出来なかったことが自分たちで出来るようになるのは大きなメリットです。使う人が協力的だとプロジェクトも進めやすいですしね」と熊井氏、上野氏も、「変更権限をオープンにしたことで、部署ごとにさまざまな使い方のアイデアが出てくるようになりました。これまでは監視チームに閉じていて、どのような設定ができるのかを現場が知るよしもない状態でしたから、そもそも自分たちならどう使いたいかを考える機会もなかったわけです。そういう意味でも、民主化したのは正解だったと感じています。PagerDutyなら、設定を各担当に解放してもガバナンスを保てるので、監視の民主化を推進しつつ標準化を崩すことなくスケールできます」と語り、さらなる業務効率化に向けた施策を高速に回せる土台が整ったことをさんでいます。

    止めない運用の自動実行基盤へと進化させ増員に頼らずにスピードを底上げ

    今後は、PagerDutyを「止めない運用の自動実行基盤」へと進化させたいという同社。手当てではなく、”自動で直す”を当たり前にし、増員に頼らずにスピードを底上げしていく考えです。

    そのゴールに向けて、「現在は、通知を自動化させただけにとどまっていますが、インシデント発生時の対応について、復旧までのフローを段階的に自動化・簡素化していく予定です。PagerDuty Runbook Automationによる自動化へのシフトに、まずはリスクの低い作業から着手し、発生頻度の高い事象へと適用範囲を広げていき、運用リソースの最小化を目指します」と泉氏は説明します。

    「重要なものだけを、確実に、速く、誰にでも運用できる形で届ける。その”当たり前”を仕組みで実現してくれるのがPagerDutyです」と語る上野氏。次のゴールに向けて走り出した同社は、PagerDutyを単なる運用ツールではなく、ベネッセの事業とサービスの信頼とスピードを両立させる基盤として捉え、運用品質の底上げに挑もうとしています。

    上野 隆明 氏

    株式会社ベネッセコーポレーション
    インフラソリューション部
    事業インフラサービス課

    熊井 真紀 氏

    株式会社ベネッセコーポレーション
    インフラソリューション部
    事業インフラサービス課

    泉 大地 氏

    株式会社ベネッセコーポレーション
    インフラソリューション部
    事業インフラサービス課

    システム障害対応の未来を徹底議論する年に一度の祭典

    止められない世界を、照らす光。

    2026.04.15(WED)  2026.04.16(THU)

    東京ミッドタウン ホール&カンファレンス ホールA・B

    詳細はこちら