2022.07.31

障害情報

2022年7月31日サービス障害のご報告

概要

本日 18時10時頃から、コモレビが提供する配信以外の機能において接続が不安定になる事象が発生いたしました。
同日18時45分には、コモレビサービスについて当該事象は解消しております。
ご利用のユーザー様には、ご迷惑とご不便をおかけしたこと、心よりお詫び申し上げます。
なお、今回発生した事象につきましては、下記をご覧ください。


発生時間帯

2022年7月31日 18時10分〜18時45分


影響範囲

コモレビサービス( https://app.cmrb.jp )の配信以外の機能全て


原因

無停止リリース作業において、 Kubernetes の Pods に対してローリングアップデートを実施しましたが、負荷による影響で Node のスケールアウト/インが裏側で自動で走り、接続が不安定になっておりました。


対応

18時10分    監視ツールよりアクセスがしづらい事象を確認
18時10分    調査開始
18時30分    原因特定
18時30分    Node を安定化させた後、Podsの数を戻す作業を実施
18時45分    全ての Pods に異常がないことを確認
18時45分    コモレビサービスの動作が問題ないことを確認


対策

  • Node のスケールアウト/イン設定見直し
  • Pod の再起動ポリシー見直し
  • 無停止リリースの手順見直し
  • アプリケーションのタイムアウト値を変更