FiTでは、次世代型フィットネスジム「LifeFit」を運営しております。「LifeFit」は、アプリで最短1分・24時間いつでもジムの利用が開始でき、リーズナブルな料金体系で、チケットを購入するだけですぐに利用できる次世代型フィットネスジムです。初期費用や登録手数料などは一切不要で、今までジムに通えなかった、または継続できなかった方々も利用しやすいシステムと料金体系で、気軽にご利用いただけます。2022年1月に1店舗目をオープンし、2024年5月には オープン予定の店舗含め50店舗まで拡大しています。 アプリの利用者も昨年比で5倍以上のユーザー様にご利用いただいています。
ビジネスが急成長していることで、アプリのシステム基盤であるAmazon Web Service LightSail(以下LightSail)の課題が顕在化してきました。LightSailは低コストで素早くサービスの構築・提供できますが、ビジネスの急成長に合わせた柔軟な設計やシステム監視ができません。具体的な問題は4つありました。
1つ目はスケーリングの問題です。ユーザー数やトラフィックの増加に対して自動でスケーリングできないため、負荷が高くなりやすい環境になっていました。
2つ目は監視の問題です。ログの保存期間が3日と短く、障害発生時の調査が困難な状況でした。加えてログの永続化もできていない状態であり、監視体制が十分ではありませんでした。
3つ目は、冗長化ができないという問題です。データベースのスケーリングやアクティブ・スタンバイ構成もできないため、いずれかのサーバーが停止するとシステム全体が停止してしまう状況でした。
最後に、リリース時にダウンタイムが必ず発生するという問題です。店舗オーナー様が重要なステークホルダーですから、ダウンタイムがある場合には店舗オーナー様との調整が必要になります。LightSailの環境では、リリースのたびに店舗オーナー様と調整しなければならない状況でした。この問題はリリース頻度にも影響していました。開発した機能をすぐに提供したいですし、セキュリティの緊急パッチやバグフィックスなどにも迅速に対応したいと考えていました。しかし、先ほどの理由から定期的なリリース以外を行うことはできませんでした。
これらの問題を解決するために、LightSailからECSへ移行することを決めました。しかし、社内のメンバーだけではリソースが不足しておりなかなか進まない状況でした。そこでTopotalさんのSREにご相談しました。