IT用語: カオスエンジニアリングとは|意図的に障害を起こして耐障害性を高める
本番環境に意図的な障害を注入しシステムの弱点を発見するカオスエンジニアリングの概念とChaos Monkeyを解説。
カオスエンジニアリングとは
カオスエンジニアリングは、本番環境または本番に近い環境に意図的な障害(サーバーシャットダウン・ネットワーク遮断・レイテンシ注入等)を起こし、システムがどう反応するかを観察する実験手法です。Netflixが開発した「Chaos Monkey」ツールが有名で、本番環境のサーバーをランダムに強制終了します。
なぜ本番で障害を起こすのか?
「ステージング環境でのテストをパスしたシステムが、本番では想定外の障害モードを示す」ことはよくあります。制御された条件で意図的に障害を発生させ、弱点を発見・修正することで、実際の障害に対する耐性を高めます。
「ゲームデー」とは
チーム全体で計画的に障害シナリオをシミュレートするイベントです。障害発生→検知→対応のプロセスを演習し、インシデント対応手順の改善と、チームの練度向上を図ります。AWSやGoogleも定期的に実施しています。
関連する用語 (DevOps)
全58件を見るIT用語: カナリアリリースとは|一部ユーザーへ先行公開する安全なデプロイ手法
新バージョンを全ユーザーの5〜10%に先行公開し問題がなければ徐々に拡大するカナリアリリースの仕組みを解説。
RBAC
Role-Based Access Control(ロールベースアクセス制御)の略。Kubernetesでは、ユーザーやサービスアカウントに対してロールを割り当て、Kubernetes APIへのアクセス権限を細かく制御する仕組み。
Dockerfile
Dockerイメージをビルドするための設計書ファイル。FROM・RUN・COPY・CMD等の命令を書くことで、ベースOSからアプリのセットアップまでを自動化できる。docker buildコマンドで実行される。
Istio
Kubernetesで動作するオープンソースのサービスメッシュ実装。Envoyプロキシをサイドカーとして各Podに注入し、トラフィック管理・セキュリティ・可観測性を提供する。
ELK Stack
Elasticsearch・Logstash・Kibanaの3ツールの組み合わせ。ログの収集(Logstash)・保存・検索(Elasticsearch)・可視化(Kibana)をセットで提供する定番ログ分析基盤。
Helm
KubernetesのパッケージマネージャーAptやyumのK8s版。Helmチャートと呼ばれるテンプレートで複雑なK8sリソースを一括管理・デプロイできる。バージョン管理やロールバックも容易。