2006年7月16日日曜日

インフラの休日出勤

土曜日は、休日出勤だった。

今作ってるシステムの、ディザスタリカバリのテスト。
ディザスタリカバリってのは、大災害なんかが起こって、サーバが機器的にクラッシュしたときにサーバごと前にバックアップ取った時点の状態にすぐさま復旧させること。

万が一、東京が大地震とかミサイルで攻撃されたりして、サーバがやられてもちゃんと戻せるかってテスト。
そんな事態になったら、それどころぢゃねーだろって感じもするけど、まぁ俺はこいつのプロだかんね、そーいうわけにもいかないの。

でも、サーバ自体もお客さんとこじゃなく、完全管理された俗にいうIDC(Internet Data Center)ってとこにあって普通の地震くらいじゃ問題なくて、泥棒なんか絶対入れなくて、バックアップテープは念の為にそこからさらに違うとこに移動させてて。んでもってそのセンターん中でも今動いてるサーバが動かなくなってもクラスタリングで待機させてたもう1個のサーバがすぐさま動くようになってて、その待機系がダメでもサーバさえ動けばその日中には日次のバックアップから昨日の状態にはすぐ戻せる。それでもダメだった場合(ってどーいう場合だよ。普通にありえねんだけど。w)に、やっとこのディザスタリカバリってのが必要になってくる。これも、機器さえあれば次の日にはバックアップ取った時点の状態で動かせるくらいにはできる。その対象のテープだって1本じゃなく、2本取って別の場所で管理。みたいな。
それも、誰がやっても完璧にできる為の手順も作ってあって。

不安だった場合に打てる手は全部打ってる。これ以上何が必要だろうってくらいに。
ま、普通のシステムってここまでやってて当たり前なのかな、あんま場数踏んでないんでよくわかんねぇけど。

ただ、そんなテストをする為には、みんなが使ってない時間にテストしなきゃいけない。サーバ止めるってことは、システム止めるってことだから。
んでみんながいるときは、インフラ(ネットワークとか)おかしくなったらみんなが仕事になんねぇからすぐさま対応しなきゃいけない、だからやっぱいなきゃいけない。

ようするに、
みんなが開発してるときはテストできないけど出てないといけない。
テストする為には、みんながいないときに出ないといけない。
みんながいようがいまいが俺らは出なきゃいけない。

…そんな俺は、いつ休めばいいんだろーか。
ったく、やれやれだぜ。

0 件のコメント:

コメントを投稿