n-1 contest lt dmm
TRANSCRIPT
東北電子専門学校第2回 N-1コンテスト LT資料
2016/2/13
DMM.comラボ佐々木 健
DMMの中の話等
自己紹介
名前: 佐々木 健
出身:福島県郡山市
所属: DMM.comラボインフラ統括本部
お仕事:ブログ書いてます。イベントのお手伝いしてます。かき氷も配ってます。
http://tsuchinoko.dmmlabs.com/
これは駄目!!!
緊急時にありがちなこと
●視野が狭くなる。
●時間感覚がおかしくなる。体感5分
が実際には1時間。
●稚拙な対応により二次災害発生。
こういうことを考慮して、、、、
最初にやること
1.深呼吸
2.状況の把握(1分でできる程度)
3.関係者への連絡
4.対処方針を決める
対処するのはそれから
障害時に考えなきゃいけないこと
1.サービスへの影響はあるか。
2.ユーザーはどう感じるか。
3.関係者は誰か。どう連絡するか。
4.解決までの時間はどのぐらいか。
5.暫定対処は必要か。
6.どういう体制で復旧作業をするか。
通常作業時に配慮すること
●作業理由の説明●切り戻し可能な作業手順●必要なところへの情報共有●ユーザーへの影響●セキュリティ●目的とコストのバランス
大規模サービスの運用は
それなりに大変
ビジネスにおいて大事なこと
●ありがとう●ごめんなさい
これだけちゃんとやっとけば、わりとなんとかなる。
質問等あれば
なんでも聞いてください