トラブル対応時に状況把握する簡単な方法

システム開発という仕事柄、システムトラブルというものと付き合いながら仕事をしています。

システムというのはビルや橋と違って、目に見えないもので、そのシステムがトラブってしまうと、原因をつかむのがかなり難しいことがときどきあります。 エラーログを見れば、すぐに分かる場合もありますが、必ずしもそうでもなく、まったくもって何が起きているのかがわからないところから始まることがあります。

トラブルはどんな仕事でも起こると思います。

そういったときに、状況と原因を特定するのに簡単に使える方法を紹介します。

f:id:vekitomo-0:20160225003041j:plain:w250

『わかっていること』と『わかっていないこと』

何がわかっていて、何がわかっていないのかを仕分けていくのです。

まったくもって何が起きているのか分からない状況ではありつつも、分かっていることはあります。
間違いなく正常に動いている機能などがそうです。

分かっていることと分かっていないことを仕分けていきます。

そして、分かっていないエリアをさらに仕分けていくのです。
そのステップを繰り返すと、怪しいエリアが徐々に絞られていきます。

ある程度まで絞られたら、集中して原因を特定する

そこそこのレベルまで怪しい箇所が絞られたら、そのエリアに数人のメンバーをアサインして一気に調べあげます。

そこまで絞られない状況で人を突っ込むと、大量の人数と大量の時間を使ってしまいます。

わかっていること、わかっていないこと。

この仕分けをクイックに何回か繰り返すだけで、最小の労力と最短の時間で問題の原因を特定することができます。

トラブル対応時のテクニックは他にもたくさんありますが、少なくともこの方法で仕分けるだけでもスピード感が全然違います。

例えてみると

会社に着いたら財布がないことに気づきました。
という状況で考えてみます。財布でなくてもいいです。何かがないこと気付いたときのことを想像してみてください。

そんなときは、朝から会社に着くまでを振り返り、どこまではあったかを確認するはずです。
家を出るときはあったとか、途中のKioskで買い物をしたときに財布を出した、とか。
確実にあったときがわかれば、不明なエリアに絞りこんでいくことができます。

電車に乗るまでは確実にあったことがわかっていれば、鉄道会社の落し物センターに問い合わせるなど、アクションを最小にすることができるのです。

むやみやたらに飛び込む前に、絞り込みましょう。