障害ではないインシデントとは!?インシデント管理:ITILの基本(4)

インシデント Incidentは、一般的に「出来事」「障害」と訳されます。これは「事故などが発生する恐れのある事態」「いつか重大な事故に発展してしまう可能性がある、小規模な事件」のことです。安全管理や保安業務でよく使われます。
ITシステム運用でいう「インシデント」も、基本的な意味は同じです。ただし、必ずしも障害や事故のことを指す用語ではありません。むしろ、混同して使われがちな「インシデント」と「障害」の違いを理解しておくことが重要です。

障害ではないインシデントもある

以下の例は、どれもインシデントですが、(厳密には)障害ではありません。インシデントには、ハードウェアなど物理的な損傷や、アプリケーションやネットワークの障害だけでなく、より大きなトラブルになる可能性のある事象も含みます。そして「障害」とは、インシデントを引き起こしている要因のひとつです。

  • メールが送信できない
  • アプリケーションがフリーズする
  • パソコンの動作が重い
  • メモリエラーが起きる
  • プリンタが認識されない
  • ユーザがログインパスワードを忘れた
  • ライセンスが切れているアラートが表示される

ちなみに、ITシステムの中でも、情報セキュリティ面にフォーカスを当てた「セキュリティインシデント」として扱われることもあります。国際標準化機構(ISO)と国際電気標準会議(IEC)が共同で策定した、情報セキュリティ管理の規格「ISO/IEC 27001」では、インシデントは『望まない、又は予期しない一連の情報セキュリティ事象であって、事業運営や情報セキュリティを脅かす可能性が高いもの』と定義されています。また、「ISO/IEC 13335」では、『事業活動又は情報セキュリティを損ねる可能性のある,予期しない又は望んでいない事象』と定義されています。
システム運用全体で使う場合の「インシデント」が持つ、『調査が必要な予期しない事象』といった定義よりも、やや緊迫感が高めで使われます。

インシデント管理とは

インシデントは、次のような手順で管理されます。インシデント管理は、障害からの復旧だけではなく、復旧するまでの応急処置なども含まれています。ユーザがシステムを利用することを妨げる事象を取り除き、元のように、サービスを利用し続けられる状態にします。

受付と記録

発生したインシデントや、ユーザからの問い合わせを全て記録します。後で分析し、ITサービスの品質向上に利用します。

分類と優先順位の設定

インシデントを分類し、優先順位を決定します。インシデントの種類、担当者、想定される影響範囲、緊急性、対応方法や手段、解決までの見込み時間や工数などの基礎情報を特定し、分類します。

ファーストヘルプラインによる解決

対応手順が決まっている問い合わせ(サービス要求)、単なる情報紹介など、分類から判断して、比較的簡単に対応できそうなインシデントであれば、手順に従って処理します。既知の問題のような過去に発生したことのある事象は、障害対応履歴(ナレッジベース)などを活用しながら、初期段階での解決を試みます。

エスカレーションによる解決

ファーストヘルプラインで解決できなかったり、定めていた基準を超えたインシデントは、より詳しく正確に診断できるスペシャリストに委ねるエスカレーションへと移ります。このエスカレーションは、利用部門に対して提供するITサービスの内容やレベルを保証する契約SLA(サービス レベル アグリーメント)に準じて処理されます。

インシデントの追跡とライフサイクル管理

インシデントを処理する担当者は、問題解決(クローズ)して終了するまでの間、「インシデントの報告を受けてからの経過期間」「現在の調査状況」「顧客へのアップデート状況」「次回の進捗報告のタイミング」「解決が長引く場合のエスカレーションの必要性」などを管理します。

クローズ

インシデントが解決されたら、問題解決として終了し、すぐにユーザや関係者に報告します。解決までの詳細な記録を過去の事例として活用できるように、すぐに参照できる状態で保存しておきます。

スムーズに業務を遂行できる元の状態へ

インシデントとは「ユーザが、やりたいことができない状態」のこと。ユーザがサービスを使うことができなかったり、使う上でストレスを感じて、スムーズに業務を遂行できないことなどもインシデントです。自動フィルタリングやチケット管理などの効率的なサービスを使い、ユーザの立場に立ったインシデント管理で、解決へと導きましょう。

関連記事

ページ上部へ戻る