監視サービスからのアラートメールは、取り込んで自動処理しよう!

Zabbixなど監視サービスからのアラートは、メールかAPIで読み込んで自動処理するのが楽。運用エンジニアは、Excelに転記なんてしてる余裕はないはず!

近年では、システム運用を効率化できる、クラウド型(SaaS型)の運用管理サービスが人気です。わざわざ初期費用を掛けて、特別なハードウェアやソフトウェアを自社環境に用意しなくても、簡単に導入できるのが魅力で、いろいろなベンダーから販売されています。今回は、システム運用で活用されるチケット管理機能の一つともいえる、監視サービスからのメールの取り込みについて説明します。
その前に、アラートメールに埋もれてしまう、システム運用業務の現場の実情から。

自動化が必要だとはわかっているものの

今、システム運用の現場では、人に頼りすぎた運用が問題となっています。クラウドやオンプレミスなど、システムの複雑化・多様化に伴って、処理しなければならない業務は増える一方。人材不足が慢性化しているにも関わらず、自動化が追いついていません。確かに、ロボットを使った自動化であるRPAも近年人気ですが、煩雑な割に無駄な作業を自動処理しても、根本的な課題に蓋をしてしまうばかりが、RPAの面倒まで結局エンジニアが見る羽目になりまります。

RPAによる自動化はExcelマクロやAIとどう違う?導入の注意点は?
https://un4navi.com/automation/19015/

エンジニアを単純作業の下僕にしない!

システムの変化があるところに、アラートはつきものです。業務用のシステムに変更が加わったり、新しいアプリケーションがリリースされる、ECサイトの商品が注目を集める…しかし、監視サービスから次々と送られてくるアラートメールは、どう処理していますか?
ITシステムの規模も小さく、アラートメールがそれほど多くない最初のうちは、何とかメールと人力で処理できなくはありません。しかし、一定規模以上のシステムを稼働させれば、メールボックスはあっという間に大量のアラートメールで膨れ上がります。クラウドとオンプレミスを併用していれば、それぞれからアラートメールが来る一方、検索にも限界があります。アラートの内容を確認するのに、メールを一つずつ開いてはいられませんし、アラート同士の関連性を複数のメールから目視で把握するとなると、大事なメールを見落としてしまうこともしばしばで、もうお手上げ。
そこで次に人は、何とかメールを分類しようと、Excelに転記することを思いつきます。アラートメールを開いては、台帳にコピー&ペーストする単純作業を繰り返す中で、Excelが表計算アプリケーションであったことも、自分がシステム運用エンジニアであったことも思い出せなくなりそうに…。
こんな作業にRPAを使うなんて、愚の骨頂ですよね?こんな無意味な作業で疲弊するのは、そろそろ止めませんか?

監視サービスからのアラートメールを取り込む

チケット管理機能は、いろいろなシステム監視サービスと連携されることがあります。システム監視サービスには、オープンソースで人気のZabbixを始め、PATROLCLARICEやNagios、JP1など、さまざまなサービスがあります。チケット管理機能の便利な機能の一つが、これらの監視サービスが送信する外部メッセージを取り込む機能です。すべてのチケット管理ツールが対応しているわけではありませんが、一部のツールは、メールやAPIで取り込んで処理します。

◯監視サービス

Zabbix/PATROLCLARICE/Nagios/JP1など
* これらの監視サービスが導入されている場合は統合運用管理サービスに連携し、ない場合は監視業務をアウトソースして処理

◯監視サービスの機能

  • URL監視
  • 接続監視
  • リソース監視
  • 死活監視
  • サービス監視
  • ログ監視
  • SNMP監視

取り込んだメールから、フィルタで抽出

監視サービスは、異常を感知するとアラートメールで知らせてくれます。しかし、果たしてそれは全部必要でしょうか?人は、自分が経験したくない情報に接すると、過小評価したり無視しがちですが、これは心理学用語で「正常性バイアス」と呼ばれます。アラートメールも同じで、アラートが常態化しては、もはやアラートの意味をなしません。つまり、すべてのアラートメールを受信する必要はなく、ノイズまで受信してはいけないのです。
運用管理サービスを使えば、監視サービスからのアラートメールを賢くフィルタ処理して、本当に注視しなければならないアラートだけを簡単に絞り込めます。
もちろん、絞り込む設定も自由にカスタマイズ可能です。有効にする日時や時間帯、メールの件名や本文、送信元のメールアドレスに任意の文字列が含まれているか・いないかなどの条件を細かく設定しておけば、自動的にシステム運用に必要なメールだけになります。
こうして、残ったアラートだけを、例えば自動電話(自動架電)やメール、SNSのメッセージなどで通知すればOK。これについては、また別の機会に。

自社環境で試してみるのが最も確実!

システム運用サービスを検討するときに重要なチェックポイントの一つは、今の環境に大掛かりな変更を加えなくても、導入して効果が出るか?サービスの機能や操作性、特長などは、カタログスペックではなく、実務で使い続ける中でしか実感できないものです。そのため、デモ用のサーバではなくできるだけ実際の自社環境で、実務に影響しないセキュアな範囲で試してみるのが確実。また、スタッフの学習期間なども考えて、ある程度長めのトライアル期間がある方が安心です。
そのシステム運用サービスは、自社に合うのか?まずは、チーム内の小規模な範囲でテスト導入してみて、じっくり検討することをお勧めします。

関連記事

ピックアップ記事

  1. ナレッジマネジメントはこうすれば必ず「失敗できる」!4つのポイント

    ナレッジマネジメントはこうすれば必ず「失敗できる」!4つのポイント

    ナレッジマネジメントとは、個々人が得た経験や知識を他者と共有する仕組みです。ITシステムに限った話で…
  2. システム運用担当者なら注目したい資格とは?-マネジャー編

    システム運用担当者なら注目したい資格とは?-マネジャー編

    今回は、システム運用業務に関わる資格を紹介します。 システム運用で、必須となる資格はありません。し…
  3. マルチクラウド時代のSaas、PaaS、IaaSを改めて復習しよう

    システム運用でも、もはや抜きでは語れないのがクラウドサービス。ひとまとめに「クラウド」といっても、大…
ページ上部へ戻る