監視サービスからのアラートメールは、取り込んで自動処理しよう!

Zabbixなど監視サービスからのアラートは、メールかAPIで読み込んで自動処理するのが楽。運用エンジニアは、Excelに転記なんてしてる余裕はないはず!

近年では、システム運用を効率化できる、クラウド型(SaaS型)の運用管理サービスが人気です。わざわざ初期費用を掛けて、特別なハードウェアやソフトウェアを自社環境に用意しなくても、簡単に導入できるのが魅力で、いろいろなベンダーから販売されています。今回は、システム運用で活用されるチケット管理機能の一つともいえる、監視サービスからのメールの取り込みについて説明します。
その前に、アラートメールに埋もれてしまう、システム運用業務の現場の実情から。

自動化が必要だとはわかっているものの

今、システム運用の現場では、人に頼りすぎた運用が問題となっています。クラウドやオンプレミスなど、システムの複雑化・多様化に伴って、処理しなければならない業務は増える一方。人材不足が慢性化しているにも関わらず、自動化が追いついていません。確かに、ロボットを使った自動化であるRPAも近年人気ですが、煩雑な割に無駄な作業を自動処理しても、根本的な課題に蓋をしてしまうばかりが、RPAの面倒まで結局エンジニアが見る羽目になりまります。

RPAによる自動化はExcelマクロやAIとどう違う?導入の注意点は?
https://un4navi.com/automation/19015/

エンジニアを単純作業の下僕にしない!

システムの変化があるところに、アラートはつきものです。業務用のシステムに変更が加わったり、新しいアプリケーションがリリースされる、ECサイトの商品が注目を集める…しかし、監視サービスから次々と送られてくるアラートメールは、どう処理していますか?
ITシステムの規模も小さく、アラートメールがそれほど多くない最初のうちは、何とかメールと人力で処理できなくはありません。しかし、一定規模以上のシステムを稼働させれば、メールボックスはあっという間に大量のアラートメールで膨れ上がります。クラウドとオンプレミスを併用していれば、それぞれからアラートメールが来る一方、検索にも限界があります。アラートの内容を確認するのに、メールを一つずつ開いてはいられませんし、アラート同士の関連性を複数のメールから目視で把握するとなると、大事なメールを見落としてしまうこともしばしばで、もうお手上げ。
そこで次に人は、何とかメールを分類しようと、Excelに転記することを思いつきます。アラートメールを開いては、台帳にコピー&ペーストする単純作業を繰り返す中で、Excelが表計算アプリケーションであったことも、自分がシステム運用エンジニアであったことも思い出せなくなりそうに…。
こんな作業にRPAを使うなんて、愚の骨頂ですよね?こんな無意味な作業で疲弊するのは、そろそろ止めませんか?

<PR>監視サービスからのアラートの約97%は不要。忙しいエンジニアは、無駄なアラートに追われている余裕なんてありません!現場のプロが開発したサービス「UOM」を導入して、大量のアラートメール対応から卒業しましょう。詳しくはこちら

監視サービスからのアラートメールを取り込む

チケット管理機能は、いろいろなシステム監視サービスと連携されることがあります。システム監視サービスには、オープンソースで人気のZabbixを始め、PATROLCLARICEやNagios、JP1など、さまざまなサービスがあります。チケット管理機能の便利な機能の一つが、これらの監視サービスが送信する外部メッセージを取り込む機能です。すべてのチケット管理ツールが対応しているわけではありませんが、一部のツールは、メールやAPIで取り込んで処理します。

◯監視サービス

Zabbix/PATROLCLARICE/Nagios/JP1など
* これらの監視サービスが導入されている場合は統合運用管理サービスに連携し、ない場合は監視業務をアウトソースして処理

◯監視サービスの機能

  • URL監視
  • 接続監視
  • リソース監視
  • 死活監視
  • サービス監視
  • ログ監視
  • SNMP監視

取り込んだメールから、フィルタで抽出

監視サービスは、異常を感知するとアラートメールで知らせてくれます。しかし、果たしてそれは全部必要でしょうか?人は、自分が経験したくない情報に接すると、過小評価したり無視しがちですが、これは心理学用語で「正常性バイアス」と呼ばれます。アラートメールも同じで、アラートが常態化しては、もはやアラートの意味をなしません。つまり、すべてのアラートメールを受信する必要はなく、ノイズまで受信してはいけないのです。
運用管理サービスを使えば、監視サービスからのアラートメールを賢くフィルタ処理して、本当に注視しなければならないアラートだけを簡単に絞り込めます。
もちろん、絞り込む設定も自由にカスタマイズ可能です。有効にする日時や時間帯、メールの件名や本文、送信元のメールアドレスに任意の文字列が含まれているか・いないかなどの条件を細かく設定しておけば、自動的にシステム運用に必要なメールだけになります。
こうして、残ったアラートだけを、例えば自動電話(自動架電)やメール、SNSのメッセージなどで通知すればOK。これについては、また別の機会に。

自社環境で試してみるのが最も確実!

システム運用サービスを検討するときに重要なチェックポイントの一つは、今の環境に大掛かりな変更を加えなくても、導入して効果が出るか?サービスの機能や操作性、特長などは、カタログスペックではなく、実務で使い続ける中でしか実感できないものです。そのため、デモ用のサーバではなくできるだけ実際の自社環境で、実務に影響しないセキュアな範囲で試してみるのが確実。また、スタッフの学習期間なども考えて、ある程度長めのトライアル期間がある方が安心です。
そのシステム運用サービスは、自社に合うのか?まずは、チーム内の小規模な範囲でテスト導入してみて、じっくり検討することをお勧めします。

<PR>監視サービスからのアラートの約97%は不要。忙しいエンジニアは、無駄なアラートに追われる余裕なんてないはず!現場のプロが開発したサービス「UOM」を導入すれば、大量のアラート処理も不要に。詳しくはこちら

関連記事

∞∞∞∞∞∞∞ おすすめ記事 ∞∞∞∞∞∞

  1. マルチクラウド時代のSaaS、PaaS、IaaSを改めて復習しよう

    システム運用でも、もはや抜きでは語れないのがクラウドサービス。ひとまとめに「クラウド」といっても、大…
  2. もっと知ろう!システム運用に関わるエンジニアの役割の違い(2)

    もっと知ろう!システム運用に関わるエンジニアの役割の違い(2)

    システム運用には、さまざまなエンジニアが関わっています。大まかでも、それぞれの業務内容を把握しておく…
  3. 仮想化に使うコンテナ技術って何?仮想マシンじゃどこがダメなのか?

    仮想化に使うコンテナ技術って何?仮想マシンじゃどこがダメなのか?

    仮想化技術は今やITシステムに不可欠で、ビジネスの規模や業種に関係なく広く使われているのは、以前の記…
  4. 状況に応じて自動オペレーションや手順書対応:一次対応

    この連載ストーリーの背景 佐藤 一郎(42) アリガチシステムズの情報システム部…
  5. システム運用・保守のコストダウンをどのように進めるべきか?

    企業のビジネスにとって、ITシステムはなくてはならない存在です。国が企業に強力に推奨しているDX化の…
ページ上部へ戻る