状況に応じて自動オペレーションや手順書対応:一次対応

この連載ストーリーの背景

佐藤 一郎(42)

アリガチシステムズの情報システム部門チームリーダー。コロナ禍2年目の体制をどう再整備して、チームだけでなく会社のビジネスに貢献していくかが、今の課題。



鈴木 武士(31)

同部門所属のシステム運用エンジニア。転職入社したての中堅で、前職ではエンタープライズ系の経験もある。チームと自分の価値をより高めるには?



(株)アリガチシステムズ
従業員300人の中堅企業。情報システム部門はわずか5人だが、これまでは限られた人材だけで何とか運用管理してきた。しかし、問題はこの先どうするか…。

前回のやり取り

メールやSNS、自動電話で受信できる強み:通知
https://un4navi.com/uom/21147/

定番の処理は、事前登録したコマンドを自動実行

—お互いに自宅からのビデオ会議にて

 
今日のビデオ会議は、雰囲気がいつもより何だかどんよりしてませんでしたか?先日のインシデント対応に振り回されたメンバーは、疲れがまだ抜けてない様子というか…。
 
 
そうなんだよ、暗い表情は照明のせいじゃなかった…。そもそもシステム運用なんて、人が24時間365日張り付いて対応できない仕事だしね。できるだけ早く、システム運用をもっと効率化して、現場のストレスを減らさなければ。
 
 
その意味でも、統合型システム運用管理サービスUOMの「自動オペレーション」機能は、とても有効かもしれません。
 
 
自動オペレーションか…アラート通知が来た場合の処理を事前に設定しておいて、自動的に実行できたらいいけど。
 
 
そうなんです!佐藤さんの期待の通りです。UOMがアラートを検知したら、事前に登録したコマンドを実行する機能があるんです。
 
 
それはいい!その自動オペレーションを使えば、定型の作業をスクリプトで処理できるんだね?
 
 
はい。例えばWindowsならPowerShell、UNIXならシェルスクリプトなど、独自のスクリプトを利用できます。Linux系とCisco機器への、ssh接続オペレーションが使えるから便利ですよ。IIJ標準のスクリプトもサポートしています。
 
 
なるほど。実行できるサーバ台数はどれぐらいまでOKかな?
 
 
自動オペレーションの上限は、ルール数ではなく、適用サーバ台数で決定されます。実際にコマンドを実行した台数ではなく、事前に実行対象として設定した台数です。オプションで追加もできるので、システムに合わせてスケーラブルに調整できますね。
 
 
ふむふむ。軽微な定番の処理なら、オペレーションの対象とタイミングを決めておけばOKなのか。復旧優先で対応する場合、サーバやプロセスの再起動が必要になるけど、その定型作業を自動化できれば、エンジニアが動かなくても最短時間で障害に対応できるね。
 
 
はい。管理画面から任意のタイミングで、手動でも実行可能です。もちろん、スクリプトの実行結果は、通知として受け取れます。実行結果によって、通知方法をメール、SNS、自動電話に設定できるので、うまくいかなかった場合にだけ自動電話連絡にすることもできます。
 
 
コマンドを叩くだけの簡単な手順書作業なら、予めシステムで処理できるようにしておくわけか。
 
 
はい、おっしゃるように、これなら人の手よりも速く正確に、システムを復旧できます。
 
 
これからも注意が必要な変異種や次の感染拡大も考えると、ITインフラだけでなく働く場所や人材の冗長性からも、自動化はますます重要だな。
 
 
はい。今のうちに自動化できることは徹底的に自動化しておく対策は、システム運用だけでなく、うちの会社全体のBCP(事業継承計画)の観点からも重要だと思います。
 

UOMの自動オペレーション機能を使用するメリット

UOMの「自動オペレーション」機能は、障害が起きたときに、迅速に復旧作業を進めるのに役立つ機能です。また、実施したい対応を登録しておくことで、毎日または毎週決まった時間に自動的に処理することも可能です。

  • システム運用・保守業務でよくある「既定コマンドの実行」「再起動」などを自動で処理できる機能です。
  • サーバやプロセスの再起動など、初期対応で必要なコマンドを叩くだけの簡単な手順書作業は、UOMで処理することにより、人の手より速く正確にシステムを復旧できます。
  • アラートを検知した時や任意のタイミングで、事前に登録したコマンド(スクリプト)を実行できます。業務や体制、対応内容に合わせて、自動化する内容を詳細に設定できます。
  • さらに、実行結果を自動通知するため、追加で対応が必要かどうかも確認できます。

自動オペレーションのコマンド画面

 

一次対応の現場が知りたいTIPS

● アラート連動でコマンド実行したい
・ 自動オペレーション設定 https://manual.iij.jp/uom/usersguide-config/17895059.html
・ アラート通知/対応設定 https://manual.iij.jp/uom/usersguide-config/17895065.html
※特に手順4 「自動運用手順名」の設定を上手に活用することで運用業務の効率化が可能です。

● 定刻、または任意のタイミングでコマンド実行したい
・ 自動オペレーション設定 https://manual.iij.jp/uom/usersguide-config/17895059.html
・ 定刻実行|定期自動オペレーション申請 https://manual.iij.jp/uom/usersguide-operation/18980261.html
・ 任意実行|チケット更新時のコマンド実行 https://manual.iij.jp/uom/usersguide-ticket/17891687.html
・ 任意実行|自動オペレーション設定 https://manual.iij.jp/uom/usersguide-config/17895059.html
※特に手順4 「テスト実行」を活用して、登録前にコマンドの実行テストを行い、テスト結果をメールで確認することで誤操作を防ぐことができます。

● 復旧作業(コマンド実行)結果を確認したい
・ 自動オペレーション設定 https://manual.iij.jp/uom/usersguide-config/17895059.html
※特に手順4にある 「正常時連絡先グループ」「警告時連絡先グループ」「異常時連絡先グループ」を上手に活用することで自動オペレーションでの復旧ができなかった場合に、迅速に対応することが可能です。
・ アラート通知/対応設定 https://manual.iij.jp/uom/usersguide-config/17895065.html
※手順4 「自動運用手順名」の設定でコマンドやジョブの設定が可能で、ノードに合わせた最適な手順を体制や内容に合わせて対応することが可能です。

● AWS/Azure/GCPも自動化したい
・ クラウドアカウント設定 https://manual.iij.jp/uom/usersguide-config/17895063.html
・自動オペレーション設定 https://manual.iij.jp/uom/usersguide-config/17895059.html
・ アラート通知/対応設定 https://manual.iij.jp/uom/usersguide-config/17895065.html
※手順4 「自動運用手順名」の設定でコマンドやジョブの設定が可能で、各種クラウド環境のノードでも最適な手順を体制や内容に合わせて対応することが可能です。

自社環境に合わせて、自由に設定して使いたい!選べるUOMの柔軟なパック

  • 「ベーシックパック」「アドバンストパック」「エンタープライズパック」などから自由にお選びいただけます。
  •  監視や自動オペレーション、レポート生成、ジョブ管理機能など、機能と数量に合わせて選択可能です。
  • 一部の機能はオプションで追加したり、台数やポイント数によるカウントで、費用体系も柔軟です。

詳細:https://www.iij.ad.jp/biz/uom/plan.html

<PR> 「IIJ統合運用管理サービス(UOM)」は、御社の環境で実際にお試しいただける無料トライアルをご用意しています。お申し込みいただければ、すぐにお試しいただくことが可能です。 UOMの特徴的な機能を60日間、現場のシステム運用エンジニアの皆さんに、タップリご検討いただけます。ぜひ、今すぐ無料トライアルにお申し込みください。
特徴的な機能を試せる60日間! 簡単な初期設定済みでいきなり使える! 無料トライアルは今すぐ! IIJ統合運用管理サービスUOM
・フォームが表示されるので、ご記入の上、お申し込みください。後日、IIJ担当者からご連絡差し上げます。
・無料トライアルにお申し込みいただけるのは、法人のみです。個人は対象外ですので、ご了承ください。

初期設定もお任せで、すぐに使いたい! そんなニーズには、UOM「シンプルパック」

  • 長年の豊富な運用実績を持つIIJが、システム運用のノウハウをテンプレート化。個別運用設計が不要です。
  • システム運用の初動を自動オペレーションで実行します。自動電話により、夜間休日でもお客様に通知します。
  • 監視・運用の初期設定をIIJで代行します。運用開始後は、コントロールパネルから設定を変更できます。

「シンプルパック」の詳細およびお申し込みは今すぐ!

関連記事

∞∞∞∞∞∞∞ おすすめ記事 ∞∞∞∞∞∞

  1. コレって我が社だけ!?システム「運用」と「保守」ってどう違う?

    現代のビジネスで欠かせないITシステム。システム「運用」や「保守」は、企業の安定した組織運営の重要な…
  2. システム運用の一部である監視とは?具体的に何を監視すべきか?

    システム運用の一部である監視とは?具体的に何を監視すべきか?

    システムの停止は、ビジネスに大きなマイナスの影響を与えます。そこで重要なのが、サービスがダウンする前…
  3. もっと知ろう!システム運用に関わるエンジニアの役割の違い(2)

    もっと知ろう!システム運用に関わるエンジニアの役割の違い(2)

    システム運用には、さまざまなエンジニアが関わっています。大まかでも、それぞれの業務内容を把握しておく…
  4. 待ったなし!システム運用現場へのテレワーク導入

    コロナ禍が広がりつつあった今年の年度末以降、一気にテレワーク化が進みました。ネットワークのトラフィッ…
  5. SREって大規模な組織の話?開発と運用をチームにするメリットとは?

    システム運用に関する話題の中でもたびたび目にする機会が増えてきた「SRE」。これは、「サイトリライア…
ページ上部へ戻る