【Zabbix】【book】 Zabbix 3.0 運用 (5) - 障害の検知と通知【SW】

Ubuntu 18.04 での Zabbix 3.0 運用 (障害の検知と通知)
 
下記「サーバ/インフラエンジニア養成読本」による学習記録。
【改訂新版】 サーバ/インフラエンジニア養成読本 管理/監視編 [24時間365日稼働を支える知恵と知識が満載!] (Software Design plus)
 

 

 

トリガーについて

障害と判定するための閾値を設定する必要があり、この閾値のことを Zabbix ではトリガーと呼んでいる。
基本的な閾値設定はテンプレートとして用意されている。
 
 
 

トリガーの一覧を見る

[監視データ] - [トリガー] より、デフォルト状態のフィルタ設定で表示した画面が以下である。
f:id:dnkrnka:20181111214738p:plain
 
一件だけ警告が出ているが、解決済みなので、「コメントあり」項目の「いいえ」をクリックしてコメントを入力する。
すると、「解決済み」となり、下図のように「コメントあり」項目が「はい」に変化する。
 
f:id:dnkrnka:20181111215049p:plain
 
その後はフィルタリング設定で「コメント未入力」などに絞って表示すれば指摘一覧が非表示になる。
 
f:id:dnkrnka:20181111215517p:plain:w1500

  
 

トリガーの設定値を確認する

 
[設定] - [ホスト] からホストを選択し、[トリガー] をクリックすると下図のような画面に遷移する。
下図は全てのトリガーを表示させた状態である。
 
f:id:dnkrnka:20181111215954p:plain
 

現在有効な「軽度の障害」を表示させる

フィルター にて設定すれば下図のように表示される。
 
f:id:dnkrnka:20181111220344p:plain
 
 

トリガーを編集する

 

「Lack of available memory on server {HOST.NAME}」の場合

 
現在の設定は、「条件式」の列から 20MB 以下になればトリガーが発動して障害になる、としている。
 
f:id:dnkrnka:20181111220823p:plain:w1400
 
この 20MB という値を変更するためには「名前」列にあるリンク「Lack of available memory on server {HOST.NAME}」というリンクをクリックして編集すれば良い。
 
実際の編集画面は以下のようになっている。
 
f:id:dnkrnka:20181111221203p:plain
 
 
 

障害の通知

トリガーの閾値を超えた場合、アクションを実行させることができる。
ここでは障害が発生したものとして、メール通知をするアクションを作成する。
 

メールサーバの設定

 
[管理] - [メディアタイプ] - [Email] をクリックする
 
f:id:dnkrnka:20181111221756p:plain
 
すると設定画面が開くので、必要な情報を入力する。
 
f:id:dnkrnka:20181111221857p:plain
 

アクションの設定をする

 
ここではトリガーを引いたら「メール通知をする」というアクションを定義する。
具体的な設定手順および条件は次の通り。
 
 

1.「アクションの作成」に進む

[設定] - [アクション] - [アクションの作成]をクリックする
f:id:dnkrnka:20181111222621p:plain
 

2. 条件を設定する

アクションタブに次の値を設定する

項目 小項目 内容
名前  -  障害検知
デフォルトの件名  -  (デフォルトのまま変更しない)
デフォルトのメッセージ  -  (デフォルトのまま変更しない)

 
f:id:dnkrnka:20181111223010p:plain:w1500

 

アクションの実行条件タブに次の値を設定する。

項目 小項目 内容
名前  -  障害検知
アクションの実行条件  -  メンテナンス状態 期間外
"メンテナンス" トリガーの値 = "障害"

 
f:id:dnkrnka:20181111223342p:plain
 

 
アクションの実行内容タブ

項目 小項目 内容
実行内容のタイプ  -  メッセージの送信
ユーザーグループに送信  -  System Administrators

 
下図の「追加」リンクをクリックする
f:id:dnkrnka:20181111223541p:plain
 
下図の「ユーザーグループに送信」項目にある「追加」リンクをクリックして、「System Administrators」を選択する
f:id:dnkrnka:20181111223741p:plain
 
ユーザグループである「System Administrators」の追加ができた。
次は、「アクションの実行条件」項の「新規条件」リンクをクリックする。
 
f:id:dnkrnka:20181111224221p:plain
 
とりあえず 「障害対応済 = コメントあり」とする。
これは 障害が解消した後でかつ、コメントを入力していればアクションを実行するという意味である。*1
そして、入力が完了したら、「追加」リンクをクリックする。
 
f:id:dnkrnka:20181111225806p:plain
 

「追加」ボタンを押すと次のように登録が完了する。
 
f:id:dnkrnka:20181111225613p:plain





 
 
 
 
 
 
 

*1:コメントには障害原因が書かれることを期待している