[ Datadog ] Host Monitor

印刷

すべての Datadog Agent は datadog.agent.up でステータスを確認できます。

  1. ホストを名前またはタグで選択

    最初の Select Box では、監視するホストをタグ方式で選択します。(複数条件を選択すると AND 論理が適用されます)All Monitored Hosts を選択すると、すべてのホストが対象になります。
    2 番目の Select Box では、最初の Select Box で選択されたホストの中から除外するホストをタグ方式で選択します。(複数条件を選択すると OR 論理が適用されます)

  2. アラート条件を設定
    このセクションでは、Check Alert または Cluster Alert を選択します。

    1. Check Alert

      image-20240223-082348.png


      ホストが指定された時間内に報告を停止した場合、アラームが発生します。
      - select group に選択されたグループごとにアラームが生成されます。
      - 報告停止時間を指定できます。(デフォルト 2 分)
      - アラーム発生後、一定時間後に自動解除する機能も使用できます。

    2. Cluster Alert

      image-20240223-082524.png

      一定割合のホストが指定された時間内に報告を停止した場合、アラームが発生します。
      - タグによってホストをグループ化するかどうかを決定します。
      Ungrouped はすべてのホストのステータス割合を計算します。
      Grouped はグループごとにステータス割合を計算します。
      - Alert および Warning の閾値を設定します。
      - 報告停止の基準となる時間を指定できます。(デフォルト 2 分)
      - アラーム発生後、一定時間後に自動解除する機能も使用できます。
      - Grouped を選択した場合、新しいグループが追加された際にアラームが適用されるまでの遅延時間を指定できます。(Before evaluating new groups 設定)

  3. チームに通知
    アラームを受信する対象(メール)を選択するか、Integration で設定されたチャンネルをリストから選択します。

    image-20240223-083015.png
    • Alert Title: アラーム発生時に通知されるメッセージのタイトルです。
      - 例 : [警告] [{{service.name}}] {{host.name}} サーバーが応答しません。

    • Alert Message
      - アラーム発生時に通知されるメッセージの内容です。
      - 例

      {{#is_alert}}

      発生時間(ST): {{local_time 'last_triggered_at' 'Asia/Tokyo'}}

      [重大] [{{env.name}}][{{service.name}}] {{host.name}} ({{host.ip}}) サーバーが応答しません。

      {{/is_alert}}

      {{#is_alert_recovery}}

      発生時間(JST): {{local_time 'last_triggered_at' 'Asia/Tokyo'}}

      [重大解除] [{{env.name}}][{{service.name}}] {{host.name}} ({{host.ip}}) サーバーの応答が復旧しました。

      {{/is_alert_recovery}}
    • メッセージテンプレート変数の使用
      アラートタイトルとメッセージ本文で使用可能なテンプレートおよび変数の使用方法を確認できます。
      使用可能な変数の参考: https://docs.datadoghq.com/monitors/notify/variables/?tab=is_alert

    • サービスとチームメンバーの通知設定
      Opsgenie / Slack / TEAMS / Webhook などの統合された通知チャネルおよびメールが表示されます。
      アラートを通知するチャネルまたは対象のメールを設定してください。

    • 表示内容の設定(メッセージ内容の構成)
      クエリ / スナップショットなど、自動的に追加される内容をメッセージに含めるかどうかを設定します。

    • 通知タイトルにトリガータグを含める設定
      アラート発生時に通知されるメッセージのタイトルに、アラートが発生した対象のタグを表示します。

    • 集約設定
      アラート条件の設定 でグループが選択されている場合、自動的にマルチアラートとして設定されます。

    • 再通知設定
      アラート(警告)またはデータなしの状態が継続する場合、選択した時間ごとに再通知が送信されます。

    • タグ設定
      「Manage Monitors」での検索やダウンタイムスケジュール設定時に使用できる
      モニター用のタグを設定します。

    • 優先度設定
      P1〜P5の範囲でアラートの重大度(重要度)を設定します。
      優先度設定(以下の基準で標準化)

オンライン相談

問い合わせ

この回答は役に立ちましたか? はい いいえ

フィードバックを送信
お役に立てずに申し訳ございません。この記事を向上させるためにフィードバックをお願い致します。