[ Datadog ] Host Monitor

인쇄

모든 Datadog Agent는 datadog.agent.up 으로 상태를 체크할 수 있습니다.

  1. Pick hosts by name or tag

    첫번째 Select Box에서는 모니터할 host를 tag방식으로 선택합니다. (여러 조건 선택시 AND 논리적용) All Monitored Hosts 를 선택할 경우 모든 host 를 대상으로 합니다.
    두번째 Select Box에서는 선택된 첫번째 select Box 의 host중 제외 처리할 host를 tag방식으로 선택합니다. (여러 조건 선택시 OR 논리 적용)

  2. Set alert conditions
    이 섹션에서는 Check Alert 또는 Cluster Alert 중에서 선택합니다 .

    1. Check Alert

      image-20240223-082348.png


      Host가 지정된 시간 동안 보고를 중지하는 경우 알람이 생성됩니다.
      - select group에 선택된 group 별로 알람이 생성되며,
      - 보고중지가 되는 시간을 지정 할 수 있습니다. (default 2분)
      - 알람 발생시 특정 시간 후 자동으로 해제 하는 자동해제 기능도 사용할 수 있습니다.

    2. Cluster Alert

      image-20240223-082524.png

      일정 비율의 Host가 지정된 시간동안 보고를 중지하는 경우 알람이 생성됩니다.
      - 태그에 따라 호스트를 그룹화할지 여부를 결정합니다.
      Ungrouped포함된 모든 호스트의 상태 백분율을 계산합니다.
      Grouped그룹별로 상태 백분율을 계산합니다.
      - Alert 및 Warning 임계값에 대한 백분율을 선택합니다
      - 보고 중지에 대한 기준이 되는 시간을 지정 할 수 있습니다. (default 2분)
      - 알람 발생시 특정 시간 후 자동으로 해제 하는 자동해제 기능도 사용할 수 있습니다.
      - Grouped 를 선택 했을 경우, 새로운 group이 추가 될 때 , 해당 알람이 적용되기 까지의 delay 시간을 지정 할 수 있습니다. (Before evaluating new groups 설정)

  3. Notify your team
    알람을 전파 받을 대상(메일)을 선택하거나, Integration에서 설정된 채널을 목록에서 선택 합니다.

    image-20240223-083015.png
    • Alert Title : 알람 발생시 전파되는 Message의 제목입니다.
      - 예시 : [경고] [{{service.name}}] {{host.name}} 서버의 응답이 없습니다.

    • Alert Message
      - 알람 발생시 전파되는 Message의 내용입니다.
      - 예시

      {{#is_alert}}

      발생시간(ST): {{local_time 'last_triggered_at' 'Asia/Seoul'}}

      [심각] [{{env.name}}][{{service.name}}] {{host.name}} ({{host.ip}}) 서버의 응답이 없습니다.

      {{/is_alert}}

      {{#is_alert_recovery}}

      발생시간(KST): {{local_time 'last_triggered_at' 'Asia/Seoul'}}

      [심각 해제] [{{env.name}}][{{service.name}}] {{host.name}} ({{host.ip}}) 서버의 응답 없음이 해제 되었습니다.

      {{/is_alert_recovery}}
    • Use Message Template Variables
      Check how to use available templates and variables in the Alert title and Message body.
      Reference for available variables: https://docs.datadoghq.com/monitors/notify/variables/?tab=is_alert

    • Notify your services and your team members settings
      Integrated notification channels such as opsgenie, slack, TEAMS, webhook, and email will be displayed.
      Set the channel or target email to propagate the alert.

    • Content displayed settings (Message content configuration)
      Configure whether to include automatically added content such as query/snapshot in the Message.

    • Include Triggering tags in notification title settings
      Displays the tag of the affected target in the title of the Message propagated when an alert occurs.

    • Aggregation settings
      Set alert conditions If a selected Group exists, it is automatically set as a multi-alert.

    • Renotification settings
      If Alert (Warning) or Nodata persists, re-alerts will be propagated at the selected time intervals.

    • Tags settings
      Tags for monitors can be set for use when querying in Manage Monitors or configuring a Downtime schedule.

    • Priority settings
      Set the severity (importance) of alerts from P1 to P5.
      Priority settings (standardized according to the criteria below)

온라인상담

문의하기

이 답변이 유용합니까? 아니오

Send feedback
도움이 되어드리지 못해 죄송합니다. 아티클 개선을 위해 의견을 제공해 주시기 바랍니다.