[ Datadog ] NTP Integration

印刷


1. NTP Integration 設定

Linux / Windows 설정 방법

プラットフォーム

パス

Linux

/etc/datadog-agent/conf.d/ntp.d/conf.yaml

Windows

%ProgramData%\Datadog\conf.d\ntp.d\conf.yaml

Datadog Agent Manager 의 Checks 메뉴에서 Manage Checks의 ntp.d\conf.yaml 選択後設定

conf.yaml 設定

  • Local NTP 使用時

    init_config:
    instances:
      - use_local_defined_servers: true         ## Local NTP 사용 시 true 변경. (Default)false
  • 指定NTPサーバー使用時

    init_config:
    instances:
        ## @param host - string - optional
        ## Single NTP server hostname or IP address to connect to.
      - host: OOO.OOO.OOO.OOO             ## NTP 주소를 직접 입력
  • 設定後のエージェントの再起動
    設定変更後にDatadog Agentを再起動する必要があります。

OS

Command

Linux

CentOs/Redhat

sudo systemctl restart datadog-agent

sudo restart datadog-agent

Ubuntu/Debian

sudo service datadog-agent restart

Windows

  • cmdで以下のコマンドを実行する"%ProgramFiles%\Datadog\Datadog Agent\bin\agent.exe" status

  • Datadog Agent Manager > Restart Agent

  • Windows Icon tray > Datadog Icon tray マウス右クリック > restart

Local NTP 設定時の基準値

  • Linux(UNIX): /etc/ntp.conf または etc/xntp.conf 値を参照

  • Windows: HKLM\SYSTEM\CurrentControlSet\Services\W32Time\Parameters\NtpServer 参照

  • LocalがOSの上記の情報を参照していない場合はUnknownとして認識します。

Kubernetes 設定方法

Kubernetes managed service で作成されたノードが Linux および Windows OS かどうかに応じて、以下のパスに ntp 関連の設定値が存在するかどうか、および各 Cloud provider の Worker node で正式にローカル NTP サーバーをサポートしているか Cloud provider で確認が必要

## For Unix system, the servers defined in "/etc/{ntp,xntp,ntpd,chrony}.conf" and "/etc/openntpd/ntpd.conf" are used.

## For Windows system, the servers defined in registry key HKLM\\SYSTEM\\CurrentControlSet\\Services\\W32Time\\Parameters\\NtpServer are used.

Datadog Agent Configmap 設定

  • Local NTP 使用時
    ‘use_local_defined_servers: true’ 設定を追加してください。

  • 지정 NTP サーバー使用時
    直接NTPサーバーIPを指定したい場合は、「host:<IP情報>」設定を追加してください。

Helm デプロイ values.yaml 設定

  • Local NTPを使用する場合(Linuxノードに基づく)

    confd: 
        ntp.yaml: |-
          init_config:
          instances:
            - use_local_defined_servers: true
    
    # agents.volumes -- Specify additional volumes to mount in the dd-agent container
    volumeMounts:
         - name: ntp
           mountPath: /etc/ntp.conf
      volumes:
         - name: ntp
           hostPath:
             path: /etc/ntp.conf
  • 指定NTPサーバー使用時(Linuxノードベース)

    confd: 
        ntp.yaml: |-
          init_config:
          instances:
            - host: OOO.OOO.OOO.OOO
  • 設定後 helm chart upgrade (Agent pod 自動再起動)

    helm upgrade -f values.yaml <RELEASE NAME> datadog/datadog

2. NTP チェック

NTPはDatadogのヘルスチェック機能であるService Checkを介して収集ステータスを確認できます。収集すると、ntp.offsetメトリックが収集されます。

Check Summary 状態確認

image-20240307-013848.png

  • Check Summary は、Service Check 全体の概要情報を表示するメニューです。

    メニューパス: Monitors > Check Summary

  • ntp.in_sync の Status を以下のように確認します。

    • OK : 状態正常

    • Critical : NTPオフセットは違い

    • Unknown : ntp.offset 収集しない

ntp.offset メトリックの確認

  • Metrics の Summary メニューから ntp.offset メトリックを収集するかどうかを確認できます。

    image-20240307-014017.png
  • Metricsのエクスプローラメニューからntp.offsetメトリック値を確認できます。 。収集サイクルは15分です。

    image-20240307-014046.png
  • Monitors の検索ボックスで type:custom または ntp で検索すると、デフォルトの NTP アラートを確認できます。

  • 最近2分のNTPステータス値に基づいてアラームが発生します。

    image-20240307-014225.png
  • 現在展開されているNTPアラートルールの場合は、以下のようにDo not notify for Unknown statusに設定され、Unknown状態でもOKと表示されます。

    image-20240307-014304.png

3. NTP Alert 設定

Monitors > New Monitor > Service Check メニューで設定可能で、基本的に提供される「Clock in sync with NTP」モニターを修正して使用可能です。

  • Service Check Monitor 構成

    image-20240223-050235.png

    ① Pick a Service Check
    - 監視可能なサービスチェックターゲットの選択。この場合、ntp.in_syncを選択します。

    image-20240307-044926.png

    ② Pick monitor scope: Tag ベースの範囲設定

    image-20240223-055442.png

    - 監視範囲の設定

    :同じサービスチェックが持っている完全なホストからタグベースの範囲の選択をサポートします。

    Scopeの条件を選択すると、AND条件のロジックとして動作します。

    ホスト全体を対象にする場合は、「All Monitored Hosts」として選択してください。

    - Excluding条件の適用

    :タグベースの除外範囲の選択をサポートしています。

    Excluding条件適用時にはOR条件のロジックとして動作します。

    ③ Set alert conditions: alert 発生条件の設定

    image-20240307-045224.png

    ▶ Aelrt発生条件の設定

    - SSH CheckをMonitorを設定するときは、Check Alertで選択します。

    a. Check Alert: 単一サービスごとのアラート発生条件の設定。

    b. Cluster Alert: Cluster グループ内の Service Check 失敗率でアラート発生条件を設定する

    ▶ Alert 発生 group by 条件設定。

    - ホストを選択します。

    ▶アラート発生と解消条件の設定

    - Warning/Critical/OK 状態になる条件を設定します。

    - Warning/Criticalには連続失敗回数を、OKには成功回数を選択します。

    - Do not notify / Notify for Unknown status 設定は Unknown で監視される項目がある場合

    Alertを発生して認識できるようにNotifyを選択して使用します。

    ▶ Do not notify/Notify 設定

    - データ収集がない場合の通知の設定です。

    - Defaultは「Do not notify」で、Nofiyに設定したときに設定された時間の間データがない場合

    Nodataアラームが発生します。

    ▶ Alert 自動 Resolve 設定

    - Alert発生後、状況が解除されてresolveにならず、Alert状態が持続する場合

    設定された時間が経過すると自動的にresolve処理を行う機能です。

    - Defaultは「Never」で自動resolveを行いません。

    時間を選択してください。


    ④ Notify your team: 電波設定

    image-20240307-050324.png

    ▶ Alert Title

    - アラーム発生時に伝播されるメッセージのタイトルです。

    ▶ Alert Message

    - アラーム発生時に伝播されるメッセージの内容です。

    ▶ Use Message Template Variables

    - Alert title と Message 本文で使用可能な Template と変数の使用法を確認できます。

    ▶ Notify your services and your team members 設定

    - opsgenie / slack / TEAMS / webhookなど integrationされたチャンネルやemailなどのNotiチャンネルが表示されます。

    アラームを伝播するチャンネルまたは宛先メールを設定してください。

    ▶ Content displayed 設定 (Message 構成内容設定)

    - query / snapshot など自動追加される内容を Message に含めるかどうかを設定します。

    ▶ Include Triggering tags in notification title 設定

    - アラーム発生時に伝播されるメッセージのタイトルに、アラームが発生した宛先のタグを表示します。

    ▶ Aggregationの設定

    - SSH check ターゲットホストごとにアラームを発生させるため、Multi Alert - Host を選択する必要があります。

    ▶ Renotificationの設定

    - Alert(Warning)またはNodataが続く場合、選択した時間ごとに再アラームを伝播します。

    ▶タグ設定

    - Manage Monitorsで照会時、Downtime schedule設定時に使用可能なmoniotorのためのTagを

    設定します。

    ▶ Priority設定

    - P1~P5でアラームの重大度(重要度)などを設定します。

    ⑤ Define permission and audit notifications

    image-20240307-050759.png

    ▶ Restrict editing 設定

    - Alert に対する変更権限を設定します。

    ロールを選択すると、そのロールを持つユーザーはすべて変更できます

    ▶ Test Notifications

    - ボタンをクリックすると、設定した内容を選択したチャンネルにテストアラームを送信します。

    ▶ Create

    - ボタンをクリックすると設定内容を保存します。

オンライン相談

問い合わせ

この回答は役に立ちましたか? はい いいえ

フィードバックを送信
お役に立てずに申し訳ございません。この記事を向上させるためにフィードバックをお願い致します。