1. NTP Integration 設定
Linux / Windows 설정 방법
プラットフォーム | パス |
---|---|
Linux | /etc/datadog-agent/conf.d/ntp.d/conf.yaml |
Windows | %ProgramData%\Datadog\conf.d\ntp.d\conf.yaml |
Datadog Agent Manager 의 Checks 메뉴에서 Manage Checks의 ntp.d\conf.yaml 選択後設定 |
conf.yaml 設定
Local NTP 使用時
指定NTPサーバー使用時
設定後のエージェントの再起動
設定変更後にDatadog Agentを再起動する必要があります。
OS | Command | |
---|---|---|
Linux | CentOs/Redhat | sudo systemctl restart datadog-agent sudo restart datadog-agent |
Ubuntu/Debian | sudo service datadog-agent restart | |
Windows |
|
Local NTP 設定時の基準値
Linux(UNIX): /etc/ntp.conf または etc/xntp.conf 値を参照
Windows: HKLM\SYSTEM\CurrentControlSet\Services\W32Time\Parameters\NtpServer 参照
LocalがOSの上記の情報を参照していない場合はUnknownとして認識します。
Kubernetes 設定方法
Kubernetes managed service で作成されたノードが Linux および Windows OS かどうかに応じて、以下のパスに ntp 関連の設定値が存在するかどうか、および各 Cloud provider の Worker node で正式にローカル NTP サーバーをサポートしているか Cloud provider で確認が必要
## For Unix system, the servers defined in "/etc/{ntp,xntp,ntpd,chrony}.conf" and "/etc/openntpd/ntpd.conf" are used.
## For Windows system, the servers defined in registry key HKLM\\SYSTEM\\CurrentControlSet\\Services\\W32Time\\Parameters\\NtpServer are used.
Datadog Agent Configmap 設定
Local NTP 使用時
‘use_local_defined_servers: true’ 設定を追加してください。지정 NTP サーバー使用時
直接NTPサーバーIPを指定したい場合は、「host:<IP情報>」設定を追加してください。
Helm デプロイ values.yaml 設定
Local NTPを使用する場合(Linuxノードに基づく)
指定NTPサーバー使用時(Linuxノードベース)
設定後 helm chart upgrade (Agent pod 自動再起動)
2. NTP チェック
NTPはDatadogのヘルスチェック機能であるService Checkを介して収集ステータスを確認できます。収集すると、ntp.offsetメトリックが収集されます。
Check Summary 状態確認
Check Summary は、Service Check 全体の概要情報を表示するメニューです。
メニューパス: Monitors > Check Summary
ntp.in_sync の Status を以下のように確認します。
OK : 状態正常
Critical : NTPオフセットは違い
Unknown : ntp.offset 収集しない
ntp.offset メトリックの確認
Metrics の Summary メニューから ntp.offset メトリックを収集するかどうかを確認できます。
Metricsのエクスプローラメニューからntp.offsetメトリック値を確認できます。 。収集サイクルは15分です。
Monitors の検索ボックスで type:custom または ntp で検索すると、デフォルトの NTP アラートを確認できます。
最近2分のNTPステータス値に基づいてアラームが発生します。
現在展開されているNTPアラートルールの場合は、以下のようにDo not notify for Unknown statusに設定され、Unknown状態でもOKと表示されます。
3. NTP Alert 設定
Monitors > New Monitor > Service Check メニューで設定可能で、基本的に提供される「Clock in sync with NTP」モニターを修正して使用可能です。
Service Check Monitor 構成
① Pick a Service Check
- 監視可能なサービスチェックターゲットの選択。この場合、ntp.in_syncを選択します。② Pick monitor scope: Tag ベースの範囲設定
- 監視範囲の設定
:同じサービスチェックが持っている完全なホストからタグベースの範囲の選択をサポートします。
Scopeの条件を選択すると、AND条件のロジックとして動作します。
ホスト全体を対象にする場合は、「All Monitored Hosts」として選択してください。
- Excluding条件の適用
:タグベースの除外範囲の選択をサポートしています。
Excluding条件適用時にはOR条件のロジックとして動作します。
③ Set alert conditions: alert 発生条件の設定
▶ Aelrt発生条件の設定
- SSH CheckをMonitorを設定するときは、Check Alertで選択します。
a. Check Alert: 単一サービスごとのアラート発生条件の設定。
b. Cluster Alert: Cluster グループ内の Service Check 失敗率でアラート発生条件を設定する
▶ Alert 発生 group by 条件設定。
- ホストを選択します。
▶アラート発生と解消条件の設定
- Warning/Critical/OK 状態になる条件を設定します。
- Warning/Criticalには連続失敗回数を、OKには成功回数を選択します。
- Do not notify / Notify for Unknown status 設定は Unknown で監視される項目がある場合
Alertを発生して認識できるようにNotifyを選択して使用します。
▶ Do not notify/Notify 設定
- データ収集がない場合の通知の設定です。
- Defaultは「Do not notify」で、Nofiyに設定したときに設定された時間の間データがない場合
Nodataアラームが発生します。
▶ Alert 自動 Resolve 設定
- Alert発生後、状況が解除されてresolveにならず、Alert状態が持続する場合
設定された時間が経過すると自動的にresolve処理を行う機能です。
- Defaultは「Never」で自動resolveを行いません。
時間を選択してください。
④ Notify your team: 電波設定
▶ Alert Title
- アラーム発生時に伝播されるメッセージのタイトルです。
▶ Alert Message
- アラーム発生時に伝播されるメッセージの内容です。
▶ Use Message Template Variables
- Alert title と Message 本文で使用可能な Template と変数の使用法を確認できます。
▶ Notify your services and your team members 設定
- opsgenie / slack / TEAMS / webhookなど integrationされたチャンネルやemailなどのNotiチャンネルが表示されます。
アラームを伝播するチャンネルまたは宛先メールを設定してください。
▶ Content displayed 設定 (Message 構成内容設定)
- query / snapshot など自動追加される内容を Message に含めるかどうかを設定します。
▶ Include Triggering tags in notification title 設定
- アラーム発生時に伝播されるメッセージのタイトルに、アラームが発生した宛先のタグを表示します。
▶ Aggregationの設定
- SSH check ターゲットホストごとにアラームを発生させるため、Multi Alert - Host を選択する必要があります。
▶ Renotificationの設定
- Alert(Warning)またはNodataが続く場合、選択した時間ごとに再アラームを伝播します。
▶タグ設定
- Manage Monitorsで照会時、Downtime schedule設定時に使用可能なmoniotorのためのTagを
設定します。
▶ Priority設定
- P1~P5でアラームの重大度(重要度)などを設定します。
⑤ Define permission and audit notifications
▶ Restrict editing 設定
- Alert に対する変更権限を設定します。
ロールを選択すると、そのロールを持つユーザーはすべて変更できます
▶ Test Notifications
- ボタンをクリックすると、設定した内容を選択したチャンネルにテストアラームを送信します。
▶ Create
- ボタンをクリックすると設定内容を保存します。
オンライン相談
問い合わせ