[ Datadog ] Agent의 상태 및 문제 확인은 어떻게 해야하는지 알고 싶습니다.

Print

(blue star) Agent 상태 확인

  • Agent의 Status 확인
    - Agent가 현재 up 상태인지 down 상태인지 확인 합니다.

OS

Command

Linux

CentOs/Redhat

sudo systemctl status datadog-agent

sudo status datadog-agent

Ubuntu/Debian

sudo service datadog-agent status

Windows

작업관리자 > 서비스에서 datadog로 시작하는 서비스 상태 확인

Kubernetes

kubectl exec -it <POD_NAME> -- s6-svstat /var/run/s6/services/agent/

(blue star) Agent의 수집 상태 확인

  • Agent의 수집 상태 확인
    - Agent는 Up상태인데 수집이 안되는 경우, 수집 상태를 확인 합니다.

OS

Command

Linux

sudo datadog-agent status

Windows

  • cmd에서 아래 command 실행
    "%ProgramFiles%\Datadog\Datadog Agent\bin\agent.exe" status

  • Datadog Agent Manager > Status > General, Collector 에서 수집 상태 확인

Kubernetes

kubectl exec -it <POD_NAME> -- agent status

(blue star) Agent의 Log 확인

  • Agent의 Log 확인
    - Agent를 재시작했는데 자꾸 꺼지거나, Agent 수집 상태를 확인 시 특이 사항이 없을 경우,
    Log상의 ERROR를 확인합니다.

OS

경로

Linux

/var/log/datadog/

Windows

C:\ProgramData\Datadog\logs

(blue star) Agent 재시작 하기

  • Agent 재시작 하기
    - Agent의 설정을 변경 하거나 문제가 발생했을 때 Agent를 재시작 합니다.

OS

Command

Linux

CentOs/Redhat

sudo systemctl restart datadog-agent

sudo restart datadog-agent

Ubuntu/Debian

sudo service datadog-agent restart

Windows

  • cmd에서 아래 command 실행
    "%ProgramFiles%\Datadog\Datadog Agent\bin\agent.exe" status

  • Datadog Agent Manager > Restart Agent

  • Windows Icon tray > Datadog Icon tray 마우스 우클릭 > restart

Kubernetes

kubectl delete pod <AGENT POD NAME>

(blue star) Flare 보내기

원인을 확인 하기 어려울 경우, Flare를 보내 주시기 바랍니다.

  • datadog.yaml 파일에서 agent의 log_level을 Info 에서 debug로 변경 해주시기 바랍니다.

플랫폼

경로

AIX

/etc/datadog-agent/datadog.yaml

Linux

/etc/datadog-agent/datadog.yaml

macOS

~/.datadog-agent/datadog.yaml

Windows

%ProgramData%\Datadog\datadog.yaml

###########################
## Logging Configuration ##
###########################

## @param log_level - string - optional - default: info
## @env DD_LOG_LEVEL - string - optional - default: info
## Minimum log level of the Datadog Agent.
## Valid log levels are: trace, debug, info, warn, error, critical, and off.
## Note: When using the 'off' log level, quotes are mandatory.
#
log_level: 'debug'
  • Agent를 재시작 합니다.

OS

Command

Linux

CentOs/Redhat

sudo systemctl restart datadog-agent

sudo restart datadog-agent

Ubuntu/Debian

sudo service datadog-agent restart

Windows

  • cmd에서 아래 command 실행
    "%ProgramFiles%\Datadog\Datadog Agent\bin\agent.exe" status

  • Datadog Agent Manager > Restart Agent

  • Windows Icon tray > Datadog Icon tray 마우스 우클릭 > restart

Kubernetes

kubectl delete pod <AGENT POD NAME>

  • Agent 재시작 5분~10분 뒤 Flare를 전송합니다.

플랫폼

명령어

Linux

sudo datadog-agent flare <CASE_ID>

Windows

  • cmd에서 아래 command 실행
    "%ProgramFiles%\Datadog\Datadog Agent\bin\agent.exe" flare <CASE_ID>

  • Datadog Agent Manager > Flare > Case ID 와 Email 입력 후 Submit

Kubernetes

kubectl exec -it <POD_NAME> -- agent flare <CASE_ID>

- Flare에 입력하는 티켓 번호는 Datadog의 티켓 번호를 입력해야합니다.
Flare를 보내기전 Support portal에 현상 및 문제점을 등록하시고 Ticket number를 회신 받으시기 바랍니다.
- Email 은 monitoring_admin@sk.com으로 입력 하시기 바랍니다.

  • Flare 전송이 완료 되면, log_level을 다시 info로 변경 후 Agent를 재시작 합니다.
    - Flare 전송이 되지 않은 경우, support portal 티켓에 생성된 flare 파일을 첨부해 주시면 됩니다.

이 답변이 유용합니까? 아니오

Send feedback
도움이 되어드리지 못해 죄송합니다. 아티클 개선을 위해 의견을 제공해 주시기 바랍니다.